--- id: 5e8f2f13c4cdbe86b5c72da4 title: '使用 Q-Learning 进行强化学习:第 2 部分' challengeType: 11 videoId: DX7hJuaUZ7o bilibiliIds: aid: 420570359 bvid: BV1G341127zr cid: 409139190 dashedName: reinforcement-learning-with-q-learning-part-2 --- # --question-- ## --text-- 如果智能体在采取随机动作和使用学习动作之间没有很好的平衡,会发生什么? ## --answers-- 智能体将始终尝试将其对当前状态/动作的奖励最小化,从而导致局部最小值。 --- 智能体将始终尝试将其对当前状态/动作的奖励最大化,从而导致局部最大值。 ## --video-solution-- 2