Files
freeCodeCamp/curriculum/challenges/chinese/11-machine-learning-with-python/tensorflow/reinforcement-learning-with-q-learning-part-2.md

31 lines
657 B
Markdown
Raw Permalink Normal View History

---
id: 5e8f2f13c4cdbe86b5c72da4
title: '使用 Q-Learning 进行强化学习:第 2 部分'
challengeType: 11
videoId: DX7hJuaUZ7o
bilibiliIds:
aid: 420570359
bvid: BV1G341127zr
cid: 409139190
dashedName: reinforcement-learning-with-q-learning-part-2
---
# --question--
## --text--
如果智能体在采取随机动作和使用学习动作之间没有很好的平衡,会发生什么?
## --answers--
智能体将始终尝试将其对当前状态/动作的奖励最小化,从而导致局部最小值。
---
智能体将始终尝试将其对当前状态/动作的奖励最大化,从而导致局部最大值。
## --video-solution--
2