---
id: 5e8f2f13c4cdbe86b5c72da4
title: '使用 Q-Learning 进行强化学习：第 2 部分'
challengeType: 11
videoId: DX7hJuaUZ7o
bilibiliIds:
  aid: 420570359
  bvid: BV1G341127zr
  cid: 409139190
dashedName: reinforcement-learning-with-q-learning-part-2
---

# --question--

## --text--

如果智能体在采取随机动作和使用学习动作之间没有很好的平衡，会发生什么？

## --answers--

智能体将始终尝试将其对当前状态/动作的奖励最小化，从而导致局部最小值。

---

智能体将始终尝试将其对当前状态/动作的奖励最大化，从而导致局部最大值。

## --video-solution--

2