506 B
506 B
id, title, challengeType, videoId, bilibiliIds, dashedName
id | title | challengeType | videoId | bilibiliIds | dashedName | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
5e8f2f13c4cdbe86b5c72da3 | 使用 Q-Learning 進行強化學習 | 11 | Cf7DSU0gVb4 |
|
reinforcement-learning-with-q-learning |
--question--
--text--
強化學習的關鍵組成部分是......
--answers--
環境、代表、狀態、反應和獎勵。
環境、代理、狀態、動作和獎勵。
環境、代理、狀態、動作和懲罰。
--video-solution--
2