714 B
714 B
id, title, challengeType, videoId, bilibiliIds, dashedName
id | title | challengeType | videoId | bilibiliIds | dashedName | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
5e8f2f13c4cdbe86b5c72da3 | Навчання з підкріпленням за допомогою Q-Learning | 11 | Cf7DSU0gVb4 |
|
reinforcement-learning-with-q-learning |
--question--
--text--
Ключові компоненти навчання з підкріпленням...
--answers--
середовище, представництво, стан, реакція та винагорода.
середовище, агент, стан, дія та винагорода.
середовище, агент, стан, дія та покарання.
--video-solution--
2