637 B
637 B
id, title, challengeType, videoId, dashedName
id | title | challengeType | videoId | dashedName |
---|---|---|---|---|
5e8f2f13c4cdbe86b5c72da4 | Apprendimento per rinforzo con Q-Learning: Parte 2 | 11 | DX7hJuaUZ7o | reinforcement-learning-with-q-learning-part-2 |
--question--
--text--
Cosa può accadere se l'agente non ha un buon equilibrio tra l'intraprendere azioni casuali e l'utilizzare azioni apprese?
--answers--
L'agente cercherà sempre di minimizzare la sua ricompensa per lo stato o l'azione corrente, portando a minimi locali.
L'agente cercherà sempre di massimizzare la sua ricompensa per lo stato o l'azione corrente, portando a massimi locali.
--video-solution--
2