mirror of
https://github.com/freeCodeCamp/freeCodeCamp.git
synced 2026-05-26 22:01:30 -04:00
1018 B
1018 B
id, title, challengeType, videoId, bilibiliIds, dashedName
| id | title | challengeType | videoId | bilibiliIds | dashedName | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| 5e8f2f13c4cdbe86b5c72da4 | Посилене навчання за допомогою Q-Learning: частина 2 | 11 | DX7hJuaUZ7o |
|
reinforcement-learning-with-q-learning-part-2 |
--question--
--text--
Що може статися, якщо агент не має необхідного балансу між прийняттям випадкових дій та реалізацією попередньо вивчених дій?
--answers--
Агент завжди намагатиметься мінімізувати винагороду за поточний стан/дію, призводячи до локального мінімуму.
Агент завжди намагатиметься максимізувати винагороду за поточний стан/дію, призводячи до локального максимуму.
--video-solution--
2