Files
freeCodeCamp/curriculum/challenges/ukrainian/11-machine-learning-with-python/tensorflow/reinforcement-learning-with-q-learning-part-2.md
2022-11-28 17:00:52 +01:00

1018 B

id, title, challengeType, videoId, bilibiliIds, dashedName
id title challengeType videoId bilibiliIds dashedName
5e8f2f13c4cdbe86b5c72da4 Посилене навчання за допомогою Q-Learning: частина 2 11 DX7hJuaUZ7o
aid bvid cid
420570359 BV1G341127zr 409139190
reinforcement-learning-with-q-learning-part-2

--question--

--text--

Що може статися, якщо агент не має необхідного балансу між прийняттям випадкових дій та реалізацією попередньо вивчених дій?

--answers--

Агент завжди намагатиметься мінімізувати винагороду за поточний стан/дію, призводячи до локального мінімуму.


Агент завжди намагатиметься максимізувати винагороду за поточний стан/дію, призводячи до локального максимуму.

--video-solution--

2