mirror of https://github.com/freeCodeCamp/freeCodeCamp.git synced 2026-05-26 22:01:30 -04:00

Files

camperbot 214f87fb6c chore(i18n,learn): processed translations (#48620 )

2022-11-28 17:00:52 +01:00

id, title, challengeType, videoId, bilibiliIds, dashedName

title

challengeType

videoId

bilibiliIds

dashedName

5e8f2f13c4cdbe86b5c72da4

Посилене навчання за допомогою Q-Learning: частина 2

DX7hJuaUZ7o

aid	bvid	cid
420570359	BV1G341127zr	409139190

reinforcement-learning-with-q-learning-part-2

--question--

--text--

Що може статися, якщо агент не має необхідного балансу між прийняттям випадкових дій та реалізацією попередньо вивчених дій?

Агент завжди намагатиметься мінімізувати винагороду за поточний стан/дію, призводячи до локального мінімуму.

Агент завжди намагатиметься максимізувати винагороду за поточний стан/дію, призводячи до локального максимуму.