4.9 KiB
id, title, challengeType, forumTopicId, dashedName
| id | title | challengeType | forumTopicId | dashedName |
|---|---|---|---|---|
| 5e46f8e3ac417301a38fb92f | Механізм книжкових рекомендацій з використанням KNN | 10 | 462378 | book-recommendation-engine-using-knn |
--description--
Ви будете працювати над цим проєктом з Google Colaboratory.
Перейшовши за цим посиланням, створіть копію блокнота у своєму обліковому записі або локально. Як тільки ви завершили проєкт та пройшли тест (доданий до посилання), введіть посилання на свій проєкт. Якщо ви надаєте посилання на Google Colaboratory, переконайтеся, що ви увімкнули режим доступу для «усіх, хто має це посилання».
Ми досі розробляємо інтерактивну складову для навчальної програми з машинного навчання. Поки ви можете переглянути відеозавдання цієї сертифікації. Вам також можуть знадобитися додаткові навчальні ресурси, так само як під час роботи із повноцінним проєктом.
--instructions--
У цьому завданні ви створите алгоритм книжкових рекомендацій, використовуючи метод k-найближчих сусідів.
Ви будете використовувати набір даних Book-Crossings. Цей набір даних містить 1,1 млн рейтингів (за шкалою 1-10) 270 000 книжок від 90 000 користувачів.
Після імпортування та очищення даних використайте NearestNeighbors з sklearn.neighbors, щоб розробити модель, яка показує книжки, схожі на подану книжку. Алгоритм найближчих сусідів вимірює відстань, щоб визначити «близькість» екземплярів.
Створіть функцію під назвою get_recommends, яка приймає назву книжки (з набору даних) як аргумент та повертає список із 5 подібних книжок з відстанями до аргументу книжки.
Цей код:
get_recommends("The Queen of the Damned (Vampire Chronicles (Paperback))")
має повернути:
[
'The Queen of the Damned (Vampire Chronicles (Paperback))',
[
['Catch 22', 0.793983519077301],
['The Witching Hour (Lives of the Mayfair Witches)', 0.7448656558990479],
['Interview with the Vampire', 0.7345068454742432],
['The Tale of the Body Thief (Vampire Chronicles (Paperback))', 0.5376338362693787],
['The Vampire Lestat (Vampire Chronicles, Book II)', 0.5178412199020386]
]
]
Зверніть увагу, що дані, які повертає get_recommends(), є списком. Першим елементом у списку є назва книжки, передана у функцію. Другим елементом списку є список із ще п’яти списків. Кожен з п’яти списків містить рекомендовану книжку та відстань від рекомендованої книжки до книжки, переданої до функції.
Якщо ви побудуєте графік набору даних (необов’язково), ви помітите, що більшість книжок оцінюється рідко. Щоб забезпечити статистичну значущість, видаліть із набору даних користувачів з менш ніж 200 оцінками та книжки з менш ніж 100 оцінками.
Перші три клітинки імпортують бібліотеки, які вам можуть знадобитися, та дані для використання. Кінцева клітинка — для тестування. Напишіть весь свій код між цими клітинками.
--hints--
Проєкт повинен пройти усі тести Python.
--solutions--
# Python challenges don't need solutions,
# because they would need to be tested against a full working project.
# Please check our contributing guidelines to learn more.