3.9 KiB
id, title, challengeType, forumTopicId, dashedName
| id | title | challengeType | forumTopicId | dashedName |
|---|---|---|---|---|
| 5e46f8edac417301a38fb930 | Калькулятор лінійної регресії витрат на здоров’я | 10 | 462379 | linear-regression-health-costs-calculator |
--description--
Ви будете працювати над цим проєктом з Google Colaboratory.
Перейшовши за цим посиланням, створіть копію блокнота у своєму обліковому записі або локально. Як тільки ви завершили проєкт та пройшли тест (доданий до посилання), введіть посилання на свій проєкт. Якщо ви надаєте посилання на Google Colaboratory, переконайтеся, що ви увімкнули режим доступу для «усіх, хто має це посилання».
Ми досі розробляємо інтерактивну складову для навчальної програми з машинного навчання. Поки ви можете переглянути відеозавдання цієї сертифікації. Вам також можуть знадобитися додаткові навчальні ресурси, так само як під час роботи із повноцінним проєктом.
--instructions--
У цьому завданні ви передбачите витрати на здоров’я, використовуючи алгоритм регресії.
Ви отримаєте набір даних, що містять інформацію про різних людей, враховуючи їхні витрати на здоров’я. Використайте дані для прогнозування витрат на здоров’я на основі нових даних.
Перші дві клітинки цього блокнота імпортують бібліотеки та дані.
Не забудьте перетворити дані категорій на числа. Використайте 80% даних як train_dataset та 20% даних як test_dataset.
pop (скоротіть) стовпчик «expenses» (витрати) з цих наборів даних, щоб створити нові набори даних під назвою train_labels та test_labels. Використайте ці мітки під час навчання моделі.
Створіть модель та навчіть її за допомогою train_dataset. Запустіть останню клітинку в цьому блокноті, щоб перевірити свою модель. Остання клітинка використовуватиме невидимий test_dataset, щоб перевірити, наскільки добре модель узагальнює.
Щоб пройти завдання, model.evaluate повинна повернути середню абсолютну помилку менше ніж 3500. Це означає, що вона правильно прогнозує витрати на здоров’я в межах 3500 доларів.
Остання клітинка також передбачить витрати за допомогою test_dataset та побудує графік з результатами.
--hints--
Проєкт повинен пройти усі тести Python.
--solutions--
# Python challenges don't need solutions,
# because they would need to be tested against a full working project.
# Please check our contributing guidelines to learn more.