Files
freeCodeCamp/curriculum/challenges/chinese/11-machine-learning-with-python/machine-learning-with-python-projects/linear-regression-health-costs-calculator.md
2022-10-21 23:34:50 +05:30

2.3 KiB

id, title, challengeType, forumTopicId, dashedName
id title challengeType forumTopicId dashedName
5e46f8edac417301a38fb930 线性回归健康成本计算器 10 462379 linear-regression-health-costs-calculator

--description--

你将使用 Google Colaboratory 来完成这个项目

进入该链接后,在你自己的账户或本地创建一个笔记本的副本。 一旦你完成项目并通过测试(包括在该链接),请在下面提交你的项目链接。 如果你提交的是 Google Colaboratory 的链接,请确保打开链接共享时选择 “anyone with the link”。

我们仍在开发机器学习课程的交互式课程部分。 现在,你可以通过这个认证中的视频挑战。 你可能还需要寻找额外的学习资源,类似于你在真实世界项目中的工作。

--instructions--

在这个挑战中,你将使用回归算法预测医疗费用。

你会得到一个数据集,其中包含不同人的信息,包括他们的医疗费用。 用数据来预测基于新数据的医疗费用。

此笔记本的前两个单元格导入库和数据。

确保将分类数据转换为数字。 将 80% 的数据用作 train_dataset,将 20% 的数据用作 test_dataset

使用 pop 从这些数据集中移出“费用”列中,来创建名为 train_labelstest_labels 的新数据集。 训练模型时使用这些标签。

创建一个模型并使用 train_dataset 对其进行训练。 运行本笔记本中的最后一个单元来检查你的模型。 最后一个单元格将使用看不见的 test_dataset 来检查模型的泛化程度。

要通过挑战,model.evaluate 必须返回低于 3500 的平均绝对误差。 这意味着它可以正确地预测医疗保健费用在 3500 美元以内。

最后一个单元格还将使用 test_dataset 预测费用并绘制结果图。

--hints--

它应该通过所有 Python 测试。


--solutions--

  # Python challenges don't need solutions,
  # because they would need to be tested against a full working project.
  # Please check our contributing guidelines to learn more.