mirror of
https://github.com/freeCodeCamp/freeCodeCamp.git
synced 2026-02-25 23:01:26 -05:00
44 lines
1.3 KiB
Markdown
44 lines
1.3 KiB
Markdown
---
|
|
id: 5e9a093a74c4063ca6f7c15f
|
|
title: 数据 清理重复项
|
|
challengeType: 11
|
|
videoId: kj7QqjXhH6A
|
|
bilibiliIds:
|
|
aid: 675611672
|
|
bvid: BV1VU4y1A7tu
|
|
cid: 409019368
|
|
dashedName: data-cleaning-duplicates
|
|
---
|
|
|
|
# --description--
|
|
|
|
*在视频中我们使用的编辑器工具是在 notebook.ai 这个平台,你也可以选择用其他的平台,比如说 Google Colab 也是一个不错的选择。*
|
|
|
|
以下有更多的资料:
|
|
|
|
- <a href="https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp" target="_blank" rel="noopener noreferrer nofollow">在 GitHub 平台的 Notebooks</a>
|
|
- <a href="https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb" target="_blank" rel="noopener noreferrer nofollow">如何使用 Google Colab 来打开 GitHub 上的 Notebooks</a>
|
|
|
|
# --question--
|
|
|
|
## --text--
|
|
|
|
Python 方法 `.duplicated()` 将针对你的 DataFrame 返回一个储存着布尔值的 Series。 `True` 是行的返回值:
|
|
|
|
## --answers--
|
|
|
|
包含一个重复值,并且它表示了在这一行这一重复值第一次出现。
|
|
|
|
---
|
|
|
|
包含一个重复值,并且它表示了在这一行这一重复值至少第二次出现。
|
|
|
|
---
|
|
|
|
包含一个重复值,并且它表示了在这一行这一重复值第一次或第二次出现。
|
|
|
|
## --video-solution--
|
|
|
|
2
|
|
|