2020-08-13 12:00:20 +02:00
|
|
|
---
|
|
|
|
id: 5e9a093a74c4063ca6f7c15f
|
2021-07-15 13:04:11 +05:30
|
|
|
title: 数据 清理重复项
|
2020-08-13 12:00:20 +02:00
|
|
|
challengeType: 11
|
|
|
|
videoId: kj7QqjXhH6A
|
2021-10-03 12:24:27 -07:00
|
|
|
bilibiliIds:
|
|
|
|
aid: 675611672
|
|
|
|
bvid: BV1VU4y1A7tu
|
|
|
|
cid: 409019368
|
2021-01-13 03:31:00 +01:00
|
|
|
dashedName: data-cleaning-duplicates
|
2020-08-13 12:00:20 +02:00
|
|
|
---
|
|
|
|
|
2020-12-16 00:37:30 -07:00
|
|
|
# --description--
|
2020-08-13 12:00:20 +02:00
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
*在视频中我们使用的编辑器工具是在 notebook.ai 这个平台,你也可以选择用其他的平台,比如说 Google Colab 也是一个不错的选择。*
|
2021-02-06 04:42:36 +00:00
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
以下有更多的资料:
|
2020-08-13 12:00:20 +02:00
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
- [在 GitHub 平台的 Notebooks](https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp)
|
|
|
|
- [如何使用 Google Colab 来打开 GitHub 上的 Notebooks](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
|
2020-08-13 12:00:20 +02:00
|
|
|
|
2020-12-16 00:37:30 -07:00
|
|
|
# --question--
|
2020-08-13 12:00:20 +02:00
|
|
|
|
2020-12-16 00:37:30 -07:00
|
|
|
## --text--
|
2020-08-13 12:00:20 +02:00
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
Python 方法 `.duplicated()` 将针对你的 DataFrame 返回一个储存着布尔值的 Series。 `True` 是行的返回值:
|
2020-12-16 00:37:30 -07:00
|
|
|
|
|
|
|
## --answers--
|
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
包含一个重复值,并且它表示了在这一行这一重复值第一次出现。
|
2020-12-16 00:37:30 -07:00
|
|
|
|
|
|
|
---
|
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
包含一个重复值,并且它表示了在这一行这一重复值至少第二次出现。
|
2020-12-16 00:37:30 -07:00
|
|
|
|
|
|
|
---
|
|
|
|
|
2021-07-15 13:04:11 +05:30
|
|
|
包含一个重复值,并且它表示了在这一行这一重复值第一次或第二次出现。
|
2020-12-16 00:37:30 -07:00
|
|
|
|
|
|
|
## --video-solution--
|
|
|
|
|
|
|
|
2
|
|
|
|
|