44 lines
		
	
	
		
			1.2 KiB
		
	
	
	
		
			Markdown
		
	
	
	
	
	
			
		
		
	
	
			44 lines
		
	
	
		
			1.2 KiB
		
	
	
	
		
			Markdown
		
	
	
	
	
	
| ---
 | |
| id: 5e9a093a74c4063ca6f7c15f
 | |
| title: 数据 清理重复项
 | |
| challengeType: 11
 | |
| videoId: kj7QqjXhH6A
 | |
| bilibiliIds:
 | |
|   aid: 675611672
 | |
|   bvid: BV1VU4y1A7tu
 | |
|   cid: 409019368
 | |
| dashedName: data-cleaning-duplicates
 | |
| ---
 | |
| 
 | |
| # --description--
 | |
| 
 | |
| *在视频中我们使用的编辑器工具是在 notebook.ai 这个平台,你也可以选择用其他的平台,比如说 Google Colab 也是一个不错的选择。*
 | |
| 
 | |
| 以下有更多的资料:
 | |
| 
 | |
| -   [在 GitHub 平台的 Notebooks](https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp)
 | |
| -   [如何使用 Google Colab 来打开 GitHub 上的 Notebooks](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
 | |
| 
 | |
| # --question--
 | |
| 
 | |
| ## --text--
 | |
| 
 | |
| Python 方法 `.duplicated()` 将针对你的 DataFrame 返回一个储存着布尔值的 Series。 `True` 是行的返回值:
 | |
| 
 | |
| ## --answers--
 | |
| 
 | |
| 包含一个重复值,并且它表示了在这一行这一重复值第一次出现。
 | |
| 
 | |
| ---
 | |
| 
 | |
| 包含一个重复值,并且它表示了在这一行这一重复值至少第二次出现。
 | |
| 
 | |
| ---
 | |
| 
 | |
| 包含一个重复值,并且它表示了在这一行这一重复值第一次或第二次出现。
 | |
| 
 | |
| ## --video-solution--
 | |
| 
 | |
| 2
 | |
| 
 |