44 lines
1.1 KiB
Markdown
44 lines
1.1 KiB
Markdown
---
|
|
id: 5e9a093a74c4063ca6f7c15f
|
|
title: Limpar dados duplicados
|
|
challengeType: 11
|
|
videoId: kj7QqjXhH6A
|
|
bilibiliIds:
|
|
aid: 675611672
|
|
bvid: BV1VU4y1A7tu
|
|
cid: 409019368
|
|
dashedName: data-cleaning-duplicates
|
|
---
|
|
|
|
# --description--
|
|
|
|
*Ao invés de usar notebooks.ai como foi mostrado no vídeo, você pode usar o Google Colab como substituto.*
|
|
|
|
Mais recursos:
|
|
|
|
- [Notebooks no GitHub](https://github.com/ine-rmotr-curriculum/data-cleaning-rmotr-freecodecamp)
|
|
- [Como abrir notebooks do GitHub usando o Google Colab.](https://colab.research.google.com/github/googlecolab/colabtools/blob/master/notebooks/colab-github-demo.ipynb)
|
|
|
|
# --question--
|
|
|
|
## --text--
|
|
|
|
O método `.duplicated()` do Python retorna uma série booleana para o seu DataFrame. `True` é o valor de retorno para as linhas que:
|
|
|
|
## --answers--
|
|
|
|
contém uma duplicata, onde o valor para a linha contém a primeira ocorrência desse valor.
|
|
|
|
---
|
|
|
|
contém uma duplicata, onde o valor para a linha é, ao menos, a segunda ocorrência desse valor.
|
|
|
|
---
|
|
|
|
contém uma duplicata, onde o valor para a linha contém a primeira ou a segunda ocorrência.
|
|
|
|
## --video-solution--
|
|
|
|
2
|
|
|