Como diz a Wikipedia, "O processamento de linguagem natural (NLP) é um subcampo da ciência da computação, engenharia da informação e inteligência artificial relacionado às interações entre computadores e linguagens humanas (naturais), em particular como programar computadores para processar e analisar grandes quantidades de dados de linguagem natural ". Em termos mais simples, é um processo no qual a linguagem natural gerada por humanos é compreendida por computadores.
### Desafios na PNL
#### 1\. fácil ou principalmente resolvido
```
*Spam detection
*Part of Speech Tagging
*Named Entity Recognition
```
#### 2\. Intermediário ou fazendo um bom progresso
```
*Sentiment analysis
*Coreference resolution
*Word sense disambiguation
*Parsing
*Machine Translation
*Information Translation
```
#### 3\. difícil ou ainda precisa de muito trabalho
```
*Text Summarization
*Machine dialog system
```
### Técnicas Comuns
```
*Structure extraction
*Identify and mark sentence, phrase, and paragraph boundaries