NLTK是python上著名的自然语言处理库,自带语料库、词性分类库、自带分类、分词等等功能。

安装语料库import nlk  

nlk.download()

数据挖掘之自然语言处理

文本处理流程

数据挖掘之自然语言处理

最后从文本转换为一组数字,这些数字就隐含了文本的意义。

stopwords:对于注重理解文本意思的应用场景来说歧义太多,所以要去掉。

数据挖掘之自然语言处理

NLTK在NLP上的经典应用有情感分析、文本相似度、文本分类。

 

 

 

相关文章:

  • 2021-12-20
  • 2021-04-20
  • 2021-11-29
  • 2021-11-20
  • 2021-11-04
  • 2021-10-06
  • 2021-04-10
猜你喜欢
  • 2021-05-17
  • 2021-12-04
  • 2021-12-03
  • 2021-06-21
  • 2021-12-16
  • 2021-11-23
  • 2021-10-15
相关资源
相似解决方案