1、NLTK的概念

NLTK:Natural language toolkit,是一套基于python的自然语言处理工具。

2、NLTK中集成了语料与模型等的包管理器,通过在python编辑器中执行。

import nltk

nltk.download()

便会弹出下面的包管理界面,在管理器中可以下载语料,预训练的模型等。

python笔记10-----便捷网络数据NLTK语料库

比如下载完语料库(比方说是gutenberg语料库),可以通过以下加载:

python笔记10-----便捷网络数据NLTK语料库

fileids()函数可以查看gutenberg中收录的图书,words函数可以方便地得到某本书中文字

 

相关文章:

  • 2022-12-23
  • 2022-02-02
  • 2022-12-23
  • 2021-12-05
  • 2021-11-29
  • 2021-10-27
  • 2021-09-23
  • 2022-12-23
猜你喜欢
  • 2021-12-30
  • 2021-06-05
  • 2021-10-14
  • 2021-08-17
  • 2021-07-28
  • 2021-10-30
  • 2021-11-29
相关资源
相似解决方案