nltk(natural language toolkit)是python的自然语言处理工具包
在环境中用 >>pip install nltk 之后,对于一些特定的包还需要进行下载才能调用。
例如以下报错:
LookupError: **********************************************************************
Resource [93mpunkt[0m not found.
Please use the NLTK Downloader to obtain the resource: [31m>>> import nltk >>> nltk.download('punkt') [0m For more information see: https://www.nltk.org/data.html Attempted to load [93mtokenizers/punkt/english.pickle[0m Searched in: - 'C:\\Users\\***/nltk_data'
- 'H:\\anaconda\\envs\\tensorflow\\nltk_data'
- 'H:\\anaconda\\envs\\tensorflow\\share\\nltk_data'
- 'H:\\anaconda\\envs\\tensorflow\\lib\\nltk_data'
- 'C:\\Users\\***\\AppData\\Roaming\\nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data' - '' **********************************************************************
我们可以在命令窗中运行python
>>>import nltk
>>>nltk.download()
会出现如下窗口:
在download Directory输入下载路径,并将其加入用户变量(命名为NLTK_DATA) 即可,在Collections、Corpora、Model、All Package中安装自己所需的包文件。
更多相关内容参考nltk官方说明文档:https://www.nltk.org/data.html