引入NLTK-punkt工具包出现的问题
1.在使用自然语言工具包NLTK的时候,出现了这样一个问题:Resource puntk not found.Please use the NLTKDownloader to obtain the resource.2.根据提示,打开cmd窗口,用命令下载punkt.
出现错误信息:
[nltk_data] Error loading punkt: <urlopen error [Errno 11004]
[nltk_data] getaddrinfo failed>。
百度搜索后,决定尝试用nltk.download()命令进入下载界面进行下载,结果出现[error11004]:getaddrinfo.failed错误。
我又百度了一下,有人说将server index改成:http://nltk.org/nltk_data/即可解决。于是将Server Index改成:http://nltk.org/nltk_data/,并将下载路径修改(默认下载路径内存不足)。出现下载界面,选择【Models】模块,选择【punkt】,点击【download】,进入下载状态,一分钟以后报错了!
菜鸟懵逼!我会就此放弃吗?不会!继续百度。
方法:
1.下载nltk_data(.zip文件已经上传),并在环境变量中设置NLTK_DATA,其值为路径位置。2.运行项目:又报错了。还是提示找不到这个文件。
解决方法:将package文件夹里面的tokenizers文件夹放到错误提示的任意一个路径下。
3.运行项目。成功!