【发布时间】:2015-06-03 00:13:56
【问题描述】:
我是一名语言学家,试图弄清楚如何使用 NLTK 以及如何在语料库中标记词性。
我正在尝试使用函数 pos_tag 并得到与另一张海报相同的错误消息:ascii codec can't decode byte...
查看此链接:NLTK 3 POS_TAG throws UnicodeDecodeError
我尝试了所有建议的解决方案,包括原始海报给出的解决方案,但没有一个成功。
这个问题还有其他可能的解决方案吗?
【问题讨论】:
-
欢迎堆栈溢出。 “我和这个人有同样的问题,我尝试了解决方案,但没有成功”并没有让我们继续下去。试着读一段简短的文字(几句话),然后带着文字、编码和错误信息回到这里。
-
附言。如果您遇到 unicode 错误,您最好忘记 python 2。Python 3 更适合处理多种编码。
-
PPS。您链接到的问题已过时:当前的 NLTK 版本(3.0.2) 与 python 3 兼容,您应该以这种方式使用它。