【发布时间】:2018-08-01 11:21:43
【问题描述】:
是否有任何 NLP python 库可以拆分句子或将单词连接成相关的单词对?例如:
that is not bad example -> "That" "is" "not bad" "example"
“不错”与“好”的含义相同,因此在机器学习中将其处理为“不”和“坏”是没有用的。 我什至不知道如何称呼这些相关的词对。 (术语提取?阶段提取?) 或者用名词拆分成形容词会更好,例如:
关于减税的不诚实媒体 -> “不诚实媒体”、“相关”、“关于”、“减税”
我找到了topia.termextract,但它不适用于python3。
【问题讨论】:
-
nltk.org/book/ch07.html 第 2.1 部分
-
结帐 spacy。 spacy.io/usage/linguistic-features#section-tokenization我不知道为什么人们投票反对。
-
它在文档中的哪里说如何做到这一点?我看不到它
-
参见“基于规则的匹配”中关于
PhraseMatcher()的部分。它是一个高度可定制的框架,允许使用引理规则、正则表达式等。但不是开箱即用的解决方案。反正。干杯 -
“不错”与“好”不一样……实际上它不如好,但高于坏。
标签: python nlp nltk sentiment-analysis text-extraction