【问题标题】:Extracting sentenses belongs to different category from text using NLTK使用 NLTK 从文本中提取句子属于不同类别
【发布时间】:2018-07-15 16:20:45
【问题描述】:
我是自然语言处理 (NLP) 的新手,遇到了一个问题,我必须从给定的文本中提取属于不同类别的句子,例如
1) 与承诺相关的句子(如“will”、“shall”等句子)
2) 与成本或预算相关的句子
3) 等等....
我需要知道我应该使用 NLTK 的哪些功能来实现这一点。添加越来越多的类别以提取更多主观信息有多容易?
任何示例都更有帮助。
【问题讨论】:
标签:
python
machine-learning
nlp
nltk
text-mining
【解决方案1】:
您正在寻找文本分类,而 NLTK 本身是不够的。 NLTK 可以进行标记化、词干提取、字数统计等,但不能进行分类。
Python 中的另一个库是 Spacy,它将执行上述操作,并允许您训练和使用文本分类器来识别属于某个类别的句子。建议您在以下位置浏览用例:Spacy Usage Examples
为了识别带有承诺的句子,你可以做一个句子依存解析并寻找“will”、“shall”作为动词。