【发布时间】:2016-11-08 05:03:50
【问题描述】:
嗯,我的目标是从文本中提取 NE(人称)和与之相关的动词。例如,我有这样的文字:
邓布利多转身走回街上。哈利波特在毯子里翻了个身,没有醒来。
作为一个理想的结果我应该得到
邓布利多转身走了;哈利波特翻滚
我使用斯坦福 NER 来查找和标记人员,然后删除所有不包含 NE 的句子。所以,最后我有一个“纯”文本,它只包含带有字符名称的句子。 之后我使用斯坦福依赖项。结果我得到了这样的东西(CONLLU输出格式):
1 Dumbledore _ _ NN _ 2 nsubj _ _
2 turned _ _ VBD _ 0 root _ _
3 and _ _ CC _ 2 cc _ _
4 walked _ _ VBD _ 2 conj _ _
5 back _ _ RB _ 4 advmod _ _
6 down _ _ IN _ 8 case _ _
7 the _ _ DT _ 8 det _ _
8 street _ _ NN _ 4 nmod _ _
9 . _ _ . _ 2 punct _ _
1 Harry _ _ NNP _ 2 compound _ _
2 Potter _ _ NNP _ 3 nsubj _ _
3 rolled _ _ VBD _ 0 root _ _
4 over _ _ IN _ 3 compound:prt _ _
5 inside _ _ IN _ 7 case _ _
6 his _ _ PRP$ _ 7 nmod:poss _ _
7 blankets _ _ NNS _ 3 nmod _ _
8 without _ _ IN _ 9 mark _ _
9 waking _ _ VBG _ 3 advcl _ _
10 up _ _ RP _ 9 compound:prt _ _
11 . _ _ . _ 3 punct _ _
这就是我所有问题的开始。我知道人和动词,但是我不知道如何从这种格式中提取它。 我想,我可以这样做:在表中找到 NN/NNP,找到它的“父”,然后提取它的所有“子”字。理论上它应该工作。理论上。
问题是,是否有人能想出任何其他想法,如何从文本中获取一个人及其行为?或者有没有更合理的方法?
如果有任何帮助,我将不胜感激!
【问题讨论】:
标签: java nlp stanford-nlp