【发布时间】:2011-11-09 10:05:53
【问题描述】:
我正在尝试从句子中提取三元组主语、谓语和宾语。 我需要更多关于如何做到这一点的参考资料。
【问题讨论】:
标签: nlp
我正在尝试从句子中提取三元组主语、谓语和宾语。 我需要更多关于如何做到这一点的参考资料。
【问题讨论】:
标签: nlp
执行此操作的最基本方法是进行浅层解析,然后提取名词-动词-名词三元组。这应该适用于所有 SVO(主语-动词-宾语)语言,如英语。可能需要进行一些调整以仅从句子中提取第一个三元组,或者在昏迷的情况下不提取。这是一个非常快速的解决方案,因为浅 POS 标记通常是 O(n) - 每句 0.01 秒,而不是深度解析(Open NLP,Stanford Parser),后者是 O(n^3) - 每句 0.4 秒。
【讨论】:
您可以使用Stanford parser API 或Open NLP 进行词性标注和其他一些 NLP 操作
对于三元组提取,您可以实现互联网上可用论文中的一种技术,我知道一种可以实现的好方法:http://ailab.ijs.si/delia_rusu/Papers/is_2007.pdf
【讨论】:
我正在解决类似的问题,我正在使用 Visual Basic。 首先:我有一个主题/名词列表 其次:当我提取谓词时,我提取短语之间...
(一只猫)(坐在)(垫子)
通过使用名词和名词短语构建主题列表,它们的位置可以替换为(学习模式) 然后,如果未检测到主题,则可能先前已检测到学习的谓词。
也许这类似于雪球算法。
【讨论】: