【问题标题】:Extract triplet subject, predicate, and object sentence提取三元组主、谓、宾句
【发布时间】:2011-11-09 10:05:53
【问题描述】:

我正在尝试从句子中提取三元组主语、谓语和宾语。 我需要更多关于如何做到这一点的参考资料。

【问题讨论】:

    标签: nlp


    【解决方案1】:

    执行此操作的最基本方法是进行浅层解析,然后提取名词-动词-名词三元组。这应该适用于所有 SVO(主语-动词-宾语)语言,如英语。可能需要进行一些调整以仅从句子中提取第一个三元组,或者在昏迷的情况下不提取。这是一个非常快速的解决方案,因为浅 POS 标记通常是 O(n) - 每句 0.01 秒,而不是深度解析(Open NLP,Stanford Parser),后者是 O(n^3) - 每句 0.4 秒。

    【讨论】:

    • 我应该使用什么工具来执行这种浅解析?你能解释一下这个名词三元组吗?如何从句子中提取名词三元组?仅使用 POS 标签就够了吗?
    • 不是“名词三元组”而是“名词-动词-名词”三元组。由于许多语言都是 SVO(主语-动词-宾语)提取这些部分 POS 块意味着您提取谓词。
    • 我按照你的建议做了,我的问题解决了。非常感谢。
    【解决方案2】:

    您可以使用Stanford parser APIOpen NLP 进行词性标注和其他一些 NLP 操作

    对于三元组提取,您可以实现互联网上可用论文中的一种技术,我知道一种可以实现的好方法:http://ailab.ijs.si/delia_rusu/Papers/is_2007.pdf

    【讨论】:

    • 实际上我已经阅读了上面的论文并尝试实施,但我陷入了 EXTRACT-ATTRIBUTES。我试图从句子“我去睡觉”中提取三连音。我得到谓词“去”,而我期待“去睡觉”。在论文中,如果词的类型是动词,那么属性都是 ADVP 兄弟。同时“睡觉”的标签是PP。你有没有实施过它们?如果是,您介意分享吗?
    • 你试过 OpenNLP 中的 Parser 那么你应该去睡觉了。
    • @Ruthwik 自 2011 年(这个答案的日期)以来已经有了很多新的进步,我建议你看看艺术系统在(知识库人口)等任务中的现状,或者如果你想要现成的软件我会想到Stanford OpenIE系统或OLLIE
    • 请不要只发布一些工具或库作为答案。至少在答案本身中展示how it solves the problem
    【解决方案3】:

    我正在解决类似的问题,我正在使用 Visual Basic。 首先:我有一个主题/名词列表 其次:当我提取谓词时,我提取短语之间...

    (一只猫)(坐在)(垫子)

    通过使用名词和名词短语构建主题列表,它们的位置可以替换为(学习模式) 然后,如果未检测到主题,则可能先前已检测到学习的谓词。

    也许这类似于雪球算法。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-01-31
      • 2011-11-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多