【问题标题】:NLP - subject of sentence [closed]NLP - 句子的主题[关闭]
【发布时间】:2012-10-03 17:17:49
【问题描述】:

我正在尝试获取句子的主要主题,即句子在谈论什么(而不是可能不同的语法主题)。

到现在为止

1.) Java 中的 OpenNLP,它为我提供了句子检测、POS 标记、解析、标记器和名称查找器。

2.) MatlParser,stanford Parser - 可以通过依存解析给出简单句子的语法主语。

我认为名词或名词短语在更一般的意义上总是主语,但一个句子可以有很多名词和名词短语。 任何帮助将不胜感激。

【问题讨论】:

    标签: text nlp text-mining stanford-nlp opennlp


    【解决方案1】:

    正如您正确指出的那样,语法是不够的。必须使用某种形式的浅语义分析来识别您所谓的“主题”。我相信它在 SRL(语义角色标签)的上下文中更常被称为代理。有开源工具(例如UIUC SRL parser)来执行语义角色标签,至少对于英语来说,但它们通常在单独的谓词上工作,其中一个句子中可能有几个,所以必须以某种方式找出哪个“主题" 是“主要”的。

    我认为后一个概念的定义并不明确,事实上,在一个复杂的句子中,可能不清楚哪个主语是“主要”主语。对于特定类型的句子,它可能更有意义,但不是一般的。我认为如果你描述你正在使用的数据和/或给出一些例子会有所帮助。

    附:你可以考虑在https://linguistics.stackexchange.com/上问这个问题

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-10-23
      • 2011-09-20
      • 2017-05-25
      • 1970-01-01
      • 2020-11-06
      • 1970-01-01
      • 2021-04-18
      相关资源
      最近更新 更多