【问题标题】:How to avoid sequential processing in NLP?如何避免 NLP 中的顺序处理?
【发布时间】:2012-10-16 05:41:08
【问题描述】:

NLP 中的一般方法是一个流程链,如下所示:

  1. 标记化
  2. 形态分析
  3. 词性标记
  4. 句法分析、命名实体识别、名词短语分块等
  5. 分类(或程序的任何“最终目标”)

我总是觉得奇怪的是,每一步都在没有“咨询”后一步的情况下做出决定。例如,您可以将一个词 POS 标记为名词,即使它使任何句法分析都无法在处理过程中进行。

我想知道是否有一些方法可以解决这个一般 NLP 问题,这些方法考虑了后验步骤。一种信仰传播,如果你愿意的话。

【问题讨论】:

    标签: nlp


    【解决方案1】:

    您可能想看看 Hollingshead 和 Roark 的“Pipeline Iteration” (http://acl.ldc.upenn.edu/P/P07/P07-1120.pdf),以及 Kristy Hollingshead 在管道方面的后续工作以及流水线阶段之间的通信。

    【讨论】:

      【解决方案2】:

      您所描述的管道通常是构建了多少个应用程序,但它不是唯一可能的架构。一些方法涉及多次通过管道,其中来自一个阶段的信息在下一个阶段使用。其他工作结合了您列出的一些步骤,例如形态分析和 PoS 标记。我最近阅读了一篇名为“A Hierarchical Dirichlet Process Model for Joint POS and Morphology Induction”的论文,其中 PoS 标签和形态学是一起诱导的,因为它们是相互依赖的。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2013-11-16
        • 2015-05-20
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2015-10-02
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多