【问题标题】:Entity Extraction Library [closed]实体提取库[关闭]
【发布时间】:2012-11-19 21:48:52
【问题描述】:

我正在寻找一个可以进行文本分析和提取实体的库。

实体的类型/分类并不重要,重要的是确定有价值的东西。在这种情况下,实体宇宙是无限的,它不受固定字典的限制。

似乎有几个网络服务可以做到这一点(NERD 让您比较这些网络服务的结果:http://nerd.eurecom.fr/documentation 这非常有用),但我正在寻找本地图书馆而不是远程图书馆托管服务。我更喜欢 Java 或 .NET,但如果它是一个好的库,我会学习它所用的任何语言。

关于类似主题的旧线程很少,我希望在该领域找到新的发展,和/或建立在较低级别 NLP 库之上的库:

有谁知道一个做得不错的图书馆?

【问题讨论】:

    标签: nlp semantics named-entity-recognition named-entity-extraction


    【解决方案1】:

    我研究过但从未使用过以下托管实体识别服务:

    OpenCalais

    炼金术API

    【讨论】:

    • 更新了问题以强调我正在寻找本地图书馆而不是远程托管服务。
    【解决方案2】:

    如果您对 Perl 感到满意,可以使用多种语言标记器/词性标记器(想到 Lingua::TreeTaggerLingua::BrillTagger(通过 Google)。

    【讨论】:

      【解决方案3】:

      您可以使用 NLTK 和 Python。有关使用 NLTK 进行 NER 的示例,请参阅 this question

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2013-07-20
        • 2010-09-16
        • 1970-01-01
        • 1970-01-01
        • 2010-12-24
        • 1970-01-01
        相关资源
        最近更新 更多