【发布时间】:2012-11-19 21:48:52
【问题描述】:
我正在寻找一个可以进行文本分析和提取实体的库。
实体的类型/分类并不重要,重要的是确定有价值的东西。在这种情况下,实体宇宙是无限的,它不受固定字典的限制。
似乎有几个网络服务可以做到这一点(NERD 让您比较这些网络服务的结果:http://nerd.eurecom.fr/documentation 这非常有用),但我正在寻找本地图书馆而不是远程图书馆托管服务。我更喜欢 Java 或 .NET,但如果它是一个好的库,我会学习它所用的任何语言。
关于类似主题的旧线程很少,我希望在该领域找到新的发展,和/或建立在较低级别 NLP 库之上的库:
- Entity Extraction/Recognition with free tools while feeding Lucene Index
- Lucene Entity Extraction
- How do I do Entity Extraction in Lucene
- https://stackoverflow.com/questions/tagged/named-entity-extraction
- https://stackoverflow.com/questions/tagged/named-entity-recognition
有谁知道一个做得不错的图书馆?
【问题讨论】:
标签: nlp semantics named-entity-recognition named-entity-extraction