【发布时间】:2011-11-08 16:57:21
【问题描述】:
我有一些文档和一些概念的本体。是否有任何框架可以自动从给定文档中提取这些概念并创建三元组?本体必须包含特殊属性?
我找到了 UIMA,但据我对 UIMA 的了解,我只能做这样的事情:
- 创建一些与本体保持关联的字典
- 将此字典与 ConceptMapper 结合使用
- 编写一个创建三元组并将它们持久化的 CAS 消费者 -
我不喜欢这种方法,因为我必须使本体和字典中的概念保持同步。
可以以不同的方式使用 UIMA,或者是否有任何高级框架可以直接使用我的本体,例如一些自定义属性作为输入并基于它对文档进行注释?
我想使用本体作为领域模型,因为我想进一步创建知识库,并且本体似乎比例如关系模型更灵活。 谢谢。
【问题讨论】:
标签: annotations information-extraction semantic-analysis