【问题标题】:Frameworks for semantic annotation for user defined domain model用户定义域模型的语义标注框架
【发布时间】:2011-11-08 16:57:21
【问题描述】:

我有一些文档和一些概念的本体。是否有任何框架可以自动从给定文档中提取这些概念并创建三元组?本体必须包含特殊属性?

我找到了 UIMA,但据我对 UIMA 的了解,我只能做这样的事情:

  • 创建一些与本体保持关联的字典
  • 将此字典与 ConceptMapper 结合使用
  • 编写一个创建三元组并将它们持久化的 CAS 消费者 -

我不喜欢这种方法,因为我必须使本体和字典中的概念保持同步。

可以以不同的方式使用 UIMA,或者是否有任何高级框架可以直接使用我的本体,例如一些自定义属性作为输入并基于它对文档进行注释?

我想使用本体作为领域模型,因为我想进一步创建知识库,并且本体似乎比例如关系模型更灵活。 谢谢。

【问题讨论】:

    标签: annotations information-extraction semantic-analysis


    【解决方案1】:

    花了更多时间在 Google 上搜索后,我找到了GATE,更具体地说是OntoRoot GazetterLarge KB Gazetteer

    OntoRoot 地名词典是一种动态创建的地名词典,它与少数其他通用 GATE 资源相结合,能够针对给定本体在给定内容上生成基于本体的注释。该地名词典是作为 TAO 项目的一部分开发的“Gazetteer_Ontology_Based”插件的一部分。

    我没有测试它们,但这些似乎是解决我问题的好方法。

    【讨论】:

      猜你喜欢
      • 2020-08-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-07-02
      • 2018-08-19
      • 2017-08-19
      相关资源
      最近更新 更多