【问题标题】:How can i add custom annotations to default ANNIE gazetteer?如何将自定义注释添加到默认的 ANNIE 地名词典?
【发布时间】:2014-03-09 19:35:41
【问题描述】:

我正在使用 GATE *SDK* 并希望将 默认 ANNIE Gazetteer 修改为包括一个基于我创建的新列表定义的简单注释。

  • 我已将列表定义添加到 GATE-HOME\plugins\ANNIE\resources\gazetteer
  • 我在 lists.def 文件中添加了一个条目以指向我的新列表文件。例如。 *open_source_software:opensouce*
  • 我创建了一个注释模式并添加到 GATE-HOME\plugins\ANNIE\resources\schema
  • 当我加载 ANNIE 并运行应用程序时,它不会自动识别注释,但是当我将鼠标悬停在新列表定义中存在的单词上时,ANNIE 会突出显示该单词并建议正确的注释

是否有可能让他自动,这样我就不必训练 ANNIE?所以我可以按程序来做吗?

【问题讨论】:

  • 您标记这个“jdk-1.5”有什么特别的原因吗?您使用的是什么版本的 GATE?
  • 不,这是一个错误,使用门 7.1

标签: nlp gate


【解决方案1】:

默认情况下,地名词典创建Lookup 类型的注释,具有majorTypeminorType 特征,例如.def 文件中的条目

oss.lst:software:open_source

将为列表中的条目创建带有majorType“软件”和minorType“open_source”的查找。然后通常的方法是编写处理Lookup 注释并创建最终注释的JAPE 规则。

可以通过在.def 行中添加更多字段,直接从地名词典创建其他注释类型:

oss.lst:software:open_source::Software

将创建Software 类型的注释而不是Lookup(字段是列表文件名、主要类型、次要类型、语言和注释类型)。但通常我建议坚持使用Lookup,然后使用 JAPE 创建最终注释,因此您可以根据需要添加其他规则(地名词典盲目地注释列表中任何提及的任何内容,您通常需要启发式方法来过滤掉它,例如,“Apache”在大多数情况下可能被认为是软件,但后面跟“License”一词时则不然)。

最后,如果您想添加自己的地名词典和/或 JAPE 规则,我们建议您不要直接编辑 plugins/ANNIE 下的文件。而是在其他地方创建您的自己的 lists.def,并将其加载到地名词典 PR 的单独实例中,插入管道中的适当位置。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2015-08-14
    • 2023-04-04
    • 2023-03-10
    • 1970-01-01
    • 2015-10-19
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多