【问题标题】:WORDTABLE - Not matching the word - UIMA RUTAWORDTABLE - 与单词不匹配 - UIMA RUTA
【发布时间】:2019-10-01 23:58:12
【问题描述】:

我尝试使用 WORDTABLE 匹配单词。但有些文字不匹配。

在下面的输入中,阿富汗这个词不匹配。如果我从 WORDTABLE 中删除 A Coruña;n.a.,那么它是匹配的。

示例输入:

Afghanistan
Report
report

CSV 样本 (test.csv):

Afghanistan;Afghan.
report;rep.
A Coruña;n.a.

代码:

PACKAGE uima.ruta.example;
RETAINTYPE(SPACE);
WORDTABLE Table = 'test.csv';
DECLARE Annotation Abbr(STRING short);
Document{->MARKTABLE(Abbr, 1, Table,true,0,"",0, "short" = 2)};   
RETAINTYPE;

【问题讨论】:

    标签: uima ruta


    【解决方案1】:

    这很可能是由单词列表中的空格引起的。有几个选项可以避免这个问题,例如,激活配置参数dictRemoveWS

    【讨论】:

    • 还有UIMA-6092可以避免这个常见问题。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-08-03
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多