【问题标题】:How to map watson knowledge studio with content analytics?如何使用内容分析映射 Watson Knowledge Studio?
【发布时间】:2017-05-26 01:29:35
【问题描述】:

我正在尝试将我分析的文档集合从 ICA 导出到 WKS,但它说我必须执行从 UIMA 类型到 WKS 实体类型的映射。但我找不到任何关于我应该如何进行的解释。 有谁知道该怎么做? 谢谢

【问题讨论】:

    标签: ibm-watson watson


    【解决方案1】:

    几周前我有这个问题时,我做了这个。我做了以下步骤:

    将 UIMA 类型映射到实体类型

    在将 XMI 文件导入 Watson Knowledge Studio 项目之前,您必须定义 UIMA 类型和 Watson Knowledge Studio 实体类型之间的映射。

    开始之前

    Watson Knowledge Studio 项目中的类型系统必须包含您要将 UIMA 类型映射到的实体类型。

    将 UIMA 类型映射到 WKS 实体类型:

    1. 在包含 UIMA TypeSystem 描述符文件的文件夹中创建一个名为 cas2di.tsv 的文件,例如 exported_typesystem.xmlTypeSystem.xml

    2. 使用文本编辑器打开 cas2di.tsv 文件。文件中的每一行都指定一个映射。映射的格式取决于您要映射哪个注解器的注解:

    您可以使用基本格式创建映射:

    UIMA_Type_Name[TAB]WKS_Entity_Type
    

    以下示例定义了由 IBM Watson Explorer Content Analytics 中的 Named Entity Recognition 注释器生成的 UIMA 类型与 WKS 类型系统中定义的实体类型之间的映射:

    com.ibm.langware.Organization  ORGANIZATION
    com.ibm.langware.Person  PERSON
    com.ibm.langware.Location  LOCATION
    

    另一个示例定义了由在 IBM Watson Explorer Content Analytics Studio 中创建的自定义注释器生成的 UIMA 类型与 Watson Knowledge Studio 实体类型之间的映射:

    com.ibm.Person  PERSON
    com.ibm.Date  DATE
    

    您可以基于在 Watson Explorer Content Analytics 中的 Pattern Matcher 注释器或 Dictionary Lookup 注释器中使用的构面创建映射。在文本分析规则文件 (*.pat) 中,分面表示为类别属性。要定义映射,请使用以下语法:

    com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]WKS_ENTITY_TYPE
    

    喜欢:

    com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]ORGANIZATION
    

    请参阅Official Documentation

    【讨论】:

    • 好的,我也做了同样的事情,而且效果很好......让我们检查一下你的问题,你能用你的尝试和错误来编辑吗?
    • 无法导入文件:无法导入带注释的文档,因为未定义类型系统。在导入带注释的文档之前,您必须从同一原始项目中导入类型系统。检查文档是否为 UIMA CAS XMI 格式。 (您选择了“以 UIMA CAS XMI 格式导入文档”)
    • 尝试转换为.xmi
    • 完成了,:) 问题出在空的 .xmi 文件中。还有那些太重的。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-06-26
    • 1970-01-01
    相关资源
    最近更新 更多