【发布时间】:2017-05-26 01:29:35
【问题描述】:
我正在尝试将我分析的文档集合从 ICA 导出到 WKS,但它说我必须执行从 UIMA 类型到 WKS 实体类型的映射。但我找不到任何关于我应该如何进行的解释。 有谁知道该怎么做? 谢谢
【问题讨论】:
标签: ibm-watson watson
我正在尝试将我分析的文档集合从 ICA 导出到 WKS,但它说我必须执行从 UIMA 类型到 WKS 实体类型的映射。但我找不到任何关于我应该如何进行的解释。 有谁知道该怎么做? 谢谢
【问题讨论】:
标签: ibm-watson watson
几周前我有这个问题时,我做了这个。我做了以下步骤:
将 UIMA 类型映射到实体类型
在将 XMI 文件导入 Watson Knowledge Studio 项目之前,您必须定义 UIMA 类型和 Watson Knowledge Studio 实体类型之间的映射。
开始之前
Watson Knowledge Studio 项目中的类型系统必须包含您要将 UIMA 类型映射到的实体类型。
将 UIMA 类型映射到 WKS 实体类型:
在包含 UIMA TypeSystem 描述符文件的文件夹中创建一个名为 cas2di.tsv 的文件,例如 exported_typesystem.xml 或 TypeSystem.xml。
使用文本编辑器打开 cas2di.tsv 文件。文件中的每一行都指定一个映射。映射的格式取决于您要映射哪个注解器的注解:
您可以使用基本格式创建映射:
UIMA_Type_Name[TAB]WKS_Entity_Type
以下示例定义了由 IBM Watson Explorer Content Analytics 中的 Named Entity Recognition 注释器生成的 UIMA 类型与 WKS 类型系统中定义的实体类型之间的映射:
com.ibm.langware.Organization ORGANIZATION
com.ibm.langware.Person PERSON
com.ibm.langware.Location LOCATION
另一个示例定义了由在 IBM Watson Explorer Content Analytics Studio 中创建的自定义注释器生成的 UIMA 类型与 Watson Knowledge Studio 实体类型之间的映射:
com.ibm.Person PERSON
com.ibm.Date DATE
您可以基于在 Watson Explorer Content Analytics 中的 Pattern Matcher 注释器或 Dictionary Lookup 注释器中使用的构面创建映射。在文本分析规则文件 (*.pat) 中,分面表示为类别属性。要定义映射,请使用以下语法:
com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]WKS_ENTITY_TYPE
喜欢:
com.ibm.takmi.nlp.annotation_type.ContiguousContext:category=FACET_PATH[TAB]ORGANIZATION
【讨论】:
.xmi