【发布时间】:2020-03-18 01:21:16
【问题描述】:
我们可以通过上传pdf完整文档、标记简单实体和训练来执行简单命名实体识别。
但是,Google Cloud AutoML 平台是否支持嵌套命名实体识别n?
【问题讨论】:
标签: google-cloud-platform named-entity-recognition google-cloud-automl
我们可以通过上传pdf完整文档、标记简单实体和训练来执行简单命名实体识别。
但是,Google Cloud AutoML 平台是否支持嵌套命名实体识别n?
【问题讨论】:
标签: google-cloud-platform named-entity-recognition google-cloud-automl
默认情况下不是。据我所知,也不一定有实现嵌套命名实体识别的标准化方法,这可能是它不受支持的部分原因。我想在单个进程中执行此操作,每个注释都需要在其中包含多个注释,这是不可能的:
每个注释最多可以覆盖十个标记(单词)。它们不能重叠;注释的 start_offset 不能介于同一文档中注释的 start_offset 和 end_offset 之间。 [docs]
但是,您可以根据您对嵌套 NER 的理解自行实现此功能。训练通用模型以提取主要实体(较大的包含实体)。然后,训练辅助模型以提取辅助实体(主要实体内的实体)。仅在主要模型的输出上运行次要模型。潜在地,您还应该实现一些条件,例如令牌数量。
【讨论】: