【发布时间】:2018-11-20 09:35:35
【问题描述】:
我在我的应用程序中使用以下模型:
en_core_web_sm
xx_ent_wiki_sm
我想知道默认 Spacy 模型可以提取的支持的日期和时间格式。
使用的 Python 版本:3.6 使用的 spaCy 版本:2.0.x
【问题讨论】:
标签: spacy
我在我的应用程序中使用以下模型:
en_core_web_sm
xx_ent_wiki_sm
我想知道默认 Spacy 模型可以提取的支持的日期和时间格式。
使用的 Python 版本:3.6 使用的 spaCy 版本:2.0.x
【问题讨论】:
标签: spacy
英文模型是在 OntoNotes 5 语料库上训练的,该语料库支持more extensive label scheme,包括DATE 和TIME。
xx_ent_wiki_sm 模型是在带有 more limited 标签方案的 Wikipedia 语料库上训练的,并且只能识别 PER、LOC、ORG 和 MISC 开箱即用 (model details here)。
在使用模型提取提及的日期和时间时,请务必记住这是一个统计过程,因此您看到的结果将取决于上下文和模型训练所依据的数据。根据您正在使用的文本,您可能希望 update and fine-tune 预训练模型以及更多特定于您的应用程序的示例,或者尝试使用基于规则的方法。另请参阅this thread,了解有关日期和时间解析的更多详细信息。
【讨论】: