【发布时间】:2021-05-15 09:55:39
【问题描述】:
我正在尝试使用 spacy 和命名实体识别从 CV 中提取以前的职位。
我想训练 spacy 来检测自定义命名实体类型:“JOB”。为此,我有大约 800 个来自 https://www.careerbuilder.com/browse/titles/ 的职位名称,可以用作训练数据。
在我的 spacy 训练数据中,我是否需要将这些职位整合到添加的句子中以提供上下文? 一般来说,在简历中,职位名称有点独立,并不是完整句子的一部分。
另外,如果我需要为 800 个标题中的每一个提供连贯的上下文,这对于我正在尝试做的事情来说太耗时了,所以也许除了 NER 之外还有其他解决方案吗?
【问题讨论】:
标签: machine-learning model spacy named-entity-recognition