【发布时间】:2018-03-07 03:40:25
【问题描述】:
我有类似以下格式的句子
这个漏洞发生在
Firefox1.x之前1.8,Safari2.x在2.8之前。
鉴于上面这句话,我想提取字典
{Firefox: 1.0-1.8, Safari: 2.0-2.8}
问题是我应该如何使用 NLP 技术识别它们所属软件的版本范围?
【问题讨论】:
我有类似以下格式的句子
这个漏洞发生在
Firefox1.x之前1.8,Safari2.x在2.8之前。
鉴于上面这句话,我想提取字典
{Firefox: 1.0-1.8, Safari: 2.0-2.8}
问题是我应该如何使用 NLP 技术识别它们所属软件的版本范围?
【问题讨论】:
我会使用 NER 的组合,一种用于检测名称,一种用于检测版本:
您可能必须:
- 保留流行软件列表,以防 NER 错过。
- 修复软件版本号的黑客方法;像“1.x”没有正确检测到。
你可以在这里玩:http://nlp.cogcomp.org
【讨论】: