【发布时间】:2021-05-07 15:01:01
【问题描述】:
我如何使用 spacy 来检测如下模式:
mygov-24.mygov.ca - last updated: 06/05/21
我想检测以下模式:
- mygov-24.mygov.ca - 最后更新时间:06/05/21
- mygov-24.mygov.ca - 最后更新时间:02/04/21
- mygov-24.mygov.ca - 最后更新时间:01/02/21
- ....
您可以看到日期发生了变化,但一切都保持不变。如何使用 spacy 创建一个模式匹配器,它告诉输入字符串是否具有相同的模式?另外,如果检测到模式,我想提取日期。 Spacy 可以做到吗?
我通过了,https://spacy.io/usage/rule-based-matching,但不知道从哪里开始。
编辑 给定上面的一组动态短语,有没有办法识别短语中的变量?
【问题讨论】:
标签: python algorithm nlp nltk spacy