【发布时间】:2021-01-06 17:54:00
【问题描述】:
要提取的文本和输出类似于以下内容:
“每两周检查一次” - 两周
“在第 1 天和第 14 天检查它” - 第 1 天和第 14 天
“第 19 天和第 14 天很重要”- 第 19 天,第十四天
“在第 11 天和第 14 天检查” - 第 11 天、第 14 天
“在第一天和十二天检查” - 第一天,第十二天
我曾尝试使用 SUTime 库来提取必要的信息,但它仅适用于第一个示例,无法从其余示例中正确提取信息。考虑到可以编写相同文本的多种方式,使用正则表达式不太可行。这个问题还有其他解决方案吗?
【问题讨论】:
-
似乎需要自然语言处理。查看 NLTK:nltk.org.
标签: python python-3.x date text nlp