【发布时间】:2017-10-17 19:49:35
【问题描述】:
输入:
- 2016 年 3 月 27 日至 2016 年 12 月 31 日期间的购票和旅行有效
- 有效期票必须在 16 年 2 月 18 日之前签发
- 有效期票必须在 2016 年 2 月 29 日之前签发
- 现在旅行日期 - 2016 年 2 月 10 日 2016 年 2 月 22 日 - 2016 年 5 月 12 日
- 2016 年 1 月 31 日之前的出票有效期
(注意:输入已经被一些Python代码预处理到这个阶段,这样使用一些Python包会更容易处理。)
预期输出:
- 从2016-03-27到2016-12-31
- 在 2016-02-18 之前
- 2016-02-29 之前
- 现在 - 2016-02-10 2016-02-22 - 2016-05-12
- 2016-01-31 之前
我已经尝试过 dateutil。但是它只能提取一个日期,对吗?即使在这种情况下,同时提取介词和日期也是一个问题。
我还研究了 dateparser 和 datefinder。看来他们都使用 dateutil。
日期可以是 YYYY-MM-DD、DDMMYYYY 等,只要格式相同即可。
输出不必与上述相同,只要它反映准确的信息即可。
最后,感谢您的时间和想法。我也会继续努力的。
【问题讨论】:
-
如果您对我的回答发表评论,请与我的回答相关联。通过
dateparser向我们展示您的尝试。 -
感谢您指出原帖中的缺失部分。有一些更新。 @帕特里克
-
我发现 datefinder 可以比 dateparser 更好地从原始句子中提取日期。但是,我在安装时遇到了错误。 link
标签: python date datetime nltk python-dateutil