【发布时间】:2014-01-27 12:39:03
【问题描述】:
我已经抓取了 HTML,现在我有这样的行:
rows
1: for the Year Ended 31 March 2013
我只想提取表达式"31 March 2013"。表达式周围的文本可能会有所不同。表达式要转成日期格式,最好是31-3-2013
如何解决这个问题?
【问题讨论】:
-
日期总是最后三个字吗?是否还有其他数字,或者您可以使用一个正则表达式来为您提供两个数字和介于两者之间的单词吗?
-
问题是我还不知道,直到我对所有文件进行报废。但包括它不会是最后三个单词的可能性,会很棒。