【发布时间】:2013-09-15 02:04:55
【问题描述】:
我想编写一个 bash 脚本,在 html 文件中找到一个模式,该模式跨越多行。
正则表达式文件:
<td class="content">
some content
</td>
<td class="time">
13.05.2013 17:51
</td>
<td class="author">
A Name
</td>
现在我想用class="time" 找到<td>-tag 的内容。
所以原则上是以下正则表达式:
<td class="time">(\d{2}\.\d{2}\.\d{4}\s+\d{2}:\d{2})</td>
grep 似乎不是我可以使用的命令,因为...
- 它只返回完整的行或使用
-o的完整结果,而不仅仅是圆括号(...)内的结果。 - 模式只在一行中查找
那么我怎么可能只得到一个带有13.05.2013 17:51 的字符串呢?
【问题讨论】:
-
用谷歌搜索“命令行 xml 解析器”并找到 stackoverflow.com/questions/893585/how-to-parse-xml-in-bash