【发布时间】:2013-11-01 14:10:47
【问题描述】:
我正在尝试搜索以下字符串:
<td></td>
<td>)</td>
除了换行符之外,</td> 和 <td> 之间可以有任意数量的空格。总是只有一个换行符,但是一个简单地忽略所有空格(包括换行符)的表达式就可以了。
我试图弄清楚如何使用此信息执行字符串替换而不折叠文件中的所有空白。我发现许多解决方案都带有处理空格的表达式,但我也无法使用换行符。
我的正则表达式经验有限。我应该如何从 bash shell 环境中解决这个问题?
【问题讨论】:
-
使用 dom [ 和 xpath ] 操作 html 文档
-
您还没有确切地说出您要替换的内容。如果您阅读了诸如
sed或awk中的正则表达式,您会发现用于识别换行符的选项。 -
请显示示例输出(替换后)
-
你想在 outfile 中替换什么?标签或这两行中的东西?