【发布时间】:2011-04-05 07:42:20
【问题描述】:
来自输入文件的摘录
<TD class="clsTDLabelWeb" width="28%">Municipality: </TD>
<TD style="WIDTH: 394px" class="clsTDLabelSm" colSpan="5">
<span id="DInfo1_Municipality">JUPITER</span></TD>
我的正则表达式
(?<=<span id="DInfo1_Municipality">)([^</span>]*)
我有一个保存到磁盘的 HTML 文件。 我想使用 grep 搜索文件并输出特定 span 的内容,虽然我不知道这是否是 grep 的正确使用。当我使用从另一个文件中读取的表达式对文件运行 grep 时(所以我不会弄乱任何特殊字符的转义),它不会输出任何内容。我已经在 RegExr 中测试了表达式,它与“JUPITER”匹配,这正是我想要返回的。非常感谢您的帮助!
期望的输出
JUPITER
【问题讨论】:
标签: html regex bash screen-scraping grep