【发布时间】:2012-11-06 10:49:10
【问题描述】:
我正在尝试使用正则表达式解析多行 html 文件。
HTML 代码:
<td>Details</td></tr>
<tr class=d1>
<td>uss_vod_translator</td>
正则表达式:
if ($line =~ m/Details<\/td>\s*<\/tr>\s*<tr\s*class=d1>\s*<td>(\w*)<\/td>/)
{
print "$1";
}
我将/s*(空格)用于多行,但它不起作用。我搜索了一下,甚至将/\? 用于多行但也没有用。
谁能建议我如何解析多行 HTML?
我知道正则表达式是解析 HTML 的糟糕解决方案。但是我有一个遗留的 HTML 代码,我需要对其进行解析并且别无选择。
【问题讨论】:
-
从你的变量名来看,你只有一行,怎么匹配超过一行的呢?
-
最好的答案已经由其他人前段时间写了:stackoverflow.com/a/1732454/1065241
标签: html regex perl html-parsing multiline