【发布时间】:2017-05-18 05:58:10
【问题描述】:
我需要帮助选择 html 代码的价格。由于我已经提取了电影的标题,我现在需要提取价格。我曾尝试使用前瞻正则表达式,但是当我使用 \n.* 时出现错误,因为它说 “后瞻内的量词使其宽度不固定”。我需要文本中的第一个和第二个价格。
我尝试过的正则表达式:
(?<=Hello<\/a>.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*?(\$)
和:
Hello<\/a>.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*\n.*?(\$)
但不起作用。
文字:
<a class="blue_link" href="http://www.ebgames.com.au/Games/sjbeiub108723">Hello:</a>
<div class="hi">
<p>Including <a class="blue_link">
<p>Price$<data1>40.00</p>
请帮忙,谢谢:)
【问题讨论】:
-
是你的预期输出 -
$30.53 and $27.46 -
如果要解析 HTML,请使用 HTML 解析器。 RegEx 不是 HTML 解析器,不应用于解析 HTML。请参阅stackoverflow.com/questions/1732348/… 了解更多信息。