【发布时间】:2010-12-31 15:51:09
【问题描述】:
我正在尝试从网站获取一些信息。我想要的信息在表格中,所以我做了一个正则表达式,但我不知道简化它的正确方法。
以下是我想简化的正则表达式的两个部分:
<br>(.*)<br>(.*)<br>(.*)
<tr><td>(.+)r>(.+)r>(.+)r>(.+).+</td></tr> # This part should be repeated n times(n = 1 to 10)
我浏览了 python 文档,但我不知道该怎么做。也许你可以给我一个提示。
谢谢, mF.
【问题讨论】:
-
不要对 HTML 使用正则表达式!使用 HTML 解析器。