【发布时间】:2013-08-21 19:01:27
【问题描述】:
我无法弄清楚如何使用正则表达式选择部分 html 链接
说链接是:
<a href="race?raceid=1234">Mushroom Cup</a>
我已经想出了如何获得比赛 ID,但我终其一生都无法弄清楚如何使用正则表达式来找到“蘑菇杯”。我能做的最好的就是得到 1234>蘑菇杯。
我是正则表达式的新手,这对我来说太难理解了。
【问题讨论】:
-
输入的变化有多大?如果您要从大型文档的多个位置提取此数据,则可能值得使用 HTML 解析器而不是正则表达式。
标签: python html regex html-parsing wildcard