【发布时间】:2010-09-30 15:58:54
【问题描述】:
我希望这个问题不是 RTFM 问题。
我正在尝试编写一个从标准 HTML 网页(<link href... 标签)中提取链接的 Python 脚本。
我在网上搜索了匹配的正则表达式,发现了许多不同的模式。是否有任何公认的标准正则表达式来匹配链接?
亚当
更新: 我实际上正在寻找两个不同的答案:
- 什么是解析 HTML 链接的库解决方案。 Beautiful Soup 似乎是一个很好的解决方案(感谢
Igal Serban和cletus!) - 可以使用正则表达式定义链接吗?
【问题讨论】:
标签: python html regex hyperlink href