【发布时间】:2012-08-15 10:27:54
【问题描述】:
[是的,标题没有错字!]
在 python 中,我需要一些可以解析 URL 的东西。我不敢相信一些标准还不存在。由于 URL 是在配置中设置的,因此我想确保它不是垃圾。
有 urlparse.urlparse,但它只解析“有效 URL”(某些无效 URL 有时会引发未记录的 ValueError)
例如
>>> import urlparse
>>> urlparse.urlparse('http://aa :: aa ! aa:11.com:aa').netloc
'aa :: aa ! aa:11.com:aa'
显示 urlparse 如何解析我认为无效的 URL。
【问题讨论】:
-
你不能只使用 urlparse 并捕获错误吗?
-
正则表达式怎么样?我猜你会找到数千个网址。
标签: python python-2.7