【发布时间】:2017-04-10 09:04:03
【问题描述】:
我正在尝试使用正则表达式从 URL 下载所有图像。
我目前只需要图片的网址,我正在使用
def urlimage(text):
'''finds image url'''
imageurl = []
imageurl = re.findall(r'https?:\/\/.*\.(?:png|jpg)', text)
return imageurl
目前没有找到任何图片网址。 我的正则表达式有问题还是我要解决这个问题?
【问题讨论】:
-
那么,所有 URI 是否都以
http://或https://开头,还是其中一些是相对 URI?这是一个 HTML 文档,你应该使用 BeautifulSoup 还是类似的东西?最后,\.*应该是\.*?。
标签: python regex python-2.7