【发布时间】:2017-12-31 14:49:17
【问题描述】:
我正在使用 python 和 beautifulsoup 来解析对象,我正在尝试使用 re.findall 提取 url
<a class="btn btn-danger btn-sm" href="javascript: void(0);"
onclick="if (confirm('Delete link
http://gorillavid.in/8538jm5bptgd')) { removeLink(71603335); }"><i
class="fa fa-trash "></i></a>
我正在尝试提取网址https://gorillavid.in/97ylvj76qjeh。
我正在尝试这种表达方式:
re.search("Delete link\s* (.*?)',", data).group(1)
re.findall(r'(https?://[^\s]+)', link)
这给了我一个错误,它不是一个字符串。
【问题讨论】:
-
你的代码很难格式化,请自行重新格式化。
-
很抱歉这是我在这个网站上的第一个问题。我已经重新格式化了它
标签: python regex linux anaconda