【发布时间】:2019-10-30 10:46:10
【问题描述】:
我想在 python 中找到最后生成的链接。我似乎找不到解决方案,有什么想法吗?
【问题讨论】:
标签: python parsing web-scraping python-requests
我想在 python 中找到最后生成的链接。我似乎找不到解决方案,有什么想法吗?
【问题讨论】:
标签: python parsing web-scraping python-requests
看来目标网址是用base64编码的。
>>> from base64 import urlsafe_b64decode
>>> urlsafe_b64decode('CBMiiQFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zi5zaHRtbNIBjAFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zl9hbXAuaHRtbA==')
b'\x08\x13"\x89\x01https://www.corriere.it/sport/19_ottobre_30/rapinatori-villa-claudio-marchisio-ingente-bottino-45ba4b1e-fae7-11e9-b1c6-a381abba5d9f.shtml\xd2\x01\x8c\x01https://www.corriere.it/sport/19_ottobre_30/rapinatori-villa-claudio-marchisio-ingente-bottino-45ba4b1e-fae7-11e9-b1c6-a381abba5d9f_amp.html'
【讨论】:
看看这个帖子:How to scrape Google News articles content from Google News RSS?
在底部打印 url,我认为这就是您正在寻找的价值。希望对您有所帮助!
【讨论】: