在python中查找动态生成的链接的url答案

【问题标题】：Finding the url of a dynamically generated link in python在python中查找动态生成的链接的url
【发布时间】：2019-10-30 10:46:10
【问题描述】：

我有一个动态链接，例如 https://news.google.com/__i/rss/rd/articles/CBMiiQFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zi5zaHRtbNIBjAFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zl9hbXAuaHRtbA?oc=5

我想在 python 中找到最后生成的链接。我似乎找不到解决方案，有什么想法吗？

【问题讨论】：

标签： python parsing web-scraping python-requests

【解决方案1】：

看来目标网址是用base64编码的。

>>> from base64 import urlsafe_b64decode
>>> urlsafe_b64decode('CBMiiQFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zi5zaHRtbNIBjAFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zl9hbXAuaHRtbA==')
b'\x08\x13"\x89\x01https://www.corriere.it/sport/19_ottobre_30/rapinatori-villa-claudio-marchisio-ingente-bottino-45ba4b1e-fae7-11e9-b1c6-a381abba5d9f.shtml\xd2\x01\x8c\x01https://www.corriere.it/sport/19_ottobre_30/rapinatori-villa-claudio-marchisio-ingente-bottino-45ba4b1e-fae7-11e9-b1c6-a381abba5d9f_amp.html'

【讨论】：

【解决方案2】：

看看这个帖子：How to scrape Google News articles content from Google News RSS?

在底部打印 url，我认为这就是您正在寻找的价值。希望对您有所帮助！

【讨论】：

真的无法让它发挥作用。似乎这对提要很有帮助，而我正在寻找从链接获取最终链接。