【问题标题】:Finding the url of a dynamically generated link in python在python中查找动态生成的链接的url
【发布时间】:2019-10-30 10:46:10
【问题描述】:

【问题讨论】:

    标签: python parsing web-scraping python-requests


    【解决方案1】:

    看来目标网址是用base64编码的。

    >>> from base64 import urlsafe_b64decode
    >>> urlsafe_b64decode('CBMiiQFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zi5zaHRtbNIBjAFodHRwczovL3d3dy5jb3JyaWVyZS5pdC9zcG9ydC8xOV9vdHRvYnJlXzMwL3JhcGluYXRvcmktdmlsbGEtY2xhdWRpby1tYXJjaGlzaW8taW5nZW50ZS1ib3R0aW5vLTQ1YmE0YjFlLWZhZTctMTFlOS1iMWM2LWEzODFhYmJhNWQ5Zl9hbXAuaHRtbA==')
    b'\x08\x13"\x89\x01https://www.corriere.it/sport/19_ottobre_30/rapinatori-villa-claudio-marchisio-ingente-bottino-45ba4b1e-fae7-11e9-b1c6-a381abba5d9f.shtml\xd2\x01\x8c\x01https://www.corriere.it/sport/19_ottobre_30/rapinatori-villa-claudio-marchisio-ingente-bottino-45ba4b1e-fae7-11e9-b1c6-a381abba5d9f_amp.html'
    

    【讨论】:

      【解决方案2】:

      看看这个帖子:How to scrape Google News articles content from Google News RSS?

      在底部打印 url,我认为这就是您正在寻找的价值。希望对您有所帮助!

      【讨论】:

      • 真的无法让它发挥作用。似乎这对提要很有帮助,而我正在寻找从链接获取最终链接。
      猜你喜欢
      • 2012-09-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-09-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多