【问题标题】:Python Mechanize, how to get URL parametersPython Mechanize,如何获取 URL 参数
【发布时间】:2020-11-08 10:30:46
【问题描述】:

我目前正在研究网站抓取工具。因为我必须登录才能访问该网站,所以必须生成并保存 session ID 以供进一步使用。

session ID 位于 URL 的末尾。

https://example.com/something.php?sid=123456789

我尝试使用geturl() 命令,但它只返回没有任何参数的 URL。

获取 url 参数的最佳方法是什么?

【问题讨论】:

    标签: python url parameters mechanize mechanize-python


    【解决方案1】:
    from urllib.parse import urlparse
    
    parsed = urlparse(url)
    print(parsed)
    

    输出:

    ParseResult(scheme='https', netloc='example.com', path='/something.php', params='', query='sid=123456789', fragment='')
    

    然后,您可以访问:

    print(parsed.query)
    

    输出:

    sid=123456789
    

    然后,你可以提取:

    sid = parsed.query.split('sid=')[-1]
    print(sid)
    

    输出:

    123456789
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-01-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多