【问题标题】:Scraping url with spaces using requests使用请求抓取带有空格的 url
【发布时间】:2020-07-12 17:23:24
【问题描述】:

我正在尝试 scrape url 哪个子页面有空格(exp.www.test.com/this 只是示例),但是,在使用 requests.get(url) 时,我遇到了一个错误。如何绕过空格问题,以便在将其传递给 get() 时,我将能够处理该网站的内容?

【问题讨论】:

  • 到目前为止你尝试过什么代码?
  • 我尝试在空格前使用“/”,因为这是使用正则表达式绕过符号的方法,但它不起作用@bigbounty
  • 给出网站和你要提取的内容
  • 好的,我试过用“%”替换空格,效果很好!
  • Scrap 意味着扔掉。你的意思是

标签: web-scraping python-requests web-crawler python-requests-html


【解决方案1】:

试试:

url.replace(' ','http://')

请求库希望在给定的 url 中有 http 或 https

【讨论】:

    猜你喜欢
    • 2016-10-05
    • 2011-08-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-12-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多