【问题标题】:get Links corresponding to error codes 404获取错误代码404对应的链接
【发布时间】:2021-07-28 18:40:36
【问题描述】:

我有大约 500 个玩家链接。 除了两个之外,所有链接都返回响应代码 200。 但是,我需要具有代码 404 的确切链接/网址。

for p in range(len(playerLinks)):
    
       
    page = playerLinks[p]
    response = requests.get(page, headers={'User-Agent': 'Custom5'})
    print(response.status_code)
    injury = response.text
    soup = BeautifulSoup(injury, 'html.parser')
    table = soup.find(id="yw1")

非常感谢您的支持。 播放器链接的示例(这些链接的外观)是这样的(但至少有 500 种不同)

https://www.transfermarkt.de/Timothy Fosu-Mensah/verletzungen/spieler/315131']

【问题讨论】:

    标签: python web-scraping http-status-code-404


    【解决方案1】:

    您可以使用简单的if 语句来做到这一点。

    for p in range(len(playerLinks)):
        
           
        page = playerLinks[p]
        response = requests.get(page, headers={'User-Agent': 'Custom5'})
    
        if response.status_code == 404:
            print(page)
    
        injury = response.text
        soup = BeautifulSoup(injury, 'html.parser')
        table = soup.find(id="yw1")
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-01-10
      • 1970-01-01
      • 2018-01-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-05-27
      • 1970-01-01
      相关资源
      最近更新 更多