【问题标题】:I am trying to scrape but my command prompt prints nothing. What am I doing wrong?我正在尝试抓取,但我的命令提示符没有打印任何内容。我究竟做错了什么?
【发布时间】:2020-02-22 00:27:00
【问题描述】:

我正在尝试打印标题。这是我的代码:

`import requests
from bs4 import BeautifulSoup

base_url = 'http://www.nytimes.com'
r = requests.get(base_url)
r_html = r.text
soup = BeautifulSoup(r.text, features="lxml")

for story_heading in soup.find_all(class_="balancedHeadline"):
    if story_heading.a:
        print(story_heading.a.text.replace("\n", " ").strip())
    else:
        print(story_heading.contents[0].strip())`

我的命令提示符没有给我任何响应。它什么也不打印。我的代码有什么问题?

【问题讨论】:

    标签: python beautifulsoup request screen-scraping scrape


    【解决方案1】:

    soup.find_all(class_="balancedHeadline") 返回的列表为空。似乎没有类“balancedHeadline”。我没有检查课程方案,但您至少会得到class_="css-1m5bs2v esl82me0" 的一些结果。

    【讨论】:

      【解决方案2】:

      试试这个代码。

      import requests
      from bs4 import BeautifulSoup
      
      base_url = 'http://www.nytimes.com'
      r = requests.get(base_url)
      r_html = r.text
      soup = BeautifulSoup(r.text)
      
      for story_heading in soup.findAll(class_="css-1m5bs2v esl82me0"):
          print(story_heading.get_text())
      

      【讨论】:

        猜你喜欢
        • 2015-01-26
        • 1970-01-01
        • 2013-08-06
        • 1970-01-01
        • 2016-07-18
        • 1970-01-01
        • 1970-01-01
        • 2019-12-23
        • 1970-01-01
        相关资源
        最近更新 更多