【问题标题】:Web Scraping of span tag in div classdiv类中span标签的Web抓取
【发布时间】:2020-06-23 06:28:07
【问题描述】:
r = requests.get("https://www.typingtest.com/test.html?textfile=tiger.txt&minutes=1&mode=text&result_url=result.html")

soup = BeautifulSoup(r.text, 'html.parser')
lst = soup.find('span', {'class': 'test-text-area-font-highlighted'})

for i in lst:
    print(i.text)

但它显示以下错误: 对于我在 lst: TypeError: 'NoneType' 对象不可迭代

【问题讨论】:

  • 请描述你的目标是什么,你为实现目标所做的努力以及路上的障碍是什么。
  • 我的目标是在网站上获得最高的打字速度分数。不管给出什么文本。这就是为什么我试图提取该网页的文本并将这些内容复制到一个文件中,然后我将使用 pyautogui 输入以下文本

标签: python html web-scraping beautifulsoup


【解决方案1】:

你的代码有两个问题:

  1. 没有类名为test-text-area-font-highlighted<span> 元素,因此lst 将是None

  1. find() 函数仅返回第一个匹配元素(其类型为 bs4.element.Tag),因此不可迭代。

因此,请尝试找到<span> 元素的正确类名,并改用find_all() 方法。

【讨论】:

  • 哦,我打错了,它的 div 但我还是找不到下课。是不是因为一个伪元素=> ::before?
  • 等等,没有 标签。阅读整行而不是一半
  • 让我看看你的第二个建议
  • 使用 find_all(),它不会给出任何错误,而是没有结果
猜你喜欢
  • 2021-06-05
  • 1970-01-01
  • 2020-09-03
  • 2010-09-22
  • 2018-11-10
  • 1970-01-01
  • 2020-02-24
  • 2020-05-19
相关资源
最近更新 更多