【问题标题】:How to scrape all h3 tags in a website using beautifulsoup4如何使用beautifulsoup4抓取网站中的所有h3标签
【发布时间】:2021-03-23 07:11:09
【问题描述】:

问题:- 我想只使用一行代码获取网页中的所有 h3 标签。

我知道如何使用 beautifulsoup 获取标签及其内部 HTML,但一次只能获取一个。 这是基本代码:-

from bs4 import BeautifulSoup
import requests

source = requests.get("https://en.wikipedia.org/wiki/Code").text

soup = BeautifulSoup(source, 'lxml')

content = soup.find("span")
spans = content
print(spans)

输出:

<span>...</span>

如上所示,它只返回一个跨度,当我需要所有跨度显示为输出时,有点像:
<span>...</span>,<span>...</span> 请指导我这样做

【问题讨论】:

    标签: html python-3.x web-scraping beautifulsoup


    【解决方案1】:

    试试这个

    import bs4
    soup1 = bs4.BeautifulSoup(htm1, 'html.parser')
    for match in soup1.findAll('span'):
        match.unwrap()
    print soup1
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-02-06
      • 1970-01-01
      • 2022-11-22
      • 2022-01-18
      • 2018-07-21
      • 1970-01-01
      • 2022-10-14
      • 2020-11-07
      相关资源
      最近更新 更多