【问题标题】:Scraping informations with Beautiful Soup in same name tags用 Beautiful Soup 在同名标签中抓取信息
【发布时间】:2018-10-15 18:46:24
【问题描述】:

我想用 Python 中的 Beautiful Soup 从 html 页面中抓取信息,并且我需要的所有信息都在同一个名称标签中> 如何区分我需要的每个信息?

我需要的所有信息都在不同的 class="hAyfc" 标记中。

【问题讨论】:

  • 欢迎来到 StackOverflow!请阅读帮助文件。这是 StackOverflow 上的习惯,让那些提出问题的人发布代码,展示他们为自己解决问题所做的尝试。请您发布您为此问题编写的代码并提出与该代码相关的问题。

标签: python beautifulsoup


【解决方案1】:

结果是有序的,你只需要把结果取出来,因为结果的顺序和html中的顺序是一样的

from bs4 import BeautifulSoup

html = """
<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeA
            </span>
        </div>
    </span>
</div>

<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeB
            </span>
        </div>
    </span>
</div>
"""

bs = BeautifulSoup(html,"lxml")
result = [e.text for e in bs.find_all("div",{"class":"hAyfc"})]
print(result)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-01-10
    • 1970-01-01
    • 1970-01-01
    • 2023-03-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多