【问题标题】:How to extract html li tags如何提取html li标签
【发布时间】:2021-08-11 16:20:03
【问题描述】:

我想在 (li-label-span) 标签下提取特定的“英文”文本。我应该如何使用beautifulsoup 做到这一点?如果有人来帮忙...你能为这个特定问题写一些代码吗?

<div class="biblio-info-wrap">
                <h2 class="biblio-title">
                    Product details</h2>
                <ul class="biblio-info">

                    <li>
                            <label>Publication date</label>
                            <span itemprop="datePublished">18 Feb 2021</span>
                        </li>
                   
                    <li>
                            <label>Publication City/Country</label>
                            <span>
                                Edinburgh, United Kingdom</span>
                        </li>
                    ***<li>
                            <label>Language</label>
                            <span>
                                English</span>
                        </li>***
                    <li>
                            <label>Edition Statement</label>
                            <span>Main</span>
                        </li>
                    <li>
                            <label>ISBN10</label>
                            <span>1786892731</span>
                        </li>
    
                    </ul>
            </div>

【问题讨论】:

    标签: python beautifulsoup screen-scraping


    【解决方案1】:

    如果html_doc 包含您问题中的 HTML 代码,您可以这样做:

    soup = BeautifulSoup(html_doc, "html.parser")
    
    print(
        soup.find("label", text="Language").find_next("span").get_text(strip=True)
    )
    

    打印:

    English
    

    或者使用 CSS 选择器:

    print(
        soup.select_one('label:-soup-contains("Language") + span').get_text(
            strip=True
        )
    )
    

    【讨论】:

    • 非常感谢你..这是一个节省时间
    【解决方案2】:

    导入 BeautifulSoup

    from bs4 import BeautifulSoup
    

    然后

    soup = BeautifulSoup(html_doc, "html.parser")
    name_tag =soup.find("label", text="Language").find_next("span").get_text(strip=True)
    print(name_tag)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-10-02
      • 2019-11-22
      • 1970-01-01
      • 2021-12-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-02-17
      相关资源
      最近更新 更多