【问题标题】:Python print scraped data with beautifulsoup without tagsPython用beautifulsoup不带标签打印抓取的数据
【发布时间】:2015-12-02 10:07:24
【问题描述】:
<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>

我正在抓取一个网站。我已经设法打印出 .这是我的代码:

web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme

打印出来:

<div class="id" title="Player number">1211</div>

我希望它只打印 1211。我该怎么做?

【问题讨论】:

    标签: python python-2.7 beautifulsoup screen-scraping


    【解决方案1】:

    获得元素列表scrapeme 后,您可以循环遍历列表中的每个元素并使用以下方法打印其文本属性:

    for element in scrapeme:
        print(element.text)
    

    由于在您的示例中,抓取仅生成包含一个元素的列表 scrapeme,因此在这种情况下,输出将是:

    1211
    

    【讨论】:

    【解决方案2】:

    任何 beautifulsoup 对象的 get_ text() 方法都可以做到这一点。

    print(scrapeme.get_text())
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-01-19
      • 1970-01-01
      • 2021-06-05
      • 2020-05-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多