【问题标题】:Extract class only text [duplicate]仅提取类文本[重复]
【发布时间】:2016-07-05 16:05:45
【问题描述】:

我正在努力解决这个问题。 提取物完美无缺,但结果是:

" div class= " ppl_product_header "" " H1 " 内存 4 Gb Dimm 2133 Mts CL15"/h1""/div"

但我只需要 "h1 " 和 "" h1 "" 之间的内容。即仅文本。

 from bs4 import BeautifulSoup
 import urllib2 
 import time
 y=0
 url ="http://www.grupccccco.com.ar/PROcccO/PcccD_ID=3704444/Distrfffdora.aspx"
 html_page = urllib2.urlopen(url)
 soup = BeautifulSoup(html_page)
 x=soup.find_all('div', class_='ppl_product_header')
 print x

print "good bye"

【问题讨论】:

  • 使用print x.text

标签: python class web extract


【解决方案1】:

在你的情况下使用get_text() - print x.get_text()

【讨论】:

    猜你喜欢
    • 2013-12-18
    • 2018-01-14
    • 2018-10-27
    • 1970-01-01
    • 1970-01-01
    • 2021-11-29
    • 2012-08-31
    • 2015-02-21
    • 2019-12-16
    相关资源
    最近更新 更多