【发布时间】:2015-03-26 10:15:51
【问题描述】:
我正在尝试编写一些 BeautifulSoup 代码,它将获取被标签包围的每一段文本并将标签更改为标签 - 但前提是它只是一行没有其他写入/输出文本。
这可能吗?
到这里
但这将保持不变:
我知道以下方法可以转化所有强者。我怎样才能只得到重要的?
import BeautifulSoup
if __name__ == "__main__":
data = """
<html>
<h2 class='someclass'>some title</h2>
<ul>
<li>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</li>
<li>Aliquam tincidunt mauris eu risus.</li>
<li>Vestibulum auctor dapibus neque.</li>
</ul>
</html>
"""
soup = BeautifulSoup.BeautifulSoup(data)
h2 = soup.find('strong')
h2.name = 'h1'
print soup
【问题讨论】:
标签: python html python-3.x beautifulsoup html-parsing