【发布时间】:2020-05-30 09:10:43
【问题描述】:
我有这段代码,其中包含页面的 html 内容:
page = """<div>
<span class="item_1" dt="2012.03.12">Item Name 1</span>
<span class="item_2" dt="2012.03.6" time="12:51">Item Name 2</span></div>"""
print(re.findall(('class="(a-z_0-9)"')('dt="(0-9.)"')('>(A-Za-z 0-9)<'),page))
最后一行对我不起作用。也许是错的。我需要做的是分别为每个跨度提取类、dt 和文本。
预期输出:
[('item_1', '2012.03.12', 'Item Name 1'),
('item_2','2012.03.6','Item Name 2')]
请帮忙!
【问题讨论】: