【发布时间】:2012-06-10 11:06:04
【问题描述】:
我正在尝试解析一个 html 文档。它包含几个表。 我能够找到正确的表并从中获取数据使用
for cell in doc.xpath('//table[@class="CE_13"]')[0]:
for a in cell:
print a.text_content()
表格由 6 列组成。
我只需要第五列。
是否有可能获取字典中的所有值(例如:{ column1 : values_of_clm1 ;column2 : values_of_clmn2; .....}) 以及如何获取?然后读取 dict 表格或您是否建议其他解决方案?
【问题讨论】:
标签: python html-table html-parsing lxml