【发布时间】:2011-12-29 19:18:48
【问题描述】:
我正在使用 lxml 解析 HTML 页面。页面的元标记如下:
<meta property="og:locality" content="Detroit" />
<meta property="og:country-name" content="USA" />
如何使用 lxml 高效地查找每个页面上 og:locality 元标记的值?
我目前有以下内容,只是手动按属性匹配元标记:
for meta in doc3.cssselect('meta'):
prop = meta.get('property')
if prop === 'og:locality':
lat = meta.get('content')
但是感觉效率不是很高。
【问题讨论】:
标签: python screen-scraping css-selectors web-scraping lxml