【发布时间】:2014-12-26 03:19:15
【问题描述】:
http://en.wikipedia.org/wiki/List_of_cities_in_China
我想提取所有城市名称如下图:
我使用以下代码(仅提取一个字段),其中 xpath 是从 chrome 复制的
from lxml import html
import requests
page = requests.get('http://en.wikipedia.org/wiki/List_of_cities_in_China')
tree = html.fromstring(page.text)
huabeiTree=tree.xpath('//*[@id="mw-content-text"]/table[3]/tbody/tr[1]/td[1]/a/text()')
print huabeiTree
什么都没有出现。
我的最终目标是提取列表中的所有城市,请问我该如何实现?
【问题讨论】:
-
你的目标是什么!如果你想获得中国所有的城市,有一个更简单的方法来做到这一点
标签: python python-2.7 xpath beautifulsoup lxml