【问题标题】:Python xpath tree returning pointerPython xpath 树返回指针
【发布时间】:2020-11-27 10:07:49
【问题描述】:
我正在尝试抓取所有翻译(语言)的名称,但 XPath 树总是返回一些不可用的指针,我想我根本无法使用。这是网站:https://en.wikipedia.org/wiki/Bratislava。
import requests
import lxml.html
page = requests.get('https://en.wikipedia.org/wiki/Bratislava')
tree = lxml.html.fromstring(page.content)
lang = tree.xpath('//*[@id="p-lang"]/div/ul')
print(lang)
感谢您的帮助。
【问题讨论】:
标签:
python
html
parsing
xpath
【解决方案1】:
代替
print(lang)
返回元素列表使用
print(lang[0].text_content())
获取第一个元素的文本内容
或者您可以将所有语言逐一打印:
import requests
import lxml.html
page = requests.get('https://en.wikipedia.org/wiki/Bratislava')
tree = lxml.html.fromstring(page.content)
lang = tree.xpath('//*[@id="p-lang"]/div/ul')
for item in lang[0].itertext():
print(item)