【问题标题】:Python xpath tree returning pointerPython xpath 树返回指针
【发布时间】:2020-11-27 10:07:49
【问题描述】:

我正在尝试抓取所有翻译(语言)的名称,但 XPath 树总是返回一些不可用的指针,我想我根本无法使用。这是网站:https://en.wikipedia.org/wiki/Bratislava

import requests
import lxml.html

page = requests.get('https://en.wikipedia.org/wiki/Bratislava')
tree = lxml.html.fromstring(page.content)
lang = tree.xpath('//*[@id="p-lang"]/div/ul')
print(lang)

感谢您的帮助。

【问题讨论】:

    标签: python html parsing xpath


    【解决方案1】:

    代替

    print(lang)
    

    返回元素列表使用

    print(lang[0].text_content())
    

    获取第一个元素的文本内容

    或者您可以将所有语言逐一打印:

    import requests
    import lxml.html
    
    page = requests.get('https://en.wikipedia.org/wiki/Bratislava')
    tree = lxml.html.fromstring(page.content)
    lang = tree.xpath('//*[@id="p-lang"]/div/ul')
    
    
    for item in lang[0].itertext():
        print(item)
    

    【讨论】:

      猜你喜欢
      • 2021-11-30
      • 1970-01-01
      • 2013-04-10
      • 1970-01-01
      • 1970-01-01
      • 2018-05-30
      • 2012-05-16
      • 1970-01-01
      • 2014-08-02
      相关资源
      最近更新 更多