【发布时间】:2016-08-13 19:21:00
【问题描述】:
我在这方面工作了很长时间,并尝试了各种命名空间解决方案。但是,我当前的脚本不是打印所需的字符串,而是打印整个 html 转储。有谁知道如何解决这个问题?
from lxml.html import parse
from lxml import etree
import requests
r = requests.get('https://berlin.kauperts.de/Strassen/Aachener-Strasse-10713-Berlin.html')
tree = etree.parse(r.text)
NSMAP = {'mw':'http://www.w3.org/1999/xhtml/'}
Name2 = tree.xpath('//{http://www.w3.org/1999/xhtml}html/body/div[7]/div/div/div/table/tbody/tr/td[2]/a')
Name3 = tree.find("//html/body/div[7]/div/div/div/table/tbody/tr/td[2]/a")
print(Name2, Name3)
【问题讨论】: