【发布时间】:2019-01-20 18:14:52
【问题描述】:
我正在尝试编写一个 python 程序来解析以下页面并提取 card sub-brand 和 brand 给定 card bin#: https://www.cardbinlist.com/search.html?bin=371793。 以下代码 sn -p 检索卡类型。
page = requests.get('https://www.cardbinlist.com/search.html?bin=371793')
tree = html.fromstring(page.content)
print("card type: ", tree.xpath("//td//following::td[7]")[0].text)
但是,不确定如何使用与给定类似的逻辑来获得 品牌
<th>Brand (Financial Service)</th>
<td><a href="/AMEX-bin-list.html" target="_blank">AMEX</a></td>
然后
tree.xpath("//td//following::td[5]")[0].text
不返回任何内容。
【问题讨论】:
-
充分了解“lxml”和/或“tree.path”来尝试自己解决问题;如果遇到问题,请返回 SO 寻求帮助。
-
xpath是/html/body/div/div/div[3]/table/tbody/tr[8]/td
标签: python html web-scraping