Scrape BSCScan 代币持有页面答案

【问题标题】：Scrape BSCScan Token Holdings PageScrape BSCScan 代币持有页面
【发布时间】：2021-06-13 12:34:34
【问题描述】：

我正在尝试从此页面获取数据

https://bscscan.com/tokenholdings?a=0xFAe2dac0686f0e543704345aEBBe0AEcab4EDA3d

但网站所有者并未为此目的提供端点 API。所以我尝试用不同的方式来实现它：

-使用 DRYSCRAPE，但图书馆似乎被遗弃了；

-使用请求，但数据由 javascript 动态提供；

-使用请求 HTML，但即使在这种情况下，似乎也没有加载数据。

我想忽略 selenium，因为它很慢，但我不知道如何解决这个问题。任何人都有可行的解决方案？我需要的数据是包含钱包代币的表格。感谢您的建议，祝您有美好的一天。

【问题讨论】：

标签： web-scraping binance python-requests-html bscscan

【解决方案1】：

你可以用requests-html来做，比如我们抓取第一行的符号：

from requests_html import HTMLSession

session = HTMLSession()

url='https://bscscan.com/tokenholdings'
token={'a': '0xFAe2dac0686f0e543704345aEBBe0AEcab4EDA3d'}

r = session.get(url, params=token)
r.html.render(sleep=2)

binance_row = r.html.find('tbody tr', first=True)
symbol = binance_row.find('td')[2].text

print(symbol)

输出：

BNB

【讨论】：

太棒了，你能说明我如何逐行获取表格上的所有元素吗？谢谢。