【问题标题】:Scrape BSCScan Token Holdings PageScrape BSCScan 代币持有页面
【发布时间】:2021-06-13 12:34:34
【问题描述】:

我正在尝试从此页面获取数据

https://bscscan.com/tokenholdings?a=0xFAe2dac0686f0e543704345aEBBe0AEcab4EDA3d

但网站所有者并未为此目的提供端点 API。所以我尝试用不同的方式来实现它:

-使用 DRYSCRAPE,但图书馆似乎被遗弃了;

-使用请求,但数据由 javascript 动态提供;

-使用请求 HTML,但即使在这种情况下,似乎也没有加载数据。

我想忽略 selenium,因为它很慢,但我不知道如何解决这个问题。任何人都有可行的解决方案?我需要的数据是包含钱包代币的表格。感谢您的建议,祝您有美好的一天。

【问题讨论】:

    标签: web-scraping binance python-requests-html bscscan


    【解决方案1】:

    你可以用requests-html来做,比如我们抓取第一行的符号:

    from requests_html import HTMLSession
    
    session = HTMLSession()
    
    url='https://bscscan.com/tokenholdings'
    token={'a': '0xFAe2dac0686f0e543704345aEBBe0AEcab4EDA3d'}
    
    r = session.get(url, params=token)
    r.html.render(sleep=2)
    
    binance_row = r.html.find('tbody tr', first=True)
    symbol = binance_row.find('td')[2].text
    
    print(symbol)
    

    输出:

    BNB
    

    【讨论】:

    • 太棒了,你能说明我如何逐行获取表格上的所有元素吗?谢谢。
    猜你喜欢
    • 2021-10-16
    • 1970-01-01
    • 2022-08-19
    • 1970-01-01
    • 2023-02-03
    • 2021-07-13
    • 1970-01-01
    • 2019-07-03
    相关资源
    最近更新 更多