【问题标题】:How to parse a downloadable list from a web site?如何从网站解析可下载列表?
【发布时间】:2020-03-28 04:31:36
【问题描述】:

有一个包含<ul> 列表的网站(当您滚动到末尾时会加载该列表)。在 <ul> 的 1800,000 个项目 <li> 中,需要全部解析。我使用Robot 类和mouseWheel 方法,但计算机最多挂起50,000 个。完成时间非常长。 我用方法

public void scrollToEnd() {
        robot.mouseWheel(100000);
    }

有没有更好的解决方案?

【问题讨论】:

    标签: java selenium parsing web-scraping


    【解决方案1】:

    长期使用 Selenium。 mouseWheel() 在某些情况下不起作用。我用这个

    ((JavascriptExecutor) webDriver).executeScript("window.scrollBy(0, -10000)");
    

    因此,您向下滚动并检查您的元素是否可见或可点击,您需要什么

    ExpectedConditions.visibilityOf(webElement)
    

    【讨论】:

    • mouseWheel 工作,但由于大量<li> 浏览器挂起。 ((JavascriptExecutor) webDriver).executeScript("window.scrollBy(0, -10000)"); 不滚动
      • 主要思想是尝试通过js代码滚动,并在每次js执行后检查元素的状态。我有一些案例,当只使用 js 代码时
      猜你喜欢
      • 1970-01-01
      • 2018-04-26
      • 1970-01-01
      • 2017-08-02
      • 1970-01-01
      • 1970-01-01
      • 2015-09-28
      • 1970-01-01
      • 2011-02-08
      相关资源
      最近更新 更多