【问题标题】:How can i extract HTML code from secure URLs (https://)?如何从安全 URL (https://) 中提取 HTML 代码?
【发布时间】:2018-02-12 11:36:49
【问题描述】:

我使用 JSoup 库我没有从安全 URL (https://) 获取完整的 html 内容 因为 URL 将动态获取内容。有什么方法可以获取安全 URL(https://)的确切 HTML 内容。

【问题讨论】:

    标签: javascript java jsoup


    【解决方案1】:

    为了解析完整的内容,您可以使用 Selenium 和 Jsoup。

    WebDriver driver = new ChromeDriver();
    driver.get("https://google.com/");
    Document doc = Jsoup.parse(driver.getPageSource());
    

    或者你也可以等待特定内容加载。如下图:

    public void waitForLoad(WebDriver driver) {
        ExpectedCondition<Boolean> pageLoadCondition = new
                ExpectedCondition<Boolean>() {
                    public Boolean apply(WebDriver driver) {
                        return ((JavascriptExecutor)driver).executeScript("return document.readyState").equals("complete");
                    }
                };
        WebDriverWait wait = new WebDriverWait(driver, 30);
        wait.until(pageLoadCondition);
    }
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-07-27
      • 1970-01-01
      • 2019-03-23
      • 2018-01-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多