【发布时间】:2018-02-12 11:36:49
【问题描述】:
我使用 JSoup 库我没有从安全 URL (https://) 获取完整的 html 内容 因为 URL 将动态获取内容。有什么方法可以获取安全 URL(https://)的确切 HTML 内容。
【问题讨论】:
标签: javascript java jsoup
我使用 JSoup 库我没有从安全 URL (https://) 获取完整的 html 内容 因为 URL 将动态获取内容。有什么方法可以获取安全 URL(https://)的确切 HTML 内容。
【问题讨论】:
标签: javascript java jsoup
为了解析完整的内容,您可以使用 Selenium 和 Jsoup。
WebDriver driver = new ChromeDriver();
driver.get("https://google.com/");
Document doc = Jsoup.parse(driver.getPageSource());
或者你也可以等待特定内容加载。如下图:
public void waitForLoad(WebDriver driver) {
ExpectedCondition<Boolean> pageLoadCondition = new
ExpectedCondition<Boolean>() {
public Boolean apply(WebDriver driver) {
return ((JavascriptExecutor)driver).executeScript("return document.readyState").equals("complete");
}
};
WebDriverWait wait = new WebDriverWait(driver, 30);
wait.until(pageLoadCondition);
}
【讨论】: