【发布时间】:2012-10-13 08:53:02
【问题描述】:
Google 今天似乎让我失望了:我正在寻找一种将远程 html 页面加载到我的 Java 应用程序中的方法。此 HTML 页面包含一些生成大部分内容的 JavaScript。现在我认为用 Java 打开页面并查看 HTML 会相当简单。
当我使用 URL.openStream() 读取文件时,我得到了带有 JavaScript 的 HTML 源代码,而没有生成的 HTML(这是我所期望的)。那么我如何从这个获取包含生成内容的 HTML 源?我认为这会相当简单,但在 Google 上几个小时后,我完全陷入了 Rhino、EnvJs、Jsoup 中,但这并没有真正让我有任何收获。
有人有什么建议吗?
【问题讨论】:
-
这可能不是最好的解决方案。但是,当您将 HTML 放入 webview 中时,将执行 Javascript 代码。所以你可以再次从 webview 中拉取它。
-
你需要先用一些 JS 引擎执行 JS 来收集它的输出。
标签: java javascript html