【问题标题】:Load a HTML page including generated HTML加载包含生成的 HTML 的 HTML 页面
【发布时间】:2012-10-13 08:53:02
【问题描述】:

Google 今天似乎让我失望了:我正在寻找一种将远程 html 页面加载到我的 Java 应用程序中的方法。此 HTML 页面包含一些生成大部分内容的 JavaScript。现在我认为用 Java 打开页面并查看 HTML 会相当简单。

当我使用 URL.openStream() 读取文件时,我得到了带有 JavaScript 的 HTML 源代码,而没有生成的 HTML(这是我所期望的)。那么我如何从这个获取包含生成内容的 HTML 源?我认为这会相当简单,但在 Google 上几个小时后,我完全陷入了 Rhino、EnvJs、Jsoup 中,但这并没有真正让我有任何收获。

有人有什么建议吗?

【问题讨论】:

  • 这可能不是最好的解决方案。但是,当您将 HTML 放入 webview 中时,将执行 Javascript 代码。所以你可以再次从 webview 中拉取它。
  • 你需要先用一些 JS 引擎执行 JS 来收集它的输出。

标签: java javascript html


【解决方案1】:

是的,基本上没有简单的解决方案,因为您需要实际呈现页面,因此您需要一个 javascript 引擎(如 feeela 所说)。

一种解决方案是使用 webkit。我没有在 Java 中使用它,而是在 Python 中使用它。你可以看看WebKit browser in Java app on multiple platforms

【讨论】:

    猜你喜欢
    • 2019-01-28
    • 2018-01-09
    • 2016-04-16
    • 2016-01-31
    • 2019-05-22
    • 1970-01-01
    • 1970-01-01
    • 2014-10-19
    • 2016-06-16
    相关资源
    最近更新 更多