【发布时间】:2012-03-23 22:44:58
【问题描述】:
我正在尝试将 HTML 网站的完整源代码加载到 Java 中的 String 中。我尝试了几种方法,但是,我得到了几乎所有的源代码。更糟糕的是:我没有得到的主要部分之一是我最需要的部分!
【问题讨论】:
-
我们对您表示同情,但在您向我们展示您的代码并更详细地解释您未收到的内容的性质之前,您不会得到太多其他信息。
-
向我们展示您到目前为止所做的工作并更详细地解释。?
-
HTML 网站是否公开可用?如果可以,能发个链接吗?
-
联系网站的作者并询问他们的来源。说真的,您指的是 HTML 源代码还是 HTML 网站的源代码?
-
如果您需要的代码是动态创建的,使用 DOM 操作,那么您实际上需要 Javascript 引擎来生成它。 Vanilla Java 无法做到这一点。
标签: java html web-scraping