【问题标题】:Write a program to save web-page to a computer [closed]编写程序将网页保存到计算机[关闭]
【发布时间】:2015-07-16 12:09:36
【问题描述】:

当我们输入网站链接时,我想编写一个程序来保存网站。什么是最简单的编程语言来做到这一点。我想将整个网站保存到我的计算机上。我知道有办法编写程序来保存网页。但我的要求是保存整个网站。我该怎么做。我只需要一些提示。然后我可以做一些研究并找到解决方案。请帮助我开始我的工作。谢谢。

【问题讨论】:

  • 我们你不想使用下载管理器
  • 当您说要保存网站时?这是任何网站吗?或者这是您可以访问的网站? , 请记住,如果您说任何网站,您只会抓取呈现的 HTML 内容。任何输入和按钮以及其他事件触发器都将不起作用,如果这样做,它们会将您“重定向”到原始站点。这对于静态 html 网站来说非常简单。 Java 将轻松完成您想要的。
  • 是的。我同意你的看法。但我试图做到这一点。感谢您的提示。我会记住你在开发时所说的话。再次感谢您的考虑。

标签: java save local-storage webpage


【解决方案1】:

您尝试创建的实际上是一个下载管理器。在 java 中创建一个简单的下载管理器更容易,但创建一个完整的下载管理器却相当乏味。

它背后的想法很简单。假设您有一个网址为 www.example.com/index.html 的网页。只下载 index.html 很容易。但是要下载域或网站的所有页面。您必须下载 index.html。然后解析 index.html 中域内(即 www.example.com 内)的链接。您需要下载所有链接,然后浏览从链接下载的所有页面并找到更多链接。这一直持续到您解析了所有链接一次。所以本质上你需要阅读一个网页,抓取链接然后下载这些链接。你需要搜索网络爬虫,网页解析等信息。

如果您只是想下载一个网站,请尝试使用 flashget、Internet 下载管理器等软件。曾经有一些开源软件,因此您也可以获得源代码。

请通过以下链接了解更多信息

http://www.9code.in/java-download-manager-with-full-source-code/

http://www.javaworld.com/article/2076095/core-java/download-a-website-for-offline-browsing.html

http://www.programcreek.com/2012/12/how-to-make-a-web-crawler-using-java/

How to get a web page's source code from Java

【讨论】:

  • 这真的很有帮助。我得到了很好的主意。那是我需要的。你的资源真的很有帮助。感谢您的支持和时间。
  • @CharithLakshanWickramasinghe 如果您觉得我的答案令人满意,请点击答案左侧的大勾号将其作为答案。否则,如果您发现它有帮助,请支持答案..这是 stackoverflow 方式跨度>
猜你喜欢
  • 2016-02-11
  • 1970-01-01
  • 2013-07-29
  • 2015-09-09
  • 2021-03-06
  • 2012-12-21
  • 1970-01-01
  • 1970-01-01
  • 2022-01-05
相关资源
最近更新 更多