【发布时间】:2015-10-14 11:06:01
【问题描述】:
我正在尝试在 java 中制作一个网络爬虫,它获取网页的 URL 并导航到给定网页的源代码中存在的其他页面。问题是,我在 jsoup 的帮助下获取了 HTML 的源代码,其中包含各种标签,如框架和一些 javascript 文件名。现在要导航到其他页面,我需要访问框架和 javascript 文件中给出的 http 链接。我应该如何在列表中获取这些链接。
【问题讨论】:
-
带有 html 解析器。祝你好运!
-
但是我如何获取文件名存在于 html 代码中的 javascript 源代码。
标签: java web-crawler jsoup