【发布时间】:2013-01-19 11:43:14
【问题描述】:
我正在尝试使用crawler4j 下载一些网站。我遇到的唯一问题是,即使我在 shouldVisit 函数中为所有 .js 文件返回 true,它们也永远不会被下载。
@Override
public boolean shouldVisit(WebURL url) {
return true;
}
@Override
public void visit(Page page) {
String url = page.getWebURL().getURL();
System.out.println("URL: " + url);
}
.js 文件的 URL 永远不会被打印出来。
【问题讨论】:
标签: java web-crawler crawler4j