【发布时间】:2012-04-13 10:23:18
【问题描述】:
在我的一项任务中,我必须制作一个网络爬虫,完全使用 JavaScript。这意味着,输入将是一个 URL,输出将是从该页面开始的所有链接的树。 我使用了使用 YQL 的插件 https://github.com/padolsey/jQuery-Plugins/tree/master/cross-domain-ajax/,它可以获取网站上的所有链接。 (就像我为 Google 主页所做的那样,http://deepakpathak.in/langoor/linkfinder.html)。但是,我无法从中制作树形结构。 有没有其他更简单的方法来制作给定网站的链接树,并且在 Javascript 中?
【问题讨论】:
-
目的是制作站点地图还是什么?
-
@Spoike 不完全是网络蜘蛛,而是站点导航器,用于编辑器,侧边栏上有树形导航。
标签: javascript web cross-domain web-crawler