【发布时间】:2014-04-10 12:12:47
【问题描述】:
我创建了一个独立的链接爬虫脚本,用于使用以下脚本 http://phpcrawl.cuab.de/example.html 在站点中查找损坏的链接。
抓取链接可以正常工作。但它也会检查外部链接及其内容页面 url。但是这个过程不需要只检查内部链接,内部链接的内容页面url和外部链接。不想检查外部链接内容页面 url。 所以我需要禁用对外部链接的内容页面 url 及其 imge src 的检查。 只检查外部链接是否损坏。不要检查该链接的内容页面网址。
【问题讨论】:
标签: php web-crawler