【发布时间】:2011-04-01 14:30:53
【问题描述】:
我正在构建一个 CSS Optimizer 网站,在此我将提供一个选项,用户提交网站 URL,在后端,服务器将解析该域中的所有 anchors 和 link 标签。因此,这将使网站能够连接 + 压缩 css,这可能在所有不同页面上都是唯一的。
由于我的网站需要anchor (html) 和<link> 我应该怎么做才能避免获取non-html (like .doc, .pdf) 等的链接
【问题讨论】:
标签: php html curl web-crawler