【发布时间】:2009-06-06 14:00:42
【问题描述】:
所以我正在寻找有关如何最好地复制 digg 上的功能的想法。本质上,您提交您感兴趣的页面的 URL,然后 digg 抓取 DOM 以找到所有 IMG 标签(可能只选择一些高于特定高度/宽度的标签),然后从中创建一个缩略图并询问您哪个您想代表您的提交。
虽然那里发生了很多事情,但我主要对从提交的页面检索图像的最佳方法感兴趣。
【问题讨论】:
标签: php image-manipulation web-crawler digg
所以我正在寻找有关如何最好地复制 digg 上的功能的想法。本质上,您提交您感兴趣的页面的 URL,然后 digg 抓取 DOM 以找到所有 IMG 标签(可能只选择一些高于特定高度/宽度的标签),然后从中创建一个缩略图并询问您哪个您想代表您的提交。
虽然那里发生了很多事情,但我主要对从提交的页面检索图像的最佳方法感兴趣。
【问题讨论】:
标签: php image-manipulation web-crawler digg
虽然您可以尝试解析网页 HTML 可能会如此混乱,您最好使用一些接近但不完美的东西。
只需查找并捕获 src="..." 的内容即可。处理相对和绝对图像引用的一些基本操作,你就在那里。
显然,当您从第三方按需获取网络资产时,您需要注意不要被滥用。
【讨论】:
我建议使用 cURL + regexp。
【讨论】:
您也可以使用PHP Simple HTML DOM Parser,这将帮助您搜索所有图像标签。
【讨论】: