【发布时间】:2010-12-15 07:07:21
【问题描述】:
我真正想做的是弄清楚 BEEMP3.COM 是如何工作的。
由于网站的速度,我怀疑他们会当场抓取其他网站/资源。 他们可能使用某种数据库(PostgreSQL 或 MySQL)来存储“结果”,然后只查询搜索词。
我的问题是你们认为他们是如何抓取/蜘蛛或实际获取 mp3 文件/内容的? 他们必须有一些算法来蜘蛛互联网或使用谷歌的 mp3 索引技巧来查找具有原始 mp3 文件的主机。
感谢任何 cmets 和提示或想法 :)
【问题讨论】:
标签: php mysql indexing mp3 web-crawler