【发布时间】:2011-08-12 18:42:54
【问题描述】:
我正在构建一个需要实时索引结果的站点 atm(不是每秒 10,000 个文档,我的意思是毫秒更新)。我去研究不同的技术,最初想出了几十个不同的平台。通过使用推论(文档复杂性、不同类型的支持等),我已经能够将我的选择范围缩小到大约 3 个:
- 朗讯
- 夏片
- 狮身人面像
我最初试图通过使用它们的网站在这两者之间进行选择,但令我惊讶的是,许多知名网站都信任这三个网站。我还发现这三个都允许毫秒级更新。
我最初想到 Sphinx 是因为它是三者中唯一一个说完全实时索引而不是近实时索引,只是发现它仍处于测试阶段(不确定这项技术在实时索引中的可靠性如何)。
我倾向于 lucene,因为当 solr 获得实时索引时,将我的架构移动到 solr 将非常容易。
我也倾向于 Xapian,因为我认识的许多网站都很好地实现了它。
我在选择这些技术以及哪一种最适合时遇到了很大的问题。
我正在查看一个包含数百万甚至数千万记录的网站,需要一个可以实时追加/删除/更新的索引。
谁能分享他们使用实时搜索平台帮助我选择适合我的平台的经验?我愿意接受不在这里的建议:)。
P.S 我使用 MongoDB,所以请不要发布仅限 SQL 的搜索平台 :)。
【问题讨论】:
标签: full-text-search real-time near-real-time