【发布时间】:2013-04-29 01:00:46
【问题描述】:
我运行一个工作委员会 (PostJobFree.com),其中包含大约 100 万份简历。平均简历大小约为 4000 字节。 PostJobFree 使用 ASP.NET/C#/SQL Server 2008 R2 和 MS SQL 全文搜索。
通过阅读各种文章,我相信切换到 Apache Lucene 搜索将使搜索更快、更具可扩展性。但我还没有尝试过。
问题 1:在大约 1M 文档标记处从 MS SQL 全文搜索切换到 Apache Lucene 是正确的选择,还是我不会注意到搜索速度显着提高? 我预计我的数据库中可搜索文档的数量每月增长约 10%。
问题 2:最好的 Lucene 平台是什么:Solr 还是 ElasticSearch?
这是我目前发现的:
1.谷歌搜索趋势 http://www.google.com/trends/explore#q=elasticsearch%20search%2C%20solr%20search%2C%20sphinx%20search%2C%20%22sql%20server%22%20%22full-text%20search%22&cmpt=q 截至目前(2013 年 4 月)
- Solr 似乎是目前最流行的搜索平台, 但是 Solr 的受欢迎程度在去年(2012 年 4 月)根本没有增长 – 2013 年 4 月)。
- ElasticSearch 从 2010 年底,但仍然只有 Solr 的 40% 左右。
- Sphinx 搜索在 2006-2009 年越来越受欢迎,并且从 2009 年。现在它和 ElasticSearch 一样流行。
- SQL Server 全文搜索长期处于下降趋势。
这些趋势是否与这些搜索平台的质量相关?
2。过去的 StackOverflow 问题
StackOverflow 在 2010 年 2 月有搜索平台比较问题:ElasticSearch, Sphinx, Lucene, Solr, Xapian. Which fits for which usage?
其创建者 Shay Banon 的“ElasticSearch”答案在当时是最受欢迎的。
2012 年晚些时候提出了类似问题:Solr vs. ElasticSearch
最受欢迎的答案再次支持 ElasticSearch。
3.其他
Nick Zadrosny(同时运行 Solr 托管服务 websolr.com 和 ElasticSearch 托管服务 bonsai.io)是 2012 年 4 月 ElasticSearch 的支持者: https://news.ycombinator.com/item?id=3833735
这是尼克今天(2013 年 4 月)的回答:
相比起来,Elasticsearch 确实对初学者更友好一些 索尔。 Elasticsearch 有一个更好的 API 并且肯定更容易设置 并配置新应用程序。也就是说,Solr 还有一些 在成熟度和稳健性以及学习曲线方面的优势 当你不需要担心生产时,它不会太不合理 配置。除此之外,两者都在 Lucene 中具有相同的根源,并且 提供类似的功能。两者都应该同样适用于 你的需求。
我想知道“稳健性”究竟是什么意思,以及未来几年这种稳健性差异会如何变化?
4.渗透
ElasticSearch 具有渗透功能,可以让我实现即时交付的简历搜索警报。 Solr 有这样的东西吗?
【问题讨论】:
标签: c# solr lucene full-text-search elasticsearch