【问题标题】:Recommendation for database for a search engine推荐用于搜索引擎的数据库
【发布时间】:2012-06-04 21:49:26
【问题描述】:

我正在编写一个搜索引擎,我正在寻找一个数据库来存储我所有抓取的数据,这些数据将用于 URLDatabase 和数据存储。

  1. 应该是基于磁盘而不是基于内存

  2. Java 更可取,因为我的应用程序是在 java 中,所以我可以 轻松嵌入。

  3. 畅销

  4. Linux 和 Windows 的首选。

【问题讨论】:

    标签: database


    【解决方案1】:

    【讨论】:

    • 好的 支持windows吗?
    • 您想在 Windows 上设置 Hadoop 的方式?
    • 我正在阅读它的 wiki 它有一个独立版本 hbase.apache.org/book/standalone_dist.html 。它需要 linux 吗?
    • 您可以尝试在Windows上进行开发,但不推荐作为生产平台
    • 好的,谢谢你,我有一个 ubuntu 盒子,我会在里面试试。
    【解决方案2】:

    我真的很喜欢 Solr,它是 Lucene 上的一个瘦 Java 包装器,它是一个使用非常广泛、性能极好、基于文本的 nosql 数据库(可能是广泛使用的数据库使用)。

    查找匹配项的速度非常快(毫秒响应),您可以在获得结果时对结果进行排序。

    设置起来超级简单,在tomcat下运行,使用普通的旧磁盘文件,在linux和windows下运行,所以它满足你的所有要求。

    我已经在几个项目中使用过它,而且总是很成功。

    【讨论】:

    • 我知道 lucene 和 solr 。我的计划是使用 lucene 作为搜索库并将所有数据存储在数据库中,因此我正在搜索数据库。我想将一些数据与索引分开,所以我更喜欢。
    猜你喜欢
    • 1970-01-01
    • 2017-07-23
    • 1970-01-01
    • 1970-01-01
    • 2010-11-30
    • 1970-01-01
    • 2011-06-06
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多