【问题标题】:Can RethinkDB handle large data sets (TB+) and serve as DB for an OLAP app?RethinkDB 可以处理大型数据集 (TB+) 并用作 OLAP 应用程序的数据库吗?
【发布时间】:2013-12-02 17:21:39
【问题描述】:

RethinkDB 能否有效处理大型数据集(即多个 TB 字节)以用作分析应用程序的数据库?

【问题讨论】:

    标签: bigdata olap rethinkdb


    【解决方案1】:

    免责声明:我是 RethinkDB 的创始人之一。抱歉,回答冗长 - 这个问题非常微妙。

    RethinkDB 采用非常灵活的架构设计。该架构可以从小型实例扩展到具有大量数据(绝对 TB+)的大型集群,并有效地运行各种查询(OLTP、OLAP 等)

    但是,实际上,我们目前专注于系统的实时方面——我们目前所做的大部分优化都是围绕在 RethinkDB 之上构建的实时应用程序的需求。这些通常是 OLTP-ish 工作负载。我们绝对会优化 OLAP 风格的工作负载,但这不是当前的首要任务。

    了解 Rethink 是否适合您的最佳方法是试一试,并进行一些负载测试。您应该能够很快发现事情的运作情况。 (如果您遇到问题并且碰巧遇到问题,请告知我们 - 我们很乐意帮助您解决任何潜在问题)。

    【讨论】:

    • 感谢您的帮助!您所知道的生产中最大的 RethinkDB 是什么?这是在一位数的 TB 范围内,还是您会说它高于该范围?
    • 我也面临同样的问题。我有一个包含数十亿个条目的表,所以我假设它肯定至少有几个 GB。就我而言,启动有点慢。您需要非常小心二级索引。你建议 rethinkdb 使用什么负载测试工具?
    • 嗨,现在 Rethink 已经成熟了,你可以考虑发布一个新的答案吗?
    • 您好,由于 RethinkDB 更加成熟,因此非常有兴趣了解更多关于 RethinkDB 关于大型数据集 (1-10TB) 的分析功能。
    • @coffeemug 非常感谢您的友好回答,但我真的很想知道如何通过简单的查询来处理大量数据以及我应该注意哪些事项以及哪些事项我应该在创建索引时考虑以及如何确定索引字段?我用一个句子问了你很多问题,我已经准备好了你的 RethinkDB 文档,但不知何故不清楚,无法理解和解决我的问题。
    猜你喜欢
    • 2012-10-10
    • 1970-01-01
    • 2014-09-30
    • 1970-01-01
    • 2011-06-24
    • 1970-01-01
    • 1970-01-01
    • 2021-11-14
    • 1970-01-01
    相关资源
    最近更新 更多