【问题标题】:What are the factors to consider while choosing a Graph DB for about 30 TB data为大约 30 TB 的数据选择 Graph DB 时要考虑哪些因素
【发布时间】:2016-12-09 02:16:57
【问题描述】:

我正在开发一个软件系统(图形数据库)来研究多个组件之间的互连。它最终可能会产生大约 30 TB 的数据。我想知道在选择正确的数据库时要考虑的所有因素。

我正在寻找的一些选项是 Apache Giraph、TitanDB。我也想知道像 neo4j 或 OrientDB 这样的小规模数据库本身是否可以工作

【问题讨论】:

    标签: graph neo4j titan giraph


    【解决方案1】:

    这是一个非常广泛的问题,因此我会准确定义您要查找的内容,因为尺寸可能有点模糊。

    我认为您提供的任何示例图形数据库都可以对这么大的数据进行建模。

    您可以问自己一些“更详细”的问题,包括:

    1. 你关心Horizontal Scaling 吗? 如果是,那么您应该查看 TitanDB、OrientDB 或 DSE Graph,因为 Neo4J(在撰写本文时)不会水平扩展,因此受到服务器大小的限制。
    2. 标准化语言查询/遍历语言是否重要? 如果是的,那么也许您应该更多地关注 Tinkerpop 供应商,例如 TitanDB、OrientDB、DSE Graph 等。如果没有,那么任何选项都适合您。
    3. 我的数据有超级节点吗? 如果是,那么您应该了解每个供应商如何处理超级节点。一些供应商shard,其他供应商使用巧妙的图分区算法。
    4. 您需要多少支持? 如果您需要很多,那么也许您应该考虑强大的企业解决方案,例如 DSE、OrientDB 或 Neo4J。 Neo4J 目前被认为是最流行的图形数据库,并且拥有庞大的支持基础。
    5. 您想使用开源软件吗? 如果是,那么 TitanDB、Neo4j 或 OrientDB 可能适合您

    这些只是您在所有供应商之间做出更好决定时可以考虑的一些因素。 注意:您可以考虑许多其他供应商,Blazegraph、HypergraphDB 等等。

    【讨论】:

    • Neo4j 也是开源的。 GPLv3
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-12-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多