【问题标题】:Best method to bulk load (5 millions) into Janusgraph将(500 万)批量加载到 Janusgraph 的最佳方法
【发布时间】:2021-04-03 16:28:31
【问题描述】:

在 Janusgraph 上做一些压力测试,需要加载 est 500 万个顶点和边。使用 faker python 生成假数据,并想知道哪种方法是加载大量数据的最佳方法?我尝试使用控制台加载数据,但得到奇怪的结果和超时。

【问题讨论】:

    标签: gremlin janusgraph gremlinpython


    【解决方案1】:

    看起来您正在使用标签中的 Gremlin Python 客户端。一种相当常见的技术是使用多线程(或多进程)Python 应用程序将数据分批发送到图形(可能一次 50 到 100 个addVaddE)。从您的问题中不清楚您是否使用 Gremlin Server。如果您使用 Gremlin 服务器,您可能需要在 YAML 文件中配置 gremlinPool 参数,以便为您运行它的机器类别提供足够的工作人员。以这种方式加载 500 万个顶点和边应该不会花费太长时间。如果加载顶点和边的总时间不是问题,单个线程一次发送 50 到 100 个批次仍然是相当有效的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-01-06
      • 1970-01-01
      • 2014-03-25
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多