【发布时间】:2021-04-03 16:28:31
【问题描述】:
在 Janusgraph 上做一些压力测试,需要加载 est 500 万个顶点和边。使用 faker python 生成假数据,并想知道哪种方法是加载大量数据的最佳方法?我尝试使用控制台加载数据,但得到奇怪的结果和超时。
【问题讨论】:
标签: gremlin janusgraph gremlinpython
在 Janusgraph 上做一些压力测试,需要加载 est 500 万个顶点和边。使用 faker python 生成假数据,并想知道哪种方法是加载大量数据的最佳方法?我尝试使用控制台加载数据,但得到奇怪的结果和超时。
【问题讨论】:
标签: gremlin janusgraph gremlinpython
看起来您正在使用标签中的 Gremlin Python 客户端。一种相当常见的技术是使用多线程(或多进程)Python 应用程序将数据分批发送到图形(可能一次 50 到 100 个addV 或addE)。从您的问题中不清楚您是否使用 Gremlin Server。如果您使用 Gremlin 服务器,您可能需要在 YAML 文件中配置 gremlinPool 参数,以便为您运行它的机器类别提供足够的工作人员。以这种方式加载 500 万个顶点和边应该不会花费太长时间。如果加载顶点和边的总时间不是问题,单个线程一次发送 50 到 100 个批次仍然是相当有效的。
【讨论】: