【发布时间】:2017-02-26 13:35:15
【问题描述】:
问题。我需要从 Mongodb 读取文档,500M 文档,分片到 10 个分片。
我现在最大的问题是速度。
假设我的速度将提高 10 倍,我已分别连接到每个分片并将每个分片作为单独的任务读取。
它有点快,但仍然不够快。
有什么提高速度的建议吗?
注意:我正在从光标处逐个文档读取。 尽量不要降低内存占用。 现在需要
26 秒可在 1 个分片上处理超过 100K 的文档 10 个分片上超过 100 万个文档需要 4.5 分钟
所以从这里开始,看起来需要 37.5 小时才能超过 500M。
有人处理过速度优化问题吗?
【问题讨论】:
标签: mongodb performance pymongo