【发布时间】:2011-04-08 03:38:33
【问题描述】:
我正在寻找一个无方案的数据库来在磁盘上存储大约 10[TB] 的数据,理想情况下,使用 python 客户端。建议的解决方案应该可以免费用于商业用途,并且具有良好的读写性能。
这里的主要目标是存储时间序列数据,包括由time stamp 访问的超过十亿条记录。
数据将存储在以下方案中:
KEY --> "FIELD_NAME.YYYYMMDD.HHMMSS"
值 --> [v1, v2, v3, v4, v5, v6](v1..v6 只是floats)
例如,假设:
FIELD_NAME = "番茄"
TIME_STAMP = "20060316.184356"
值 = [72.34, -22.83, -0.938, 0.265, -2047.23]
考虑到FIELD_NAME 和TIME_STAMP 的组合,我需要能够检索VALUE(整个数组)。
查询 VALUES["TOMATO.20060316.184356"] 将返回向量 [72.34, -22.83, -0.938, 0.265, -2047.23]。数组的读取应该尽可能快。
然而,我还需要一种在数组中存储(就地)标量值的方法。假设我想将时间戳2006/03/16.18:43:56 上TOMATO 的第一个元素分配为500.867。在这种情况下,我需要有一个快速的机制来做到这一点——比如:
值["TOMATO.20060316.184356"][0] = 500.867(这将在磁盘上更新)
MangoDB 这样的东西可以工作吗?我将只使用一台机器(无需复制等),运行 Linux。
澄清:只有一台机器将用于存储数据库。然而,我需要一个解决方案,允许多台机器连接到同一个数据库并更新/插入/读取/写入数据。
【问题讨论】:
-
抱歉您的问题描述不佳...10 TB 的数据究竟意味着什么?大文件?很多行?与耐用性相关的要求?...慢慢来,提供您真正想要的确切事实。
-
@RestRisiko:我编辑了我的问题。谢谢你的帮助。
标签: python linux mongodb database nosql