【发布时间】:2020-05-01 18:49:32
【问题描述】:
这是我第一次使用 BigTable,我不知道我是否不懂 bigtable 建模或如何使用 python 库。
关于我正在存储的内容的一些背景:
我正在存储时间序列事件,假设有两列名称和消息,我的行键是“#200501163223”,所以行键包含这种格式的时间 '%y%m%d%H%M%S'
假设稍后我需要添加另一个名为“类型”的列。
另外,同一秒可能有两个事件。
如果我存储 2 个事件,这就是我最终得到的结果,而第二个事件具有额外的“类型”数据:
account#200501163223
Outbox:name @ 2020/05/01-17:32:16.412000
"name1"
Outbox:name @ 2020/05/01-16:41:49.093000
"name2"
Outbox:message @ 2020/05/01-17:32:16.412000
"msg1"
Outbox:message @ 2020/05/01-16:41:49.093000
"msg2"
Outbox:type @ 2020/05/01-16:35:09.839000
"temp"
当我使用 python bigtable 库查询这个 rowkey 时,我得到一个字典,其中我的列名作为键,数据作为 Cell 对象的列表
“name”和“message”键有 2 个对象,而“type”只有一个对象,因为它只是第二个事件的一部分。
我的问题是,我怎么知道 temp 的“类型”值属于哪个事件 1 或 2?这个模型是不是错了,我必须确保只有一个事件可以存储在一个很难做到的行键下。或者我在库中是否缺少能够相应地关联事件数据的技巧?
【问题讨论】:
标签: python google-cloud-bigtable bigtable