【问题标题】:Auto Generate Key in DynamoDB using Django (Python)使用 Django (Python) 在 DynamoDB 中自动生成密钥
【发布时间】:2015-07-11 01:37:52
【问题描述】:

我在我的项目中使用 NoSQL DynamoDB。如何自动生成可用于查询的密钥?

 DynamoDB_view(tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id):
    print "in func DynamoDB_view"
    def insert_to_dynamo(conn, tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id):
        print "in Insert"
        print tableName
# uswd the data as random key generation just for now. this is inappropriate
        data = str(uuid.uuid4().get_hex()[0:16]) 
        table = conn.get_table(tableName)
        item_data = {
        'campaign_id': str(campaign_id),
        'tag_id': tag_id,
        'tag_type': tag_type,
        'app_id' : app_id,
        'group_id' : str(group_id),
        'group_p' : group_p,
        'tenant_id' : str(tenant_id),
        'insertion_timestamp' : str(datetime.now()),
        'insertion_user_id' : str(insertion_user_id)
        }
        item = table.new_item(
        # Our hash key is 'forum'
        hash_key=data,
        
        range_key='Check this out!',
       
        attrs=item_data
        )
        item.put()
    def connection_dynamo(tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id):
   
        conn = boto.dynamodb.connect_to_region(
        'us-east-1',
        aws_access_key_id=settings.ACCESS_KEY,
        aws_secret_access_key=settings.PASS_KEY)    

        insert_to_dynamo(conn,tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id)
        
    
    connection_dynamo(tableName, campaign_tag_app_group_map_id, campaign_id,
                      tag_id, tag_type, app_id, group_id, group_p, tenant_id,
                      insertion_timestamp, insertion_user_id)
   

【问题讨论】:

    标签: python django amazon-web-services amazon-dynamodb


    【解决方案1】:

    这里是一些文档的链接:

    http://docs.aws.amazon.com/amazondynamodb/latest/developerguide/QueryAndScan.html

    对于查询,您必须提供哈希键并且必须检查是否相等。如果您有一个范围键,它是可选的,您可以使用它们执行更广泛的操作,而不仅仅是相等。出于性能考虑,您不希望哈希键使用“热键”(始终使用相同的键)。

    很多答案归结为您在进行查询时手头有什么,以及您是否需要担心这种杀戮性能。自动生成随机的东西会让你免于热键问题,但是当你返回查询数据时,你可能无法重现这些值(即使你总是为 RNG 使用相同的种子,你的头可能会在之前爆炸你得到你想要的哈希键)。这可能会迫使您进行扫描而不是查询,这通常是不可取的。

    在查询时,您是否有任何可用的campaign_id、group_id、tenant_id 等字段?如果答案是肯定的,那么您至少有一些哈希键的候选者。例如,您仍然应该考虑表中有多少数据,以及其中有多少具有相同的 group_id。如果您在查询时同时拥有 group_id 和tenant_id 并且tenant_id 值的多样性更多,请使用它们。如果这有助于在数据中传播,您还可以组合两个 ID 来创建您的键值。

    如果您只有 group_id 并且只有少量组,则在 group_id 的末尾附加一些随机性以避免热键对您没有帮助。从执行查询的角度来看,您将回到同样的情况,即您拥有一堆基本上无法恢复的密钥。在这种情况下,也许最不痛苦的事情是为每个 group_id 设置一个表,使用完全随机的键以实现良好的传播,并接受您的数据强制您进行扫描。

    如果您可以获得一个好的哈希键,那么您最常见的查询可能会决定您选择范围键。因此,如果您通常查询过去 24 小时内的记录,则 insert_timestamp 可能是一个不错的选择。如果其他一些因素进入大量查询,请改用它,例如如果您将查询结果限制为某些活动,并且这些活动没有完全随机的名称。或者,如果您有 3 个依赖于不同范围/条件的常见查询,那么您可能需要添加一些本地二级索引 (Difference between local and global indexes in DynamoDB)。

    回到您可能要问的问题,如果您在查询数据时没有任何东西,那么您可能会被搞砸,您可能需要进行扫描才能返回你的数据。在这种情况下,为您的哈希键使用尽可能随机的东西至少对您的写入有好处,并确保您的数据分布良好。

    抱歉,这有点杂乱无章,希望里面有一些有用的东西。如果我完全误解或有其他未说明的限制,请编辑您的问题以反映它。

    【讨论】:

      猜你喜欢
      • 2013-05-28
      • 1970-01-01
      • 2017-08-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-08-19
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多