【问题标题】:Using the email as primary key in Cassandra, best practices?在 Cassandra 中使用电子邮件作为主键,最佳实践?
【发布时间】:2014-06-20 16:50:06
【问题描述】:

我们正在开发一个 Web 应用程序,我们希望使用电子邮件作为主键,以便我们可以使用轻量级事务来避免人们使用同一电子邮件进行注册。但是我们遇到了为用户配置文件生成 URL 的问题。我们不能使用 URL 中的电子邮件。

我们一直在考虑对他的电子邮件进行哈希处理(例如使用 bcrypt)并将其用作主键,这样 URL 就不会暴露他的电子邮件。这是一个好习惯吗?

其他解决方案涉及为用户信息使用多个表,但这使得避免电子邮件重复的过程更加复杂。

有什么建议吗?

编辑:虽然给出了一些,但也许有一个解决方案。使用标准 UUID 作为主键,然后在 email 列上使用带有主键的第二个表 email_to_uuid。当新用户注册时,我们生成一个 UUID 并执行轻量级事务,在 email_to_uuid 中插入一个新值(如果不存在)。之后,我们使用电子邮件读取表,如果 UUID 是我们刚刚生成的,那么我们获得了正确的用户注册,可以继续将数据插入主表中。这种方法听起来正确吗?

【问题讨论】:

  • 您的编辑展示了一个可行的解决方案和一个非常好的使用模式。

标签: cassandra


【解决方案1】:

这是 Cassandra 中的一种:有两种方法可以做到这一点。您可以将电子邮件用作 Primary Key 并将其编码到 URI 中,例如使用 BASE64。这样电子邮件是不可变的,只能删除并重新插入才能更改。

另一种方法是使用人工主键,例如您的 BCrypt、哈希、TIMEUUIDUUID,并在电子邮件列中添加 IndexClustering Column

您选择的方式将决定您的应用程序的灵活性和性能。如果您可以放松灵活性或希望此表中的数据更少,您可以使用第一种方式并编码 URI;如果更改电子邮件很重要,您可以考虑使用人工Primary Key。任何一种解决方案都有其优点:完全取决于您最喜欢什么。

【讨论】:

  • 我认为第二个选项并不是一个很好的选项,因为在电子邮件上使用索引(高基数)是anti-patern
  • 你完全正确。最好将其用作分区键或某些标识符。由于集群列类似于索引,因此在查询您的帐户时最好使用电子邮件或任何唯一标识符。感谢您的评论:记住这一点很重要。
猜你喜欢
  • 1970-01-01
  • 2010-11-19
  • 2011-07-08
  • 1970-01-01
  • 2011-02-16
  • 2015-10-24
  • 1970-01-01
  • 2012-06-27
  • 1970-01-01
相关资源
最近更新 更多