【发布时间】:2010-11-03 07:06:02
【问题描述】:
以下是事实:
- 我们每天都会收到大量 (L O T) 数据。
- 我们收到的每个文件都是 csv 格式,虽然有几个标头比其他标头更频繁地出现,但并没有真正的标准。
- 要上传到 mySQL 数据库的每个文件的规范化非常耗时,并且经常促使我们更改架构(文件中出现了以前不存在的新字段..)。
- 虽然主键是唯一的,但其他任何内容都可以复制
- 这些是客户记录(即:电子邮件、名字、姓氏、城市、州、地址...等)
- 我们可以为同一个人发送多封电子邮件..
- 我们有 70% 的时间读取,30% 的时间写入
- 可扩展性可能是一个问题,但现在不是,尽管可用性是关键
- 速度是我们所追求的。 Mysql 太慢,无法回答表超过 5000 万条记录的查询。即使优化得很好,我们也有太多的速度问题。分解表格已成为组织关注的问题。少架构的 noSQL 似乎很有吸引力。你会推荐什么,你实施了什么? (请不要回答优化mysql ..毫无意义和离题)
--
【问题讨论】:
-
为什么在 50+ 百万行这么少的情况下,您的查询要花这么长时间?你能发布更多信息吗???
-
我已经使用了超过 3 亿条记录的表,而且速度非常快!我认为您的索引或查询有问题。另请注意,如果禁用所有事务性内容,MySQL 会快得多。我们使用它来编译它,但我认为某些表格格式可能会这样做。