【发布时间】:2013-02-11 17:43:36
【问题描述】:
我有一个关于设置表以处理我每天导入的大量数据的最佳方法的一般性问题。 我将每天导入 10 个包含 1000 条记录的 csv 文件,以便此表快速扩展。
它由大约 15 列组成,范围从微型和中等整数到 30 个字符的 varchar。
没有 ID 字段 - 我可以连接 6 列来形成一个主键 - 这将是一个 var char 总长度约为 45。
导入后,我需要通过 Web 前端在摘要级别报告此数据,因此我发现自己必须在导入后从中构建报告表。
在这些数据中,许多字段在每天导入时都会重复出现 - 日期、地区、客户等,每天只有一半的列是特定于记录的。
问题:
- 我是否应该立即将其全部导入到一个表中作为转储表。
- 我是否应该通过导入过程转换数据并将导入拆分到不同的表中
- 我是否应该根据列形成一个 id 字段,以便在导入期间获得唯一键
- 我应该为此使用 auto inc id 字段吗?
- InnoDB 等应该是什么样的表
我担心此表上的数据过载,这会使得在构建时提取到报告表变得越来越困难?
建议真的很有帮助。谢谢。
【问题讨论】:
标签: mysql