【发布时间】:2016-03-19 08:24:18
【问题描述】:
我有大约 100K 组表,它们是 2,3 或 4 列。每个表大约有 5-10 行数据。但是每一列都有自己唯一的列名和数据类型。这是 100K 表列名中的 6 个示例,大约 10 行。
物业名称 |默认类型 |说明 |参考
类型 |物业 |说明 |参考
代码 |说明 |参考
价值 |参考
类型 |说明 |参考
号码 |说明 |参考
此时所有内容都存储在 100K html 文件中,但我想将它们存储在数据库中。我想知道是否有人对如何用尽可能少的表存储它们有任何建议。
当时正在考虑的解决方案是:
- 创建大约 100K 表(最后一个解决方案)
- 有三组表,4+1col、6+1col 和 8+1col,并使用奇数列作为列标题,偶数列作为值。每行都引用了一个外键,该外键指定此数据的位置。查询他们 bashed 列名和外键可以检索我的数据。
我想知道是否有人对此有更好的解决方案?
【问题讨论】:
-
列集在 100k 个文件中真的是唯一的吗?无论哪种方式,这些数据都不是很结构化,因此将其存储在 100k rdbms 表中将非常疯狂。
-
通过一些“相似”表结构示例对您存储的数据进行进一步解释,这将有助于确定您是否可以减少表的数量。
-
不同列名的总数是多少,你看过吗?我的意思是,如果数据是完全非结构化的,如果它碰巧进入数据库,你能用它做些什么有用的事情?需要告诉我们更多关于有什么结构的信息
-
能否请您展示一些带有数据的表格?我无法想象,这种方法是最好的解决方案......
-
您可能希望将这些组合到较少数量的表中。如果您连接到具有这么多表的服务器,任何数据库管理工具都会在某个时候崩溃并死掉。考虑适当的数据规范化,还可以查看更多无模式选项,例如 Postgres 和 JSON 数据列。
标签: mysql sql-server database database-design architecture