【发布时间】:2021-03-28 16:02:22
【问题描述】:
我必须处理从大约 50 个不同来源收集和转换的 2500 万行数据。每个来源导致大约 500.000 到 600.000 行。每条记录都有相同的结构,不管来源(比如说:id、title、author、release_date)
为了灵活性,我希望为每个源创建一个专用表,(然后我可以从源中清除/删除数据并非常快速地重新加载/上传数据(使用 LOAD INFILE))。这样,似乎很容易截断表,而不会从其他来源删除行。
但是我不知道如何在不同的表中选择具有相同作者的记录,以及蛋糕上的分页(LIMIT 关键字)。
是将所有内容存储到单个大表中并解决索引/备份 25M+ 数据库的痛苦的唯一解决方案,或者是否有一种抽象层可以将 50 个表虚拟合并为一个虚拟表。
这可能是 dba 的常见问题,但我还没有找到任何答案... 非常感谢任何帮助/想法。谢谢
【问题讨论】:
-
听起来你在描述分区
-
您所描述的是分区。不过,我对 MySQL 的了解还不够,不知道这是否适合您。