【发布时间】:2017-02-09 00:24:14
【问题描述】:
我正在对数据库执行一些基准测试,我想知道是否有任何公开可用的数据集包含超过 1T 行?
我知道 Google Big Query 有一些公开可用的数据集,它们是 100M+(维基百科、gdelt-events)和 1B+(nyc-tlc)行,但找不到更大的数据集。有人知道可以下载的 1T 行数据集吗?
几个参考链接:
【问题讨论】:
-
对一万亿行数据集进行大量处理可能会很昂贵,尤其是如果您不仔细编写查询。在开始之前做一些计算。
标签: sql database database-design google-bigquery amazon-redshift