【发布时间】:2017-05-17 22:42:46
【问题描述】:
我在 Azure SQL 数据仓库中使用 distribution=hash() 创建了一个表。选择进行散列的列有 1000 个不同的值,表有大约 70 亿行。但是,当我使用 dbcc pdw_showspaceused(') 查看数据分布时,我只能看到 node_id 1 到 10。为什么即使我为散列选择了具有更多不同值的 GUID 列,数据也没有分布在所有 60 个节点上?我可以做些什么来强制系统在所有 60 个节点上分配值?
【问题讨论】: