【问题标题】:How to decide on dimension fields type如何确定维度字段类型
【发布时间】:2016-08-30 12:15:27
【问题描述】:

在构建多维数据集时,选择维度字段类型有哪些注意事项,例如客户编号应该定义为字符串还是数字?

谢谢, 迈克尔

【问题讨论】:

标签: sql sql-server database data-warehouse cube


【解决方案1】:

如果客户编号是数字,它应该是数字,有多种类型,最好的起点是。 http://www.w3schools.com/sql/sql_datatypes_general.asp 然后返回特定查询或测试并构建基础并显示代码/构建。

【讨论】:

  • 我的意思是笼统地说。对于一个只包含数字的维度字段,我对他的类型漠不关心(它是一个维度,因此我不会对他进行任何“数字”计算,比如 sum、avg 等......)。为此类字段选择类型是否有“最佳实践”?
  • 我假设因为您创建一个多维数据集是为了报告需求,然后我将假设它非常灵活,因为来自业务的需求将不断出现。因此,我会将任何数字设为数字。现在你可能知道你的立方数据将如何被使用,但一两个月或六个月后你就不会了。
  • 阅读 Ralph Kimball 的“数据仓库工具包”。它几乎是数据仓库/多维数据集构建的圣经,被认为是“最佳实践”
【解决方案2】:

我通常将所有内容都以字符串格式。日期特别。今天,您的客户编号是一个数字。但是明天如果有人更改源系统和业务决策,它可能会变成一个字符串。因此,我通常会尝试将数据仓库结构设置为尽可能适应业务变化,同时所需的数据仓库更改量最少。

然后我会寻找一个数据验证流程来确保客户编号是一个数字,然后如果业务发生变化,我可以简单地关闭该数据验证流程,而无需更改我的数据库结构或依赖于数据类型的 BI。

但我还要说这里没有“正确”的答案。这是一个工程决策,无论你往哪个方向走,都有优点和缺点。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-07-07
    • 2014-08-29
    • 1970-01-01
    • 1970-01-01
    • 2012-06-09
    相关资源
    最近更新 更多