测试关注:DB设计是否合理,是否可涵盖业务场景。
1. 元数据
什么是元数据:描述数据的数据。
主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
元数据的分类
技术类元数据:
a. 存储类数据:表,表结构等。
b. 计算类型数据:hive的job日志,计算任务,任务调度,日志信息等。
c. 数据质量和运维相关的元数据:如人工监控,运维报警,数据质量,故障等。
业务类元数据:
业务类型或者场景划分大标签
2. 维度表,事实表
DB设计
维度设计
- 选择维度,确定维度
- 确定主维度
- 确定从维度
- 确定维度属性,识别元数据
事实表设计
- 尽可能包含所有业务过程相关的事实
- 只选择与业务过程相关的事实
- 同一张表只可能有一种粒度,且粒度外的其他属性字段要和粒度保持一级
- 单位同意,null值处理