DSO 数据存储对象
1.DSO的用途和功能
DataStore 对象用于在凭证级(基本级)存储合并数据和清除数据(交易数据或主数据)。尽管DataStore 对象可以存储主数据,并且理由充分,但它们主要存储详细的交易数据。DataStore对象定位在整体仓库设计中,如下图所示。它们可用于支持详细的运营报告,也可以是仓库的一部分,用于保存几年内“可能需要的”数据。
2.DSO与CUBE的区别
DataStore 对象与InfoCubes 的一个主要区别是DataStore 对象能够
覆盖记录,而InfoCube 则不能。
DSO:存储明细数据,且数据可支持合计、覆盖;
CUBE:存储汇总后的数据,且数据只支持合计;
DSO常用于存储数据,CUBE用于建立报表;
DSO抽数性能优于CUBE。
3.为什么抽数时要先将数据抽取到DSO中,在将DSO中的数据抽到CUBE中,而不是直接将数据抽到CUBE?
(1)直接抽到CUBE,数据传输很慢;
(2)没法查看明细数据;
(3)DSO可将业务数据分散,数据压力小。
4.DSO的三种类型
(1)标准的standard
三张表 New / Active / Change Log ,保存有Delta 增量的Change Log数据
(2)写优化 Write-Optimized
用于处理大量的数据,只有Active表,数据直接**
(3)直接更新 DirectUpdate
只有Active表,数据通过API的方式直接写入
5.PSA、DSO、InfoCube比较:
PSA 可存储原始源数据,InfoCube 可存储汇总数据,DataStore 对象具有三种类型。
三者协调,集成数据流:
6.DSO后台的三张表
(1)New Data(**队列表)
临时存放更新的数据,**后数据转移到另外的两张表中
(2)ActiveData(活动数据表)
存放了最后**的数据
(3)Change Log(更改日志表)
储存了数据变化的记录
标准的DSO的模式
DSO抽数注意事项:
(1)增加或删除关键字字段前需清空DSO已有数据;
(2)结构修改完成后相关Transformation和DTP需重新**。