公司内部会定期举办一些技术、理念上的分享,上周我司的电商部分负责人做了关于数据治理主题的分享。
说实话和电商没什么关系,我也不懂他为什么分享这个,可能是兴趣使然吧。
总的来说讲的比较偏理论。
不过我对大数据方面着实不感兴趣。
在之前的公司负责部门所有数据同步,后来副总问我愿不愿意带队做公司的大数据、数据仓库,后来我想了一下就拒绝了。
一方面是我对大数据的技术栈不了解,而且说实话老东家即使做这种事情也不会有什么很高的要求,可能仅仅是部署两个RDS再加一个ETL工具包,美其名曰:数据仓库。
另一方面,在这种无需技术的背景下,那么工作的实质是对数据规范的修正和管理,确保数据仓库的有清晰、统一、兼容、可持续的数据模型。从这个角度出发的话,实际上所谓的大数据是个“苦力活”。
这里大致记录一下分享中涉及的内容吧。
定义
IBM 对于数据治理的定义是,数据治理是一种质量控制规程;用于在管理、使用、改进和保护组织信息的过程中添加新的严谨性和纪律性;
DGI 则认为,数据治理是指在企业数据管理中分配决策权和相关职责;
数据治理从本质上看就是对一个机构(企业或政府部门)的数据从收集融合到分析管理和利用进行评估、指导和监督(EDM)的过程,通过提供不断创新的数据服务,为企业创造价值。
Daas 数据即服务
数据管理和数据治理的区别
治理过程是对管理活动的评估、指导和监督,而管理过程是对治理决策的计划、建设和运营。
| 数据治理 | 数据管理 | |
|---|---|---|
| 职能 | 评估、指导和监督 | 计划、建设和运营 |
| 内容 | 企业决策的相关问题并制定数据规范 | 实现数据治理提出的决策并给予反馈 |
| 责任主体 | 董事会 | 管理层 |
数据治理步骤
第一步,是我们要制定元数据的管理策略。元数据是定义数据的数据。什么意义,什么数据类型。
第二步,确定元数据的管理体系结构。也是制定管理策略、确定管理的体系结构,
第三步,实施元数据管理。
第四步,定义我们的业务。需要业务进行重新定义。
第五步,获得主管的支持。成立一个数据治理委员会,就是要使我们主要的公司管理人员的参与进来,以便协调数据资源。
第六部,执行成熟度评评估,成熟度评估有很多模型。
第七部,是构建我们的路线图。
第八步,建立组织蓝图。
第九部,了解数据。
第十部,定义度量值。
好家伙,原来这种东西也是有国标的啊。原来这些标准在09年左右就有了,zf机构果然还是走在最前头啊。
继续看到PPT后面的东西实在是太让人无语了,就完全没什么有价值的东西。当然你也可以说世上不缺少价值,缺少发现价值的眼睛。可能那是对我无用的价值吧。(疯狂内涵
其实很多公司内部的分享也是这样,只是一种任务式的完成,于是就渐渐变成了形式主义。无人再关心分享的精神,分享的意义。
唉 又水一篇。