“数据治理”是时下很热的一个词,至于它是名词还是动词已无法考证,更不论它到底涵盖了那些内容!设想某一天…..
你在上班的路上,遇到了基础设施团队的小张:
你:小张,最近忙啥呢?
小张:在hadoop集群上搞数据治理,头疼,不好搞啊,…(吐槽百千困难后)…., 我跟你说这事啊,也就我能搞定啦…
你:(半脸迷惑,半脸崇拜)数据治理是指?
小张:就是要降低存储使用资源,并保证即使地震机房塌了,数据也不会丢失,这事搞起来一般有4种方法…
到公司楼下,遇到了吃煎饼的数仓团队的资深工程师小王:
你:小王,最近忙啥呢?
小王:搞数据治理啊,忙的焦头烂额,最晚还起夜一次,困死了….
你:(一脸迷茫)数据治理还要起夜啊,那到底是干点啥呢?
小王:就是保证数据的及时产出啊、数据准确性啊,昨晚上游任务挂了,导致我起来处理了半小时…这事真不好搞,一般人还真处理不了,幸亏也就是我...这事我们今天要组织复盘的...把保障流程再review一遍!
上楼的电梯间遇到数据系统部的小李:
你:小李,早啊,最近忙啥呢?
小李:搞数据治理,头大,元数据老是不完善,分析师搜不到数,每天被吐槽……这事真没法干…
你:(头有点方)数据治理除了起夜,还跟元数据和搜索挂上钩了?
小李:可不,数据又不是俺们部门加工出来的,别人用数时来俺们的平台搜索,搜到了也就作罢了,搜不到就去内网吐槽,库表信息都不完善,数仓同学也不维护,你说,别人怎么可能搜到!再说了,自己用完也不说帮完善一下……这群王八蛋,真把咱们当马桶,用的时候急冲冲来,一撅屁股拉一地就滚蛋了,从不考虑后来人…不过这是难不住我,我有如下6种办法整理这帮孙子……哎…我说…你先别走,听我说啊…哎…
你步履坚定的,走到自己的工位,身为战略部的你,目光总是深沉的遥望窗外的那堵墙。这时老板老赵过来:
老赵:小孙,来大活了,公司要提升大数据的战略地位,特成立数据治理专项组,由我们牵头来搞….
你:老赵啊,这数据治理专项搞啥呢?
老赵:促进数据流通啊,不是说数据流动才有价值么,那么,还有量化这个价值啊…还有就是数据的安全与合规管理啊……昨天刚出个大案子,那个负责人老衰刚被带走了…我跟你说,昨晚我想了一下,这事也不难,今天你就来出个方案吧…
你:…
上面的场景是不是略显尴尬,那么这个数据治理到底是什么呢,google半晌,好像并无明确说法。
既然没有明确的说法,那么我们就借用”实事求是”的原则来处理,没有必要强求学术和文字上的统一,只不过面对不同角色要用不同话术来交流。
这些工作从底向上纵穿整合大数据链路,辐射公司全部与数据相关角色,互为依赖。不同领域目标与方法论不同,无法也没有必要统一建设。按照假想的角色“小孙”的际遇,数据治理可以粗略的概括如下图:
既然无法对数据治理这个词下明确的定义,但是对它做个诠释还是可以的,我的理解就是:
Better service, Faster delivery, with lesscost
历史好文推荐