自助分析时代
如今,自助式分析和数据驱动型决策是全球范围内领先的企业的关注重点。那么在数据时代,如何做好数据准备?数据准备为什么这么重要?本期Informatica网络研讨会聚焦“数据准备”,由Informatica资深技术顾问冷鹏带你走近《自助分析时代之最强数据准备攻略》,揭示数据技术正在引领的业务变化,如何决胜于“自助式分析”时代。
● 做好动态的数据准备?还是静态的数据报表?
● 让业务用户等待漫长的需求实现过程?还是实现业务部门的“自己动手,丰衣足食”?
● IT部门应该继续专注数据的3个V(数据体量、变化速度和格式多样性)?还是帮助业务用户,透过大数据实现4个M(MAKE ME MORE MONEY)?
|
我们需要更好的“工作台 ——数据湖 |
01 |
|||
数据湖作为一种数据存储架构,以数据原生格式保存大量原始数据或明细数据,以供按需访问。在IT领域,以往很多概念、名词是来自国外,但当国内的“数据中台”出现时,国外还没有类似的概念,而最与之相近,莫过于数据湖了。
相对于数据湖来说,数据仓库是为预设定的业务分析主题、业务报表而服务的,但随着商业环境的变化日益迅速,业务人员越来越需要随时随地得到所需的数据,并以动态变化的形式加以展示。这时传统的数据仓库就难以满足,业务转型亟需数据湖的支持。
如果将数据仓库视为经过净化、标准化、且方便消费的桶装水,那么数据湖就是自然状态下的庞大水域。数据湖的内容从水源头流入湖中,企业可以来检查、深入或采集样本。
企业在创新的道路中,无时无刻不在为迅速变化的业务进行数据分析。通过数据湖,企业隐形地实现了一个较好的统一数据模型,从实体所有者相关的所有系统中捕获的全量数据,尽可能“丰满”地展现给业务端,让业务用户再也不能完全依赖IT人员去进行数据准备,而是借助统一平台进行自助数据准备、自助数据消费。
|
多花一点时间去了解数据——完善的数据准备 |
02 |
|||
对于数据准备,不同的组织有着不同的偏好,构建数据湖的方式也不尽相同。通常的策略是将企业及其信息系统作为一个整体来看待,对数据拥有关系进行分类,定义统一的企业模型。
同时,数据准备平台中还包含了人工智能引擎:数据湖可以借助人工智能分析数据消费者可能需要的数据,推荐对数据更为科学的处理方法;同时,人工智能可以将许多重复的数据管理和处理工作实现自动化。
我们可以用下图勾勒数据湖管理架构,其中整合了数据工程师、数据分析师、数据科学家、数据架构师、数据管家甚至运维人员的数据角色,将组织内的数据资产源源不断输送给业务人员。实现了这样的数据准备后,业务人员可以像搭建乐高玩具那样任意组合,形成数据沙盘,指导实际工作。
|
治大数据若烹小鲜 ——做好数据资产管理 |
03 |
|||
上图中数据湖管理架构中橘色的部分都可以借助Informatica的相应方案完成搭建。从发现数据(包括目录、血缘、关联、预览)、准备数据(推荐、合并、转换、协作)到发布数据(编目、共享、分析、审批),Informatica让我们可以像完成烹饪准备那样进行数据准备。
治大数据若烹小鲜,要将数据作为企业资产进行管理,首先要对“食材”进行清点、评估“营养”价值并确保最大限度地加以利用。像处理其他重大资本和运营投资一样,数据种类繁多,分布在各个不同部门、位置、系统和平台(甚至混合在本地和云端),Informatica让组织清楚知道究竟拥有多少数据资产,这绝非易事,尤其在大数据世界当中。
在准备好新鲜,品质的“食材”后,我们知道不同的厨师烹饪出来的菜品口感也不尽相同。什么时候放多少佐料,如何控制火候都很有讲究,才能将这款菜变成颇受消费者欢迎的“网红菜”。这其中不得不提到Informatica数据湖的机器学习功能,可以在整个企业中收集数据资产,同时通过基于构建企业数据目录增进对这些数据资产的了解。从而使得业务分析师和数据管理员能够在整个企业中查找所有类型的数据,发现数据之间的关系。
最后是上菜,这也是很有讲究的。同样的佳肴,以不同方式摆放,获得的评价有可能大相径庭。Informatica 的企业级数据准备平台,内嵌基于机器学习的引擎CLAIRE,不仅可以以业务团队需要的方式展现数据,更可以让数据资产通过数据目录焕发新颜,让相关人员可以自助消费该数据,使得数据资产被不断提炼,充分发挥其价值。
数字转型时代,完善的数据准备是一切分析的基础。Informatica的全方位数据准备解决方案,可以从各个不同维度为您解决数据问题,同时作为业界最全面最综合的数据准备平台,可以充分支持您的自助式分析和报表分析等,这将为企业获取对业务的实时洞悉奠定坚实的基础
想了解更多相信信息,请关注Informatica数据管理(微信号:InformaticaChina)