启迪云 | 王阳
IT运维管理信息化建设的终极目标就是:智能化运维管理。
简单来说就是用电脑代替人脑。这就要靠大数据技术对运维管理中产生的大量数据进行挖掘分析从中找到有用的知识和信息,让计算机系统逐步的进行自我学习!
为什么大数据技术能实现这些数据挖掘呢?
- 大数据分析是基于全体数据的分析,让我们可以获得更多有用的信息。
- 利用大数据分析技术对于非结构化数据比如文本、视频等的数据进行分析。
- 利用运维数据之间的逻辑关系,将夸多个业务节点的交易串联起来!
大数据技术会使用到的相关技术包括抽取、计算、存储等等上图均有列举!
大数据分析技术获得的荣誉自然是少不了!
你可以把我们这个模型理解为系统的医生我们能做到以下两点:
- 提前发现信息系统的亚健康状态
- 当系统发生故障时快速准确找到病因对症下药,并快速解决问题
我们把平时解决常见故障的知识变成规则灌注到模型中,利用这个模型我们可以模拟高级工程师在发生故障时从一步步排查,到解决故障的整个过程。在加快电脑处理速度的同时,让初级工程师也能达到高级(资深)工程师的解决问题的效率和效果。
一个正常运行的系统它的状态会处在一个稳定的区间之内,当采集到的数据已经系统脱离开这个区间我们就认为系统异常。可能在业务上系统还在正常运行,但是此时系统已经存在隐患了,通过这个分析手段我们就能提早发现隐患避免故障的发生!
交易流分析:大数据相关分析能够解决自动数据串联的分析工作,因为银行业务多半都是跨多个业务节点的。可每个业务系统的开发都由不同的业务组开发完成,在交易道路中很难有一个标识,我们通过相关性分析自动梳理出每种交易中两个业务节点的相关性,把交易从发起端到结束端串联起来,效率完胜于手工梳理!
通过对交易流的分析,我们要定位到底是哪个业务节点发生了故障,造成的交易失败。在实际银行故障排查中我们发现,在某个业务节点的报错并不是由于这个业务节点自身产生的故障,多半跟它相连的节点是有关系的;那么通过实时的路由跟踪分析,我们能判断引发交易错误的节点到底在哪里,同时我们也能判断这个问题节点对其他交易产生了的影响!
整合交易数据和基础资源监控数据:发现他们之间的相关性,为我们之后更快的分析工作打下一个基础!
交易实时跟踪监控分析:我们利用经过改造的大数据云计算技术,实现对每笔交易的实时分析与展示!
预测分析:判断故障给交易类型、交易渠道、交易机构等带来的影响,以及随着时间推移受影响程度的变化!让我们一目了然的看到故障的影响性的分析,成为应急决策的一个数据依据!
交易全景分析:把渠道业务进行综合整合分析依照不同的渠道的交易量和交易增长量的分布进行展示,让业务部门能及时掌握到全行的交易情况!
交易全景分析:对每类渠道交易包括柜面、分行、支行、营业网点的交易进行分析,甚至可以对柜员的工作情况、签到情况、业务情况进行分析从而判断柜员的业务质量!
总结:将文本性信息、资产信息、每年银行业,监管机构,公安部规章制度内有用的信息等统一作为大数据分析的数据源。盘活现有和已存的数据实现IT风险隐患分析和交易实时分析!通过大数据分析技术手段,提高运维管理精细化和智能化水平!