过去十余载,云计算的出现对传统基础设施产生冲击:曾经的服务器老大IBM,去年在中国的营收下降了11%,已经不到200亿美元;甲骨文进入中国三十个年头,收入跌到不到40亿美元,还关闭了中国区的研发中心;与此同时,根据艾媒的报告,云计算市场规模过去五年已经增长了三倍,同时仍然自我革新,带领时代发展潮流。过去十余年,可以看到云计算的发展经历了几个阶段。
软对硬的胜利:云计算对传统IT服务架构的颠覆
从云计算元年说起
从全球行业视角来看,2008 年可以算是云计算的元年。因为在这一年,当 AWS 证明了云是可行的业务。同年,国内另一云计算巨头阿里云正在萌芽。当时由于阿里巴巴业务迎来爆发式增长,虽然阿里要向IOE及戴尔等厂商的支付几千万美元,但依然无法满足庞大的计算任务。传统IT服务架构开始跟不上互联网行业的发展速度。于是有了2008年中旬阿里巴巴提出的向互联网架构转型的战略。阿里决定通过自主研发和替代性方案重构自己的系统——这就是阿里云的雏形。这个打算自研的云计算操作系统,在2008年10月24日得名“飞天”。2009年早春,飞天第一行代码在北京汇众大厦203室诞生。
接下来五年,也就是2010-2014年,是云计算行业爆发式增长的开始。2010年Windows Azure全面上线;2011年,Google推出Google云平台;2年后阿里云经历种种困难,终于实现了5K的规模化运营,也就是5000台规模集群,并在当年的BenchMark上创造了计算100TB排序的新世界纪录。
到了下一个五年,也就是2015-2019年,最早进入赛道的一批云计算厂商在技术上开始发力,市场规模也在加速增长。例如阿里云突飞猛进,自主研发了飞天大数据平台、神龙云服务器、盘古存储平台、洛神网络平台、PolarDB云数据库、玄武高性能服务器等一系列产品技术,这些技术叠加形成的强大云平台,让阿里云成为第一家支撑大规模核心业务系统的云计算厂商。
云计算是如何挤占传统服务器市场份额的
首先我们看国内市场。根据万联证券研究所2019年的一份报告显示,国内服务器市场规模从2013年到2018年增长约75%
万联证券另一篇报告里也展示了国内云计算市场规模的增速。虽然由于他们的数据限制,年份未能完全对齐,但我们可以看到,云计算市场规模五年增长可以达到数倍。
也许你会觉得,国内正处于高速发展期未必有代表性。那我们再放眼全球,Synergy Research Group 2019年的一份报对全球最大的那些企业进行调研,研究他们在IT方面的花费,可以看到在数据中心硬件和软件方面,花费比较稳定,而购买云架构服务的花费则在指数级增加,他们在2019年时就预计年末云服务花费将超过数据中心的花费。
通过分析国内外数据,我们可以看到,虽然传统服务器市场规模仍在增加,但比起云计算的规模,那是完全落伍了。而且服务器市场规模的增长,也一部分归功于云计算的发展,使得硬件需求增加。
究其原因,主要是传统 IT 厂商的是延续性技术,不论是 Oracle 的数据库业务,还是 IBM 的小型机亦或是 EMC 的存储设备,本质上都是在已经饱和的市场上再做延续性的创新。而云计算则是典型的破坏性技术,对 IT 行业带来了重塑的作用。
硬对软的拥抱:企业服务器厂商向云计算演进
在云计算的观念深入人心的过程中,企业服务器厂商也开始拥抱潮流。主要有两步:
服务器厂商开始搞虚拟化
简单来说,虚拟化就是在一台物理服务器上,运行多台“虚拟服务器”。这种虚拟服务器,也叫虚拟机。国外的虚拟化产品开始出现,例如Citrix、戴尔科技旗下VMware、微软旗下的hyper-v等。从这步开始,卖服务器就开始走向卖服务,本质是”共享“服务。虚拟化是云计算的基础,也是他们走第二步的前提。
投入更多资源到云服务
企业IT厂商加大投入转型到云计算。如果自己能转型的,就内部转型,例如Intel宣布从“以 PC 为中心”到“以数据为中心”转型。有的不能转型的,干脆就去收购一些云计算领域有关键技术的公司。2016年戴尔用670亿美元收购了EMC,创下当时科技史上最大并购案,这个价格比戴尔当时的市值还高,原因EMC拥有虚拟机软件VMWare以及其他云计算技术。另一个案例是2018年IBM花了三百多亿美元收购RedHat,成为轰动一时的大新闻,原因之一就是看中了RedHat的云计算技术,RedHat对于开源的云计算平台OpenStack的代码贡献量一直排在第一。可以看出这些传统的服务器厂商,为了转型不惜一切代价。
虽然他们在转型过程中显得有点笨重,但这些传统的企业服务器厂商有着互联网云计算公司没有的优势:他们具备丰富的硬件设备资源、网络资源,成熟的销售渠道体系,所以此类公司通常会选择以私有云为切入点。
“云”正在从“软”变“硬”
按实现路径和方式,目前云厂商根据定位不同粗暴分成了互联网阵营和企业IT厂商两大阵营。当无论哪个阵营,搞云计算都不能“唯软件论”,云需要从“软”变“硬”。虽然软的占上风,但硬的始终是基础。举个例子,云的新发展是混合云,包含本地基础设施、私有云和公共云,可以看到基础设施依然不可或缺。当我们说“变硬”,不是指多用硬件,而是在硬件等基础设施上发力,掌握核心技术。
为什么必须变“硬”
有人觉得,硬件真的那么重要吗?硬件有钱不就能买吗?如果这话五年前说还可以,但现在不行了,原因有两点:
云计算正在向社会通用性技术转变,云计算厂商需要同时对硬件进行改造。早期积极“上云”的企业,大多是互联网公司等数字化企业。但随着新基建的出台,越来越多的”重型组织“,例如政府、电力、石油、制造,都对云计算技术产生更大需求。他们需要更高算力、更高可靠、更强安全的云服务来支撑。所以云服务厂商也必须集结更强大云计算能力。软件方面的迭代固然重要,但更重要的是在硬件方面再加大投入,以便接入到更广大的应用场景之中。
变“硬”是防范卡脖子风险的辎重武器。政府、大型企业都在纷纷上云,AI 伴随着云服务深入到个领域。但过去两年我们都见证了硬件技术被他人掌握的风险。关键技术上被“卡脖子”已经不是概率性的事情,而是已经发生的事实。靠拿来显然不能解决长期问题,而云计算技术底层的“基础设施”,芯片、存储、服务器等等,就是我们的辎重武器。
变“硬”路上已取得成就
业内已有硬件提升性能实现新突破的案例,例如AWS自研的Graviton2服务器芯片,使得性能翻7倍。如果国内的云厂商不能变硬,在潮流发展中落伍,发展过程中也会频繁被卡脖子。不过现在我们可以看到国内某些厂商开始行动了并取得令人骄傲的成绩。例如阿里云在变”硬“的过程中,涌现了很多变革性的技术:
神龙云服务器架构。通过自研的硬件模块,阿里云将外部云盘存储、VPC网络等资源offload到专属硬件芯片上,彻底消灭了虚拟化性能损耗问题。神龙架构对云原生浪潮下容器等产品适配程度极高。通过I/O offload芯片加速,高效调度和自动化弹性伸缩的容器化产品可帮助用户降低50%的计算成本,性能比物理机更优越。
含光800芯片。含光800是阿里巴巴首颗AI芯片,基于平头哥自研架构,有效降低内存访问延时;集成达摩院的创新算法,深度优化CNN及视觉类算法,大幅提升视觉计算效率。在业界标准测试集ResNet50推理测试中,含光800性能达到78563 Img/sec,是第二名的5倍;能效比500 FPS/W,是第二名的3.3倍。目前基于含光800的云服务器已在阿里云大规模商用。
方升服务器架构。方升架构涵盖了计算和存储的自研加速卡、自研智能网卡等,并通过定制CPU为计算提供强大的性能支撑,推出一系列玄武高性能计算全栈解决方案、泰山高性能存储和貔貅高密度存储解决方案等自研硬核服务器。
麒麟液冷数据中心。多年的技术和经验积累,阿里巴巴设计出一整套《浸没式液冷数据中心技术规范》,涵盖了浸没液冷子系统,浸没液冷服务器等IT设备的设计要求,以及对应数据中心的设计、施工、部署、运维等各个环节,并向全社会开放,打破了我国液冷服务器在数据中心大规模部署建设无标准可采用的空白。通过一体化设计合理规划,可降低部署成本,提升稳定性。初步估算,如果全国的数据中心都采用液冷技术,一年可节省上千亿度电。
变“硬”之路能走更远
此外,新基建中的超低时延高带宽的5G技术发展,将推动边缘计算的发展。在边缘计算中,数据在数据收集源附近处理,因此不再需要将数据传输到云或本地数据中心进行处理和分析。届时,云计算变“硬”之路将走得更远,边缘计算需要的物联网硬件研发将成为云计算厂商发展的重点。
云计算方兴未艾,对全球而已,由“软”变“硬”是未来趋势,是技术发展路上不可阻挡的潮流。 在国内而言,由“软”变“硬”既是数字新基建时代的需要,也是掌握核心技术的必行之路,更是云计算的唯一发展道路。
Reference:
1.新基建,是什么?
2.Oracle Annual Report 2018-19
7.Cloud Infrastructure Services Surpasses Data Center Spending In 2019