揭秘双十一“水电煤”:阿里云挑战全球最高流量洪峰

时间:2019-11-11 18:01:53   热度:37.1℃   作者:网络

原标题: 揭秘双十一“水电煤”:阿里云挑战全球最高流量洪峰

[摘要] 自诞生起,阿里云和“双11”就有着不解之缘。

文/时代财经 史成超

2009年,张勇接手淘宝商场(天猫),并一手打造了“双11”购物狂欢节。当时的“双11”仅有27个品牌参与,销售额也只有5000万元。如今,11月11日零点刚过96秒,天猫“双11”成交总额已突破100亿元。

对于阿里巴巴董事局新任主席兼CEO张勇来说,“双11”销售额并不是最值得关心的事情。11月5日,张勇就在公开活动中表示,“在我心里最关键的不是那个销售数字,而是我们整个技术的峰值,是我们能够每秒钟支撑多少笔订单的处理,既不发生钱的错付,又不发生货物错误的记录。”

就在张勇用“双11”拯救淘宝商城的同一年,阿里云创始团队工程师写下了国产云计算操作系统“飞天”的第一行代码。此时的阿里,面对日益增长的网购流量,明显感觉得“脑力”不足,阿里“云计算”战略就此拉开帷幕。

“双11”历年交易峰值及技术部署

与“双11”共成长

自诞生起,阿里云和“双11”就有着不解之缘。

2009年,阿里巴巴的电商业务在高速发展中遇到了并发量大的业务数据处理难题。时任阿里首席架构师的王坚告诉马云,“未来快速增长的业务,会导致IT基础设施成本拖垮阿里”。

他提出,要集合阿里巴巴整个集团的技术力量做一套中国自主研发的云计算大规模操作系统,目标是将几千台乃至上万台普通PC服务器连接到一起,变成像是一台多功能的超级计算机,来实现超强计算性能,也就是后来的“飞天”系统。

马云决定让阿里金融以捆绑创业的方式成为阿里云的第一个客户。2010年4月,阿里金融产品“牧羊犬”在飞天系统上线,此时的阿里云问题频出,严重影响业务开展。

据媒体报道,时任阿里金融负责人胡晓明,曾在跟马云于西湖散步时说,“马总,您能不能放我一马?”就这样,在马云的支持和王坚团队的坚持下,阿里金融成为阿里云早期“拿命去填”的客户。

直到2012年的“双11”期间,扛住了191亿的交易流量和百万次的高并发运算,成为阿里云能够对外输出稳定服务提供了最好的证明。同时,淘宝也创下了国内单日网购成交量的历史记录。

2013年“双11”,350亿元的交易数字,80%通过阿里云端搭建的“聚石塔”完成。这一开放的电商云工作平台,由天猫、阿里云和万网于2012年7月联合推出,首次实现了“云+SAAS模式”打通。

自此,马云在三年前成立的“云计算”子公司浮出水面,阿里巴巴打造数据平台的战略也开始提速。

从去IOE到全面上云

2013年5月17日,阿里集团最后一台IBM小型机在支付宝下线。此时距2008年阿里提出去“IOE”口号历时5年,从此阿里内部完全不再使用IBM小型机、Oracle数据库和EMC存储设备。

2014年,胡晓明从阿里云的第一个客户变成了阿里云的总裁,并一路带领阿里云成为与亚马逊AWS、微软Azure并列的云计算“3A”巨头。

2012年~2016年,阿里技术团队在“双11”期间主要解决的是业务问题:超卖、重复下单、优惠复杂性等;到了2016 年,技术团队开始做系统吞吐量的提升工作,业务快速发展的同时,保证服务器数量,全面上云成了最重要的工作。

2016年,随着“双11”订单量峰值的不断上升,由于不同系统业务争抢服务器资源,淘宝一度出现不能下单的情况。此后,2016至2017年的一年多的时间里,阿里云重新优化机构、研发产品,并在2017年正式推出了X-Dragon Hypervisor。

从神龙X-Dragon架构来看,阿里云研发了专用的芯片、定制的专用主板,开发了专用的MOC卡,甚至开发了整套配套的软件——从BIOS到应用层支撑软件,再到整体调度软件等一整套复杂的系统。

神龙架构的成果在于通过专用芯片来抵消虚拟化技术带来的性能损耗问题,完全发挥处理器和内存等计算资源的性能,成为中国推动云数据中心虚拟化技术变革的重要力量,极大的降低了“争抢资源”情况的发生概率。

至2018年“双11”期间,阿里云上新增调用的弹性计算能力累计超过1000万核,相当于10座大型数据中心,创造了“脉冲计算”的新纪录。

今年“双11”,阿里已经完成了100%核心系统上云。在1小时冲破1000亿元交易大关的同时,阿里方面宣布交易峰值达到54.4万笔/秒。这意味着阿里云已经征服了全球最大的流量洪峰,是2009年“双11”的1360倍。

两个月前,阿里巴巴将数以十万计的物理服务器从线下数据中心迁移到了云上。由此,阿里巴巴成为全球首个将核心交易系统100%运行在公共云上的大型互联网公司。同为云计算巨头的亚马逊、微软、Google,都尚未迈出这一步。

“全面上云”时代

如今,阿里云除“飞天”系统和“神龙”架构,还进化出了名为“盘古”的存储系统、名为“洛神”的网络管理以及名为“伏羲”的资源管理系统。

据阿里巴巴最近发布的Q2财报显示,截至2019年9月30日,阿里云季度营收92.91亿元,比去年同期净增36.24亿元,增速达到64%,在全球云计算3A(亚马逊AWS、微软Azure和阿里云)阵营中增速持续领跑。

另研究机构Gartner发布的市场数据,2018年亚马逊AWS市场份额下跌4%,阿里云份额增长近一倍。2018年全球云计算市场向头部进一步集中,3A(亚马逊AWS、微软Azure、阿里云)占据七成市场份额。

2018年11月,张建锋接任胡晓明,成为阿里云智能事业群总裁。此时的阿里云早已不是一个支持阿里内部业务,顺便对外输出技术能力的部门。它已具备强大的对外输出的能力,成为阿里巴巴技术创新的牌面,扮演着驱动整个阿里巴巴发展的技术引擎的角色。

在今年3月的阿里云峰会上,张建锋表示,“全站云化”的时代已经到来,整个阿里经济体正在All In Cloud,成为“云上的阿里巴巴”。“在升级云智能之后,阿里巴巴的技术等同于阿里云的技术,未来阿里巴巴所有技术、产品和to B的能力都会通过阿里云平台对外输出。”

“双11”购物狂欢节,是云计算进展的冰山一角,也是技术与商业互融共进的一场大秀。据阿里云方面透露,目前已有上万家企业将IT系统全面迁移到阿里云,如飞利浦中国、迅雷、万科物业、百丽等。

今年9月30日,银泰百货宣布最后一台服务器——资产编码为050476的物理机正式下线,光荣“退休”。这家自90年代成立的老牌百货宣布完成了全面上云的最后一步。金融、零售,政务……下一个全面上云的又会是谁呢?

上一篇: 华为Mate30系列5G版双十一热销!“...

下一篇: 开开心心做码农,在家也能把班加


 本站广告