局面有如背水一战,如果失败了,想要“翻盘雪耻”就要再等一年。因为双11每年只有一次,不仅是一年一度的大考,更是一年一度的舞台。按照系统部资深技术专家杨海悌的说法,“人人都想把自己一年的努力拿到双11去验证和展示,不让上还不高兴。”
跟2014年的全链路压测比起来,2015年主要要做几个方面大刀阔斧的改进:一是要从核心系统扩展到全部系统,二是要平台化,也就是打造一个全链路压测的平台工具,三是要跟整个集团的压测打通联动。
“老实说,非常忐忑。”郑洋飞心里没底。
当双11零点的洪峰扑面而来时,他已经忘掉了apple watch这回事。有一个压测没验证到的数据库定时任务,让曲线看上去不那么平滑。“稳定压倒一切”的宗旨之下,系统只要一抖,整个团队的心也跟着抖了起来。迅速排查的结果是,系统整体没出问题,但压测遗漏的一些细节,让结果不是那么完美。
“曲线不是特别好看。”他不无遗憾地说。
郑洋飞最终赢得了这只apple watch,但对于他而言,除了奖品之外,这只apple watch更有了别样的意义,时刻提醒他即使做了再充分的准备,也没有万无一失。
【七】对“丝般顺滑”的追求永无止境
其实每一位支付宝工程师的心中,都有一条的“完美曲线”。
理想之中,它应该是这样的:双11零点,洪峰来了,曲线漂亮地攀升,没有骤升骤降,不要用频繁的抖动去折磨大家脆弱的神经。
如果要浓缩成一个词,那就是“丝般顺滑”。
但是,每一次为此而做的技术演进和架构变更进行到一定阶段,“你都会发现一开始可能设想得非常美好,但到了一定的规模之后,挑战就接二连三地来了。”杨海悌感叹道,“量变产生质变,这句话不是虚的。”
双11的“量”,早已一骑绝尘地进入前所未有的领域,2016年双11仅用了6个多小时,交易额就已超过2014年全天。这些年以来,都是自己在不断刷新自己的纪录。
在这样的量之下保障稳定,难度不止提高了一个数量级。
还记得2012年底制定的架构革命之“三年计划”吗?它真的持续了三年,这场最初是为了解决数据库连接数和机房限制而进行的架构革命,在三年的演进过程中,又衍生出很多其他的架构,比如异地多活、容灾,弹性的容量调度等,直到2016年,才算全部落地。这之中每一步的演进,都是为了让系统具备动态扩容能力,能够顺滑地进行弹性的扩展和伸缩。
“大”是考验,“小”也是考验。