企业需要降低资产比例,降低财务压力,加强资产的利用效率。
上述的各种应用情形,天玑科技都有丰富的实践,本文仅在提升系统强壮性作些详细的剖析。大多数企业应用架构在设计上都是高可用的,为什么不少企业的IT基础设施往往还是不够强壮,经常会有问题呢?日常系统的运维固然是问题的一部分,高可用设计比较粗泛,主要部件强壮性不足往往是架构设计的一个固有缺陷,而且不可能通过架构的优化得以改善或解决。
下图是一般企业核心数据库服务器的通用结构,很多企业因为投入资金有限,在关键业务上也不得不使用强壮性有限的中端设备。中端设备在相当多的情况下,其性能足以满足要求,并且理论上,设备全部器件都是冗余设计的,也就是说,任何一个部件的损坏,存储都能够不停顿地继续使用,数据不会丢失。这和服务器不同,除了价格奇高,很少有人用到的容错服务器,任何SMP服务器(对称多处理服务器)都有一个致命的可用性缺陷,那就是任何一个CPU的不可恢复故障,都将导致服务器的宕机。这个问题来源于多CPU服务器需要设计成能够协同处理同一个工作,因而没有一个CPU的工作是独立的,当一个CPU出现致命故障时,所有CPU都将被影响。整个系统必须重启才能让自检程序摒弃那个故障CPU。而今天的大容量内存和多CPU,使很多服务器的重启时间达到十多分钟甚至半小时。服务器设计还有一些其他有源部件,例如背板是SPOF(单点故障),只要这个部件有损坏,整个服务器就不能工作。因此,服务器一向需要群集来解决高可用问题。而存储本身的全冗余设计使得大多数企业都使用单台存储最为一个甚至多个服务器群集的数据存储。
事实上,存储的冗余全冗余设计确实保证了任一单个部件损坏情况下的数据安全,和持续服务,但是却没有保证服务的质量。很多情况下,服务质量低到整个系统近于瘫痪。原因在于任何中端存储都是双控制器设计,限于成本考量,每个控制器都是单CPU,一旦CPU或者电池等主要部件出现问题,就会只剩下单控制器工作,性能一下损失一半。中端存储的性能损失还不止于此,由于双控制器架构的限制,所有需要冗余的部件都是二份。分开在二个控制卡上,当CPU或电池等只要部件故障时,一个控制卡的高速缓存不能工作,另外一个控制卡的高速缓存虽然能够工作,但是由于缺乏另一边控制卡提供的镜像功能,写缓存功能必须关闭。这样,整个存储的性能大受影响,性能将下降到正常情况下的四分之一,甚至五分之一。很多情况下近于瘫痪。
针对中端存储强壮性不足的情况,一些用户设计了双存储的镜像架构,用来弥补其固有的缺陷。如下图所示:
不幸的是,双存储的镜像架构,只在数据安全和服务持续性上有成倍的提高,就镜像架构而言,存储性能取决于二者中最差的那个。因此,只要有一个存储发生主要部件问题,整个镜像架构将不堪使用。双存储发生性能瘫痪的可能尤甚单存储。这个问题的根本解决只能通过提高存储本身的强壮性得到解决。
高端存储由于其分布式处理架构,冗余度大,任一部件的故障,对整体而言只是十分之一,甚至更低比例的部件故障,对性能的影响非常有限。所以强壮性的提高非常多。同时由于处理器数量,缓存数量大大高于中端存储,体系架构相对复杂,成本也高很多。
天玑科技提供的资产续用再制造设备帮助用户用新购中端存储的价格获得高端存储设备。使整个体系架构的强壮性得到很大的提升,为用户关键业务提供了保驾护航的能力。很多用户对不同产品的定位及适用性的了解有限。当性能足够,体系架构设计已有冗余时,便认为可以高枕无忧。殊不知各种产品的定位不同,提供的功能和强壮性也不同,特别是强壮性,非有实际经验,在产品说明中是难以看出真实的高低不同。这主要因为中端产品,甚至低端产品,其可靠性的宣传都达到相当的高度,迷惑了大众对于产品定位的准确理解。以至于高端产品即使对于需要支持关键应用的客户,也不过是价格高昂,可靠性锦上添花但并非必不可少的产品。而事实上,根据用户业务性质的不同,对关键业务可用性达到一定要求的,选择高端产品的理由主要不是因为性能,更为关键的原因是强壮性。