携程回应系统大规模崩溃:为员工错误操作所致
发表时间:2015年5月29日 16:40 来源:赛迪网
5月29日消息,昨日携程官方网站突然陷入瘫痪,打开主页后点击时均显示“ServiceUnavailable”,而百度搜索上的携程官方页面也显示404错误。APP打开后也无法正常使用。
作为一家依靠技术生存的OTA,系统的崩溃是致命伤,甚至有传言称携程数据全部被物理删除,这对于消费者尤其是预付费用者而言简直是“五雷轰顶”的打击。
经过紧急排查,携程方面今天给出了导致该事件的原因是由于员工错误操作,删除了生产服务器上的执行代码导致。
对于此次恢复时间如此之久,携程也给出了回应。携程方面表示,一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
为了防止类似事件发生,携程表示已在系统上做了相应改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
尽管如此,携程系统崩溃折射出在线旅游商家技术 洞和弊端,同时也考验了风险应对与危机处理能力。有业界数据显示,按携程上一季度的财报计算,其每小时的业务损失可能是100万美元。
相关文章