携程致歉全面瘫痪:确认系员工错误操作所致
- 发布时间:2015-05-29 10:25:09 来源:环球网 责任编辑:罗伯特
从5月28日中午开始,携程旅行网开始无法正常登陆,直到23日23:29分才完全恢复正常。
携程方面向环球网科技表示,经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
昨日上午11:09左右,网友们点击进入携程网,页面显示404报错,虽然点击“返回首页”后依然可以进入携程网,但其功能和其它链接均无法使用。
猎豹移动安全专家李铁军向环球网科技表示,携程服务中断极有可能是内部管理失控导致,通常黑客从外部攻击很难做到数据大量丢失,且备份还原不至于拖延太久。通常黑客入侵往往只是悄无声息地拿走核心数据,一般不会进行破坏性操作。携程这次事故从微博各方面透露的信息来看,像内部人员所为(有可能已经造成数据损失),具体损失有多严重,只能等待官方的进一步消息。
此外,李铁军表示,预防灾难性事件发生,需要做两点:1.严格的权限管理(内控)和灾难预防。2.备份:意外发生在最短时间内恢复。
从11:09到23:29,为什么恢复时间那么长?携程方面向环球网科技表示,一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
如何杜绝此类事件的再次发生?携程表示,携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。(周涛)