平台事故应急处理流程
2011平台事故后总结。
=================================== 事故应急处理流程(技术部分) =================================== ----------------------------------- 须应急事故定义 ----------------------------------- 影响到平台稳定或平衡的事故及异常。 ----------------------------------- 应急处理流程 ----------------------------------- 1、通知相关人员: a) 运维 XXX b) 总监 XXX c) 总经理 XXX e) 相关人员 事故相关部门负责人及员工 2、判定事故严重程度: a) 统计事故现象 b) 预估事故最严重后果 c) 预估事故最可能后果 3、预估事故原因 按可能原因的严重程序从高至低进行排查,确定 **事故最严重的可能原因** 及 **事故最可能的原因** ,以及对策方针: a) 统一事故内部解释口径 防止内部谣传、不稳定(客服&不直接相干人员) b) 统一玩家安抚解释口径 防止玩家谣传、不稳定 c) 统一合作商/人解释口径 d) 统一事故处理方式 按部就班,处理方式,协调机制 注意:由外部原因(如黑客攻击、利用游戏漏洞刷银等)导致的事故,须判定对方意图(包括最危险及最可能两种意图) 4、确定处理方案 a) 是否要 **停服** ? 停服范围:游戏服务器,平台服务器,活动网站,平台网站等; 停服时间: b) 是否需要或可能需要 **回档** ? c) 是否要发 **公告** ? (定性说法) d) **客服** 的解释方案 (统一口径) e) 对 **市场** 活动及人员的影响? f) **善后** 的思路; g) 事故应急处理主要负责人及主要协调人 h) 客服是否要加派人手?400电话是否要添加,话费是否充足? i) 还需要哪些部门、人员的配合,是否需要测试? j) 还须通知到哪些部门及人员? k) 哪些休假人员是否要停止休假,立刻赶回? 5、通知相关部门及人员(统一口径后) a) 相关运维人员、开发人员、测试人员、美术 b) 客服部门 c) 市场部门 d) VIP管理员 e) 休假人员 6、事故处理过程 各司其职,保持沟通。 a) 相关各部门负责/联络人 b) 相关各事务负责/联络人 * 事故技术处理负责/联络人 * 客服论坛QQ群的负责/联络人 * 饮食车辆杂事的处理 c) 总协调人 d) 高层汇报协调人 7、事故善后 a) 是否要赔偿?玩家赔偿方式及方案? b) 是否要出处理公告? c) **外部相关处理人员** 的安抚,保密及解释(如:网监、记者、报刊、论坛) d) 对玩家的事故最终解释方案(安抚、鼓励) e) 对内部的事故最终解释方案(安抚、鼓励、惩戒) f) 对内部的事故责任追究方案(惩戒) g) 对事故处理有功人员的安抚和奖励(鼓励) 8、其他 a) 善后方案出炉,最晚不要超过3个工作日,5天 b) 产品/技术轮值方案
Written on May 18, 2011