平台事故应急处理流程

2011平台事故后总结。

===================================
事故应急处理流程(技术部分)
===================================

-----------------------------------
须应急事故定义
-----------------------------------

影响到平台稳定或平衡的事故及异常。

-----------------------------------
应急处理流程
-----------------------------------

1、通知相关人员:

a)	运维		XXX
b)	总监		XXX
c)	总经理		XXX
e)	相关人员	事故相关部门负责人及员工

2、判定事故严重程度:

a)	统计事故现象
b)	预估事故最严重后果
c)	预估事故最可能后果

3、预估事故原因

按可能原因的严重程序从高至低进行排查,确定 **事故最严重的可能原因** 及 **事故最可能的原因** ,以及对策方针:

a)	统一事故内部解释口径	防止内部谣传、不稳定(客服&不直接相干人员)
b)	统一玩家安抚解释口径	防止玩家谣传、不稳定
c)	统一合作商/人解释口径
d)	统一事故处理方式	按部就班,处理方式,协调机制

注意:由外部原因(如黑客攻击、利用游戏漏洞刷银等)导致的事故,须判定对方意图(包括最危险及最可能两种意图)

4、确定处理方案

a)	是否要 **停服** ?
	停服范围:游戏服务器,平台服务器,活动网站,平台网站等;
	停服时间:
b)	是否需要或可能需要 **回档** ?
c)	是否要发 **公告** ?	(定性说法)
d)	**客服** 的解释方案	(统一口径)
e)	对 **市场** 活动及人员的影响?
f)	**善后** 的思路;
g)	事故应急处理主要负责人及主要协调人
h)	客服是否要加派人手?400电话是否要添加,话费是否充足?
i)	还需要哪些部门、人员的配合,是否需要测试?
j)	还须通知到哪些部门及人员?
k)	哪些休假人员是否要停止休假,立刻赶回?

5、通知相关部门及人员(统一口径后)

a)	相关运维人员、开发人员、测试人员、美术
b)	客服部门
c)	市场部门
d)	VIP管理员
e)	休假人员

6、事故处理过程

各司其职,保持沟通。

a)	相关各部门负责/联络人
b)	相关各事务负责/联络人
	*	事故技术处理负责/联络人
	*	客服论坛QQ群的负责/联络人
	*	饮食车辆杂事的处理
c)	总协调人
d)	高层汇报协调人

7、事故善后

a)	是否要赔偿?玩家赔偿方式及方案?
b)	是否要出处理公告?
c)	**外部相关处理人员** 的安抚,保密及解释(如:网监、记者、报刊、论坛)
d)	对玩家的事故最终解释方案(安抚、鼓励)
e)	对内部的事故最终解释方案(安抚、鼓励、惩戒)
f)	对内部的事故责任追究方案(惩戒)
g)	对事故处理有功人员的安抚和奖励(鼓励)

8、其他

a)	善后方案出炉,最晚不要超过3个工作日,5天
b)	产品/技术轮值方案
Written on May 18, 2011