灾难恢复规划全解析
1. 通知升级程序
在应对灾难时,当遇到无法处理的问题或事情未按计划进行时,确定合适的资源非常重要。通知升级程序详细说明了在发生严重问题时应通知哪些人,更重要的是,它规定了通知的具体时间。
例如,如果某个打印队列崩溃但很快恢复,可能只需向该打印机的用户发送一般消息,告知他们发生了什么。然而,如果电子邮件服务中断超过半小时,很多人会担心。电子邮件服务的通知升级程序应详细说明当服务器在指定时间内不可用时需要通知哪些人,以及在更长时间后仍未恢复时会发生什么,以及通知哪些人。
通知有两个目的:一是确保所需资源按需提供,二是让每个人了解情况。如果告知人们服务器硬件出现故障,并且已经联系了供应商,供应商将在一小时内到达,那么电话咨询量将大幅减少,从而可以专注于为供应商到达做好准备。
2. 测试响应计划
拥有灾难恢复计划固然好,但在实际测试之前,它的价值有限。测试计划应在方便且可控的条件下进行,而不是在实际灾难发生时。在可控条件下发现详细的灾难恢复计划存在致命缺陷只是一件麻烦事,但在分秒必争的实际灾难中发现则会带来更大的问题。
虽然无法测试灾难恢复计划中的所有内容,但仍有一些方法可以测试响应计划。测试细节取决于具体环境,但应尽可能进行真实测试,并覆盖响应计划的各个方面。测试灾难恢复计划的另一个原因是它提供了宝贵的培训机会。如果确定了主要和备用资源,备用资源人员可能在某些方面不如主要资源人员熟练或了解情况。通过测试程序,可以同时培训备用资源人员。
此外,还可以利用测试对非主要响应小组的人员进行交叉培训。这样不仅他们能获得宝贵的培训,还能建立一个知识丰富的人员库,这些人员在实际使用该程序时可能不