Les entreprises de toutes formes et tailles dépendent des ordinateurs et des réseaux afin de fonctionner sur une base quotidienne . Quand un ordinateur serveur , mainframe ou le réseau tombe en panne, l'organisation est entravée dans sa capacité à servir ses clients et faire des affaires normalement. Afin d'atténuer les effets des interruptions non planifiées , la plupart des organisations à élaborer des procédures qui permettent d'éviter le chaos tout en rétablissant le service et l'ordre. Interruptions imprévues
interruptions imprévues se produisent pour un certain nombre de raisons. Parfois, l'erreur humaine est à blâmer, comme quand quelqu'un débranche accidentellement un serveur et provoque un accident . D'autres fois, il ya un problème environnemental, comme un incendie ou un mauvais fonctionnement de la climatisation. En outre , les défaillances matérielles ou logicielles peuvent provoquer une panne des systèmes , ce qui nécessite des heures de temps pour les opérations de restauration . L'impact de ces coupures peut varier du mineur au majeur , provoquant des pannes tactiques ou de catastrophes à part entière.
Évaluer la
évaluation des dommages de
de dommages est élevé sur la priorité liste, car vous devez connaître l' étendue des dégâts afin de savoir quoi faire ensuite . Si le problème est un défaut de conditionnement d' air de la panne pourrait durer que quelques heures. D'autre part , s'il ya eu un incendie dans le centre de données , vous pourriez être au milieu d'un effort de récupération hors site. Connaissant l' ampleur des dégâts vous aide à évaluer l'ampleur de l'effort de redressement requis , ainsi que la durée d'indisponibilité prévue.
Déterminer le temps d'arrêt potentiel
Si votre entreprise a subi une panne tactique, comme un variateur défectueux sur un serveur, vous ne pouvez être pendant quelques heures alors qu'un remplacement est installé et toutes les données est restaurée. Si votre centre de données a connu une catastrophe qui exige le déplacement , ce ne sera évidemment entraîner une période d' indisponibilité plus longue. Déterminer la durée d'indisponibilité estimée est important à la haute direction pour déterminer comment communiquer avec qui, et comment planifier les ressources humaines.
De décrire la situation
L'ampleur de la panne et le temps d'arrêt potentiel doit être communiquée à la haute direction dès que possible, afin qu'ils puissent commencer à prendre des décisions cruciales qui peuvent impliquer la pérennité de l'entreprise. La plupart des entreprises qui engagent un désastre catastrophique sans un plan de redressement mis en place se retirer des affaires d'ici deux ans . Une partie du plan de relance est un plan de communication qui couvre les employés et le public , et détermine qui est autorisé à communiquer quoi à qui .
Récupérer le système
Une fois que vous ont évalués et communiqués à la situation, et les décisions ont été prises sur la stratégie de récupération, il est temps de restaurer le système. Dans le cas d' une panne de matériel mineur, il peut être aussi simple que d'alimenter le serveur en marche et mettre en place les applications. Dans une vraie catastrophe, il peut signifier relocaliser pour une période de temps , la récupération du système sur un site chaud de récupération, et la planification d'un retour au centre des opérations d'origine. L' ampleur de l'effort de récupération dépend de l'ampleur de la panne , et un bon plan de récupération est essentielle pour un retour en douceur à des opérations des pannes majeurs et mineurs .