When the sh*it hits the fan! Eller vikten av en dr-plan.

över 8 år sedan

Vi har alla hört uttrycket som ni ser ovan. Alla vet vad det syftar på, men få har verkligen vart med om det. Ännu färre har varit med om det i arbetslivet och endast ett litet fåtal har varit med om det när det gäller IT-driften. Men exemplen finns där, när det otänkbara plötsligt händer. Räddningstjänsten i Göteborg är ett exempel. Där du fick ta på dig dykarutrustning och simma ner till servrarna i mars 2008. Inga säkerhetskopior gjorda. Problematiskt är bara förnamnet. Längre ifrån oss finns extrema exempel som 11:e september i USA när Merryl Lynch’s datacenter var utslaget i sex veckor efter händelsen.

De allra flesta av dessa katastrofala avbrott i IT-världen får vi aldrig reda på. Kanske är det för pinsamt att berätta om dem, mer troligt är att det är tyst för att begränsa den förtroendeskada som de drabbade företaget eller institutionen kommer utsättas för.

EMT vs IT Vems är då ansvaret för att en ordentlig Disaster Recovery-plan tas fram? Ledningen anser allt som oftast att det är relaterat till IT och därför också IT som skall ta fram den. Tyvärr verkar det också som att IT ensamt väljer att ta på sig ansvaret. Men ansvaret kan inte ensamt läggas på IT, inte utan att ledningen tagit några viktiga beslut: RPO eller Return Point Objective, hur mycket data har vi råd att förlora? Är det en dag, en timma eller en minut? RTO eller Return Time Objective, när måste systemen vara uppe? Hur lång tid får det ligga nere?

Beslut som inte bara påverkar verksamheten i sig utan också även vilken organisation IT måste ha tillgänglig vid ett givet tillfälle men även vilken utrustning eller tjänster skall upphandlas av externa partners? Från enklare beslut som vilken version av Hypervisor skall vi använda till om vi skall ha speglade datacenters, diesel, jour osv.

För vi vet alla vad som händer när fläkten får sig en fullträff. Utan en klar och tydlig DR-plan där ledningen varit med och satt upp ramarna, förväntningarna och tilldelat medel så kommer IT ensamt att få bära ansvaret för att systemen inte är uppe eller att data förlorats.

Första steget Vad är då första steget mot att implementera en DR plan? RTO och RPO som nämnts tidigare är två ypperligt bra ställen att starta diskussionen på för att sedan arbeta sig vidare ner i de olika delarna av en DR plan. Räkna med att arbetet kommer involvera fler delar av organisationen än bara ledning och IT. Hur ser organisationens behov av kontinuitet ut? Har man kunder som behöver komma åt system?

Även att definiera hur DR planen skall sättas i verket genom att definiera vad som skall klassas som en katastrof kan också vara lämpligt.

Vad kan CGit hjälpa till med? Vi har genom åren hjälpt ett antal företag att ta fram DR och kontinuitetsplaner. Vi utarbetar förstudier och analyser som kan ligga till grund för vidare arbete med DR-planen. I förstudierna genomför vi intervjuer inom den egna organisationen och, om företaget levererar tjänster som är beroende av IT för att fungera, även med kunder.

Utifrån de behov och krav som framkommer kan vi, tillsammans med IT och ledning, se vilken RTO och RPO som är realistisk att uppnå med hänsyn taget till budget kontra konsekvenser av nedtider och dataförluster. Vi kan självklart ta hela DR-arbetet från ”ax till limpa” och göra såväl förstudie som DR plan och implementering av infrastrukturella investeringar eller förse er med ett underlag för att sedan upphandla lösningen själva.

Källor Computerworld.com ”9/11 top lessons learned for disaster recovery”http://www.computerworld.com/s/article/9219867/9_11_Top_lessons_learned_for_disaster_recovery

idg.se ”25 skräckhistorier från IT-världen”http://www.computerworld.com/s/article/9219867/9_11_Top_lessons_learned_for_disaster_recovery

ComputerSweden ”Översvämning i serverrummet – då saknades säkerhetskopian”http://computersweden.idg.se/2.2683/1.170856/versvmning-i-serverrummet–d-saknades-skerhetskopian