Menneskelige fejl oftest skyld i nedbrud i datacentre

Datacentret har indtil for nylig for mange virksomheder blot været et serverrum eller måske en maskinstue, hvor det vigtigste var at få tilstrækkeligt strøm til it-udstyret, uden der blev for varmt. Selv om der var et nødstrømsanlæg og en generator, så var serverrummene sjældent bygget med redundans, så én enhed kunne tage over hvis, en anden gik i stykker.

Sådan ser det ikke ud i dag. Flere bygger datacentre med en vis indbygget redundans, fordi virksomheden går i stå, hvis it-systemerne går ned.

Læs også: To datacentre skal sikre Rockwool mod totalt nedbrud

»Alle er blevet mere afhængige af datacentrene, og prisen for nedetid er steget,« siger analysechef Andy Lawrence fra 451 Research til Version2 Insight.


Nedbrud skyldes ofte menneskelige fejl. Derfor kan man eliminere mange fejl blot ved at fokusere på at uddanne og træne sine datacenteroperatører, påpeger analysechef Andy Lawrence fra 451 Research.

Det sker for selv store virksomheder, som har investeret dyrt i datacentre, at systemerne går ned, men det er sjældent noget så simpelt som en kortslutning i en UPS eller et overgravet kabel, der er årsagen.

»Hvis det er en fejl i it-udstyret, så er det ofte sket under vedligeholdelse, hvor en router eksempelvis skal opdateres. Man kan ikke gøre så meget for at forebygge det, men man kan sørge for at have procedurerne klar, så man hurtigt kan være oppe igen,« siger Andy Lawrence.

Når det er et nedbrud i selve datacentrets fysiske infrastruktur, ligger fejlene som regel i det elektriske system, hvor en UPS måske ikke automatisk kobler generatoren ind, når bystrømmen forsvinder.

»Det er som regel en menneskelig fejl, fordi man ikke har haft en god nok testprocedure, eller fordi den failover-plan, man havde lagt, ikke var god nok. Dér kan man eliminere mange fejl blot ved at fokusere på at uddanne og træne sine datacenteroperatører,« siger Andy Lawrence.

Redundans koster

Gennem de seneste 30 år er der sket gradvise forbedringer af ikke blot hardwaren i datacentrene, men også i vores viden om, hvordan man designer datacentre, som er mere robuste over for fejl eller ulykker.

I dag klassificeres datacentre ofte efter den såkaldte Tier-model, der både findes som en ANSI-standard og i en fortolkning fra Uptime Institute. Datacentrene opdeles i fire forskellige tiers eller niveauer, hvor 1 er det klassiske serverrum uden redundant infrastruktur, og 4 er dobbelt op på alt, inklusive strømføring til køleudstyr og en ekstra batteribank, der kan forsyne datacentret med strøm, indtil generatorerne kan tage over.

»Det handler om at forstå, hvilken risiko du kan tåle. Hvis du ikke er bange for seks timers nedetid, så er der ingen grund til at bygge et fuldt redundant datacenter,« siger Andy Lawrence.

Mange kigger i dag på Tier 3-datacentre, hvor du har tilstrækkelig redundans på it-udstyr og strøm til at kunne udføre vedligeholdelse på noget af udstyret, uden at driften afbrydes. Det kræver, at datacentret er designet, så der altid er en ekstra enhed, man kan skifte over til, hvis én enhed skal lukkes ned, eller den bryder sammen. Det er også kendt som N+1 redundans, selv om det afhængigt af designet også kan være nødvendigt med 2N-redundans på visse komponenter.

»I dag bliver de fleste datacentre bygget til Tier 2-4. Tier 3 kan give op til 99,999 procent oppetid, og for de fleste er det rigeligt,« siger Andy Lawrence.

Redundans er ikke gratis, og hvis man skal op i den store kategori af datacentre, er tommelfingerreglen i øjeblikket, at det koster i omegnen af 75 millioner kroner pr. megawatt for et Tier 3-datacenter. Kan man nøjes med Tier 2, kan prisen være cirka 20 procent lavere, mens Tier 4 tilsvarende er 20 procent højere.

De konkrete anlægsomkostninger afhænger dog meget af, hvor man bygger sit datacenter, og hvilke faciliteter man har behov for.

Flere vælger Tier 3

Redundans handler imidlertid ikke kun om, at ét datacenter skal være modstandsdygtigt over for nedbrud. Det er også vigtigt, at man har mulighed for at køre videre, selv om et datacenter bliver oversvømmet i et skybrud. Limousine-modellen er to datacentre på adskilte lokaliteter med en vis geografisk afstand, men det har store omkostninger, fordi man skal vedligeholde to datacentre.

Derfor vælger flere i dag at lægge deres sekundære datacenter ud til en ekstern leverandør, også kaldet housing eller co-location. Det betyder, at man kan få et aflåst rum i et stort datacenter, hvor en leverandør sørger for den fysiske infrastruktur, der skal til for leve op til kravene i Tier 2, 3 eller 4.

»Hvis du bygger datacentre i dag, kan du ikke afskære dig selv fra at nå de kunder, der ønsker plads i et Tier 3-datacenter,« siger Andy Lawrence.

Det er dog en god idé at foretage en konkret analyse af sine behov, før man insisterer på at sætte sit udstyr i et Tier 3 eller Tier 4-datacenter. Applikationerne og det konkrete it-udstyr kan nemlig også være afgørende for, til hvilke typer redundans man skal lægge sine penge. I øjeblikket er det eksempelvis typisk pengeinstitutter og visse detailhandlende, som vælger Tier 4, mens de fleste nøjes med Tier 3.

»Der er også nogle, der forsøger sig med lavere niveauer, fordi der kan være temmelig mange penge at spare,« siger Andy Lawrence.

Den forkromede model med to datacentre er den såkaldte aktiv-aktiv-model, hvor data og applikationer er spejlet og synkroniseret på begge datacentre. Det betyder, at datacenter A vil kunne gå ned, uden at slutbrugerne bemærker, at det kun er datacenter B, der kører videre.

Det stiller imidlertid store krav til netværksforbindelserne mellem de to datacentre, ligesom der kan være udfordringer med at få synkroniseret alle applikationer, når datacenter A igen er online.

Skyen som ekstra datacenter

Virtualisering har gjort det muligt at vælge en helt anden model end to datacentre. Det kan især være interessant for virksomheder, hvor budgettet ikke tillader at have et ekstra storage-system og en ekstra serverfarm stående på standby, i tilfælde af at man rammer ind i de 0,01 procents nedetid.

Skyen giver i dag mulighed for at trække på en fælles pulje af ressourcer hos en stor udbyder i et datacenter. Selv om det måske til daglig er billigere eller giver bedre ydelse at køre applikationerne i sit eget datacenter, kan virtuelle servere hos en cloud-udbydere være et alternativ til datacenter nummer to.

»Hvis du kan lægge en backup af dine applikationer ud i skyen, så kan du måske nøjes med at bygge et Tier 2-datacenter. Der er eksempelvis dele af Facebooks nye datacenter i Sverige, som ikke har fuld redundans på UPS og køling, fordi de kan flytte deres workloads over på andre dele af det samme eller andre datacentre. Og en kort periode med lidt længere svartider er ikke noget, der spolerer Facebooks forretning, mens det kan være katastrofalt for visse virksomheder i den finansielle sektor,« forklarer Andy Lawrence.

Brugen af skyen som ekstra datacenter forudsætter, at man har styr på sine applikationer og data, og at en applikation ikke får problemer, hvis der er lidt længere svartider til storage-systemet end normalt. Samtidig skal applikationerne kunne køre tilfredsstillende på en virtuel server for at kunne køre i skyen.

Denne artikel har været bragt i Version2 download-magasin Version2 Insight om DDOS angreb. Find dette og flere Insights og whitepapers her

Posted in computer.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>