En computers evne til at reagere på fejl eller katastrofer som hardwarefejl og strømafbrydelser for at forhindre datatab kaldes
fejltolerance eller
modstandsdygtighed . Dette involverer en kombination af hardware- og softwareteknikker:
Hardwareteknikker:
* redundans: Brug af flere komponenter (f.eks. Harddiske, strømforsyninger, processorer) til at levere sikkerhedskopi, hvis man mislykkes.
* raid (overflødig række uafhængige diske): En gruppe af harddiske, der arbejder sammen for at give dataredundans og forbedre ydelsen.
* uafbrudt strømforsyning (UPS): En batteridrevet enhed, der giver sikkerhedskopiering i tilfælde af strømafbrydelse.
* hot-swappable komponenter: Komponenter, der kan udskiftes uden at lukke systemet ned.
Softwareteknikker:
* Data -sikkerhedskopi og gendannelse: Oprettelse af kopier af data, der skal gendannes i tilfælde af tab.
* failover: Skift til et backup -system eller server automatisk i tilfælde af fiasko.
* Fejldetektion og korrektion: Indbyggede mekanismer til at detektere og korrigere fejl i datatransmission og opbevaring.
* Data spejling: Duplicering af data i realtid på tværs af flere steder.
* virtualisering: Kørsel af flere operativsystemer eller applikationer på en enkelt fysisk server, hvilket giver let failover.
niveauer af fejltolerance:
* Enkelt fiasko: En enkelt komponentfejl kan nedbringe hele systemet.
* fejltolerant: Systemet kan fortsætte med at fungere på trods af en komponentfejl.
* Meget tilgængelig: Systemet er designet til at have minimal nedetid, selv under vedligeholdelse eller opgraderinger.
Eksempler på fejltolerance:
* servere i datacentre: Datacentre bruger overflødige strømforsyninger, kølesystemer og netværksforbindelser for at sikre høj tilgængelighed.
* skyopbevaringstjenester: Replikationsdata på flere steder for at forhindre tab på grund af hardwaresvigt eller naturkatastrofer.
* flystyringssystemer: Brug flere overflødige systemer for at sikre sikker drift, selvom en enkelt komponent mislykkes.
Vigtige overvejelser:
* Omkostninger: Fejltoleranceløsninger kan være dyre at implementere og vedligeholde.
* kompleksitet: Håndtering af overflødige systemer kan være komplekse og kræve specialiseret viden og ekspertise.
* ydelse: Tilføjelse af redundans kan undertiden påvirke systemets ydeevne.
Konklusion:
Fejltolerance er afgørende for systemer, hvor dataintegritet og tilgængelighed er vigtigst. Valg af den rigtige kombination af hardware- og softwareløsninger afhænger af systemets specifikke behov og ressourcer.