RAID systemen bestaan al heel lang en op dit moment beschouwen de meeste mensen het als een betrouwbare en goed begrepen technologie. Maar aangezien opslagapparaten steeds groter worden, beginnen veel van de aannames die we over RAID maken uiteen te vallen.

De schaalbaarheid
Laten we beginnen met de meest voor de hand liggende. De rebuildtijden zijn gigantisch lang. In het verleden, toen er een schijffout optrad, hoefde je alleen de slechte schijf te verwisselen, de RAID opnieuw te maken en kon je je data protection binnen enkele uren opnieuw instellen.

Wanneer je kleinere schijven gebruikt (bijvoorbeeld minder dan 1 TB), werkt dit redelijk goed. Maar als je een array van 15 TB-schijven gebruikt, kan de rebuildtijd dagen in plaats van uren zijn. Je bent veel kwetsbaarder en als je een andere schijf verliest voordat de RAID de wederopbouw voltooit, en dit kan en zal gebeuren, zijn al je gegevens verdwenen en kan alleen data recovery je nog redden. Het is waar dat je dit risico met RAID 6 zou kunnen verminderen, maar er is hier een veel groter probleem waar de meeste mensen zich niet bewust van zijn. Wanneer je deze grote schijven gebruikt in een RAID-configuratie, is er een verhoogd risico op corruptie van de data.

Data Corruptie is je slechtste nachtmerrie
Elk opslagapparaat, of het nu een harde schijf of SSD is, heeft een bekende bit error rate. Je ziet het op het specificatieblad staan ​​als de UBER – Unrecoverable Bit Error Rate. Schijffabrikanten gebruiken strenge maatregelen om deze fouten tot een minimum te beperken, maar het is onmogelijk om ze volledig te elimineren.

De standaard bit error frequentie op een moderne harde schijf is minder dan 1 op 10 ^ 15. Dit betekent dat mogelijk een bit van elke 10.000.000.000.000.000 bits (of 1.2 PB) verkeerd wordt opgenomen. Voor een schijf van 100 GB is dit een relatief laag risico, aangezien je waarschijnlijk niet dicht bij 1,2 PB naar de schijf zult schrijven tijdens de bruikbare levensduur. Maar hoe zit het met een schijf van 15 TB? Wat als je 20 van deze schijven in een RAID-configuratie had en constant aan het schrijven was in een productieomgeving met een hoog volume voor jaren achtereen? Plots lijkt 1.2 PB niet zo’n groot getal te zijn, en de kans dat je een van die onherstelbare bitfouten raakt, begint te stijgen.

Dit is het probleem met RAID-systemen met meerdere terabytes. Wanneer je deze grote schijven in een RAID-configuratie gebruikt gedurende een lange periode, is data corruptie niet alleen een mogelijkheid, het is een bijna statistische zekerheid. Het is slechts een kwestie van tijd voordat het misgaat.

Rol van de RAID-controller
De vraag is of de RAID-controller de fouten kan detecteren en repareren. Helaas kan dit niet omdat RAID-controllers eenvoudige parity gebruiken om data te beschermen. De parity is even of oneven. Het kan detecteren of een bit is geflipt, maar het kan je niet vertellen welke, en het heeft niet genoeg informatie om er iets aan te doen, behalve je te waarschuwen. RAID geeft een foutdetectie, maar wat je echt nodig hebt, is foutcorrectie.

Hoe ziet dat er dan uit? Hoe kun je een groot volume creëren en toch je data beschermen? Western Digital is een van ‘s werelds toonaangevende experts en fabrikanten van harde schijven en SSD’s. Zij ontwikkelen ook storage enclosures en systemen om hun kennis in aandrijftechnologie optimaal te benutten en superieure oplossingen te leveren. Dit is de manier waarop hun opslagsystemen met hoge capaciteit, zoals ActiveScaleTM en IntelliFlashTM, dit probleem aanpakken.

Beyond RAID – IntelliFlash Data Protection
Laten we beginnen met IntelliFlash. Dit is het best presterende opslagsysteem van Western Digital en biedt traditionele toegang tot blokken en bestanden in één apparaat. Ter bescherming tegen gegevensbeschadiging maakt IntelliFlash gebruik van een algoritme voor het afstemmen van een controlesom om beschadigde gegevens te detecteren en te herstellen. Dit is hoe het werkt.

Telkens wanneer een nieuw gegevensblok wordt geschreven, wordt een controlesom berekend en opgeslagen voor dat blok. Leesbewerkingen worden vergeleken met de controlesommen en als er een mismatch wordt gedetecteerd, wordt het beschadigde blok automatisch gerepareerd met behulp van gegevens van de parity drive. Dit gebeurt op een transparante wijze wanneer de gegevens worden gelezen en vervolgens wordt het gerepareerde blok geretourneerd naar de aanvrager. Met IntelliFlash zijn de gegevens volledig zelfherstellend, zodat de gebruiker zich nooit zorgen hoeft te maken over stille data corruptie.

ActiveScale – van RAID Systemen tot Erasure Coding
ActiveScale, het cloud object opslagsysteem van Western Digital, heeft een andere benadering. Dit is WD’s grootste capaciteitsopslagarray en gebruikt de techniek Erasure Coding om gegevensbeschadiging te voorkomen. Als je nog nooit van wissen met codering hebt gehoord, kunt je dit beschouwen als een geavanceerde vorm van RAID. Het algoritme werkt als volgt.

Eerst wordt elk bestand verdeeld in scherven, waarbij elke scherf op een andere schijf wordt geplaatst. Vervolgens worden aanvullende scherven gemaakt die foutcorrectie-informatie bevatten. Met behulp van deze extra “foutcorrectie” shards is het algoritme in staat om meerdere bit errors binnen een enkele scherf te detecteren en te corrigeren, waardoor een extreem sterke bescherming wordt geboden tegen databeschadiging en tot 19,9% gegevensbestendigheid. Bovendien kan het erasure coded volume meer schijffouten overleven dan RAID en maakt het zeer efficiënt gebruik van schijfruimte, waardoor het de ideale keuze is voor petabyte-schaalopslag.

Verlies je gegevens niet aan RAID
Of je nu blok-, bestands- of objectgebaseerde opslag gebruikt, Western Digital heeft de technologie en ervaring om ervoor te zorgen dat jouw gegevens altijd worden beschermd.