Um das beliebte Prüfungsthema RAID geht es in der einhundertneunundsiebzigsten Episode des IT-Berufe-Podcasts.
Inhalt
RAID: Redundant Array of Independent Disks (bzw. früher "inexpensive" statt "independent)
Idee: Mehrere Festplatten zu einem Verbund ("array") zusammenschließen
Ziel: Ausfallsicherheit und höhere Verfügbarkeit (durch Einführung von Redundanz)
Bei Ausfall einer Festplatte kann sie getauscht und das RAID-Array wiederhergestellt werden ("Rebuild"), in dieser Phase ist das RAID durch die hohe Belastung aber anfälliger für einen weiteren Festplattenausfall.
RAID ersetzt nicht die Datensicherung.
Lösung: Hardware- oder Software-RAID
Hardware mit speziellen RAID-Controllern
Software meist schon ins Betriebssystem eingebaut (z.B. in Linux)
Alternative: JBOD (just a bunch of disks)
Es gibt verschiedene RAID-Level
Kriterien: Mindestanzahl Festplatten, Ausfallwahrscheinlichkeit, maximal verkraftbare ausgefallene Festplatten, Lese-/Schreibgeschwindigkeit, Nettokapazität
RAID 0: Striping
keine Redundanz, Merksatz: "0 Redundanz", "0 Sicherheit"
mindestens 2 Festplatten nötig
teilt Festplatten in gleich große Blöcke auf und verteilt die Daten darauf (stripes)
Kapazität kann komplett genutzt werden
dadurch kann schneller gelesen werden, da von mehreren Festplatten parallel gelesen wird
auch das Schreiben geht schneller, da Daten parallel auf mehrere Festplatten geschrieben werden (aufgeteilt)
fällt eine Festplatte aus, ist der gesamte Verbund defekt
Ausfallwahrscheinlichkeit steigt, da Einzelwahrscheinlichkeiten multipliziert werden (z.B. bei 1% Ausfallwahrscheinlichkeit 2,97% gesamt)
Einsatz: Streaming (viel Lesen, wenig Schreiben, Datenverlust verkraftbar bzw. anderweitig abgesichert), mehrere kleine zu einem großen Datenträger zusammenbauen
Nachteil: hohe Ausfallwahrscheinlichkeit
RAID 1: Mirroring
komplette Redundanz, Merksatz: "1-zu-1-Kopie"
mindestens 2 Festplatten nötig
Daten werden auf allen Festplatten identisch abgelegt
Kapazität wird halbiert oder gedrittelt usw.
Lesegeschwindigkeit kann erhöht werden, indem Daten parallel von mehreren Festplatten gelesen werden
Schreiben dauert länger, weil Daten auf mehrere Platten geschrieben werden müssen (Redundanz)
Verbund fällt erst aus, wenn alle Festplatten ausfallen
Ausfallwahrscheinlichkeit sinkt deutlich, z.B. bei 1% je Platte auf 0,0001%
auch Mirroring ist keine Datensicherung, Viren werden sofort auf alle Platten geschrieben
Einsatz: Hochverfügbarkeitssysteme
Nachteil: geringe Nettokapazität
RAID 5: Paritäten
Teilredundanz durch Ablage von Paritätsinformationen
mindestens 3 Festplatten nötig
zusätzlich zu den auf mehrere Festplatten verteilten Daten werden auf allen Festplatten Paritätsinformationen (z.B. XOR) je Datenblock abgelegt
Kapazität wird reduziert (z.B. 2/3 bei drei Festplatten)
Lesegeschwindigkeit kann erhöht werden, indem Daten parallel von mehreren Festplatten gelesen werden
Schreiben dauert durch Berechnung der Parität länger
Verbund fällt erst aus, wenn zwei Festplatten defekt sind
Ausfallwahrscheinlichkeit sinkt, z.B. bei 1% je Platte auf 0,0298%
Nachteil: bei häufigen Schreibzugriffen durch Berechnung der Parität langsamer
Irrelevante RAID-Level
RAID 2: Striping mit Fehlerkorrektur, nur bei Großrechnern eingesetzt
RAID 3/4: wie RAID 5 nur mit dedizierter Paritätsfestplatte (die dadurch stark belastet und zum Flaschenhals wird), bei RAID 3 wird auf Byte-Ebene und bei RAID 4 auf Block-Ebene gestript
RAID 6: wie 5 nur mit doppelter Parität
Kombinationen von RAID-Levels
best of both worlds aus anderen RAID-Leveln
immer von links nach rechts lesen und im Diagramm von unten nach oben: 01 -> zuerst werden zwei RAID 0 erstellt und dann zu einem RAID 1 zusammengebaut
ein Leg ist das RAID-Array "unten" im Bild, aus dem das übergeordnete zusammengesetzt wird
es werden mind. 4 Festplatten benötigt
Kapazität wird halbiert
Verbund verträgt zwei Festplattenausfälle, aber es ist wichtig, welche Platten ausfallen
RAID 01