Beitrag: Deduplikation: Schnelleres Backup und Recovery - Background - Heise Partnerzones Background . Barracuda, Archivierung, Backup, Storage, Deduplizierung, VMware, Restore . /styles/zones/basis.css

Barracuda Backup und Recovery

Beitrag: Deduplikation: Schnelleres Backup und Recovery

Das Datenvolumen in Unternehmen wächst weiterhin rasant. Storage-Lösungen müssen daher vor allem zwei Anforderungen erfüllen: Effizienz und Wirtschaftlichkeit. Ziel ist es, die reale Auslastung der Speicher zu steigern und die Kosten der Datenhaltung zu senken. Dies geschieht beispielsweise über Deduplikation. Die Technologie macht das Backup effizienter, da sie sämtliche Datenredundanzen ausschaltet und damit Speicherplatz spart.

ERP-Systeme, Groupware und Datenbanken - Unternehmen erzeugen heute eine Unmenge von Daten, da die meisten Geschäftsprozesse digital ablaufen. Hinzu kommen Sensor-Daten, das Internet der Dinge mit einer Vielzahl vernetzter Geräte, die permanent Informationen übertragen, sowie Daten aus den sozialen Netzwerken (Facebook, Twitter & Co.). Ein weiterer Faktor für die wachsenden Datenmengen sind gesetzliche Vorgaben zur Langzeitarchivierung von geschäftsrelevanten Informationen in digitaler Form.

Laut IDC verdoppelt sich das Datenvolumen weltweit etwa alle zwei Jahre. Den Marktforschern zufolge soll die Menge der weltweit erzeugten und gespeicherten Daten von 4,4 Zettabyte im Jahr 2013 bis 2020 auf 44 Zettabyte ansteigen - das ist eine Zahl mit 21 Nullen. Mit dem steigenden Speicherbedarf wachsen natürlich auch die Kosten für Storage-Systeme und typische Aufgaben wie Backup und Recovery.

Daher gilt: Storage-Lösungen müssen effizient und wirtschaftlich sein. Ziel ist es, die reale Auslastung der Speicher zu steigern und damit letztlich die Kosten der Datenhaltung zu senken. Dies geschieht beispielsweise über Deduplikation, häufig auch Deduplizierung genannt. Die Technologie macht das Backup effizienter, da sie identische Daten nur einmal abspeichert, somit das Datenvolumen reduziert, Speicherplatz auf den Storage-Systemen einspart und auch die Bandbreite beim Datentransfer schont. Davon profitieren insbesondere Unternehmen, die ihre Daten aus verschiedenen Standorten in einem zentralen Rechenzentrum sichern.

Das Grundprinzip: So funktioniert Deduplikation

Je optimaler ein Disk-Backup-System genutzt wird, umso besser. Ziel ist es, mehrfach vorhandene Informationen zu identifizieren und nur ein einziges Mal zu speichern oder zu sichern. Deduplikation hilft Anwendern, Datenredundanzen zu erkennen und zu beseitigen. Sie ersetzt mehrfach abgelegte Informationen durch Platzhalter, so genannte Pointer, die auf den Speicherort der Originaldatei verweisen.

Deduplikation zerlegt Dateien und andere Daten in Datenblöcke (Chunks) und analysiert dann auf Byte-Ebene, welche Segmente die höchste Wiederholrate bieten. Die Länge der gesicherten Datenblöcke ist abhängig von Dateityp und -größe. Jeder Datenblock erhält drei eindeutige Hash-Werte (digital fingerprints), MD5sum, SHA1 und Größe der Datei. Jeder Hash-Wert ist für jeden einzelnen Datenblock individuell und wird in einer Tracking-Datenbank gespeichert, die als Kontrollinstanz fungiert: Sie enthält die Informationen darüber, welche Segmente von welchen Rechnern sich bereits auf dem Sicherungsmedium befinden, welche Daten erstmalig gespeichert werden und welche Files verändert wurden.

Sichern beispielsweise fünf unterschiedliche Server Daten auf eine Backup-Appliance und wird ein Datenblock ermittelt, der auf jedem dieser fünf Server vorhanden ist, wird nur eine einzelne Kopie dieses Datenblocks tatsächlich auf der Appliance gespeichert. Jeder Datenblock wird dabei mit Hinweisen versehen, wie er beim Recovery über alle fünf Server aufbereitet (kompiliert) werden muss. Die Tracking-Datenbank sorgt dafür, dass diese Datenblöcke aufbewahrt werden, bis alle Backups gelöscht werden, die auf einen bestimmten Datenblock verweisen. Da nur einzigartige Bestandteile von Daten auf dem Server gespeichert werden, reduziert sich die benötigte Kapazität immens, teilweise um mehr als 90 Prozent (Deduplikations-Faktor 20:1). Beim Recovery wird eine Datei anhand der Informationen in der Tracking-Datenbank aufbereitet und dann an den Zielort zur Wiederherstellung gesendet.

1 | 2 | 3