Deduplizierung
Speicherkapazitäten optimal ausnutzen
Immer größere Datenmengen zirkulieren in Unternehmensnetzwerken. Sie finden sich auf lokalen ebenso wie auf zentralen Laufwerken. Dabei sind Speichermengen von mehreren Terabytes keine Seltenheit mehr. Für Unternehmen bedeutet das, neben Hardwarekosten, vor allem einen steigenden Energie- und Verwaltungsaufwand. Dabei könnte man ohne Informationsverlust auf große Mengen der gespeicherten Daten verzichten.
Ein großer Teil des immer höheren Datenaufkommens besteht aus mehrfach
gespeicherten identischen Dokumenten. "Wir alle produzieren tagtäglich unablässig solche Doubletten, ohne es zu merken", sagt Oliver Geissler, der bei INSIGMA für Speicherlösungen zuständig ist. „Nur ein Beispiel: Jeder der ein
Dokument oder ein Bild per E-Mail verschickt oder weiterleitet, produziert sie; beim Versand über einen Verteiler gleich mehrere. Die Speichernetzwerke unserer Kunden quellen teilweise davon über. Dabei kann man ohne großen Aufwand die Datenmenge reduzieren."
Identische Zeichenfolgen eliminieren statt abspeichern
Hier setzen Deduplizierungsverfahren an. Sie erkennen und löschen Doubletten auf den Speichernetzwerken eines Unternehmens. Und nicht nur das: Die ausgeklügelten Verfahren können noch viel mehr, denn digitale Daten bergen in sich selbst viele Wiederholungen. Oliver Geissler: "Identische binäre Zeichenfolgen kommen sehr häufig vor." Stellen Sie sich einfach einen Text vor, in dem Wörter wie und", "auch" oder ganze Phrasen häufig wiederkehren. Genau so ist es auf binärer Ebene. Die richtige Software findet diese Wiederholungen."
Deduplizierungssoftware sucht nach langen, gleichen Byte-Sequenzen, zum Beispiel nach identischen E-Mail-Anhängen, löscht diese und ersetzt sie durch einen Verweis auf die Originaldatei. Dieser Verweiswird mit der E-Mail abgespeichert, sodass Anwendungen und Anwender wie gewohnt auf die Dateien zugreifen. Dieses Prinzip gilt auch für alle denkbaren anderen binären Zeichenfolgen.
Optimierte Backups durch Deduplizierung
Doch Deduplizierung sorgt nicht nur für mehr Platz auf den Festplatten. Ebenso
effektiv sind die Vorteile bei Backup und Recovery. In diesem Fall werden ausschließlich die bereits bereinigten Datenbestände gesichert bzw. wiederhergestellt. Damit lässt sich eine Menge Arbeitsaufwand einsparen. Oliver Geissler: „Deduplizierung ist stark im Kommen. Die hohen Reduktionsfaktoren von bis zu 19:1 überzeugen die Anwender, da sie zu spürbaren Einsparungen führen.“ Für Unternehmen mit mehreren Standorten gibt es zudem WAN-Optimizer, die den Dokumentenverkehr zwischen Standorten regulieren und identische Zeichenfolgen deduplizieren.