Dell Technologies(Dell EMC) PowerProtect DataDomainシリーズ
1
9. データ(3)も同様にブロック単位に分割され、アドレスが振られます。(今回は変更されたブロックデータ「E」が含まれていました。)
10. 重複排除機能によってB、C、Dは既にあることが確認され、Eという新しいアドレスが存在することを認識します。
11. Eのブロックデータと構成情報を保存します。
ポイント
今回の例のように、一般的なバックアップ手法だとデータ (1)、(2)、(3) を全てバックアップする事になりますが、重複排除機能を利用した バクアップ手法であれば、ユニークな5個のブロックデータを保存するだけでバックアップが完了します。つまり、データ保存する為に必要なストレージ容量に対し、実際に用意するストレージ容量は大幅に削減することが可能になるのです。
「重複排除バックアップ」といっても製品によって様々なアプローチがありますが、ここでは いつどこで重複排除されるのかという観点からData Domainの機能の一つを説明します。
重複排除には主に「インライン方式」と「ポストプロセス方式」という2種類の方法があります。 多くの製品が採用しているポストプロセス方式では、データの書き込みと重複排除処理を切り離して行う手法です。一旦書き込んだデータを再度読み込んで重複排除処理を行うのは非常に時間がかかりますし、最初に大量のデータを書き込むためのディスクの容量も必要となります。 それに比べ、Data Domainが採用しているインライン方式は、ディスクにデータを書き込む前に重複排除を行い、処理後のデータだけをディスクに書き込むことが可能なので、物理的なディスクスペースの削減と一時書き込みと再読み込みにかかる時間の短縮が可能です。 以下は簡単な比較になります。
ポイント
重複していないユニークなブロックデータのみ圧縮転送
- 低帯域のWANでも構築可能
- バックアップとほぼ同時にレプリケーションの実効が可能
- 距離に依存しないデータ転送が可能
柔軟な構成パターン
- 1対1の双方向、N対1、1対Nの構成
- 筐体指定/ディレクトリ指定