第4回 クラウド バックアップに”使える”重複排除テクノロジーって?

今では、すっかりお馴染みになったデータ重複排除テクノロジー。バックアップ時、データの重複ブロックを見つけ、排除し、変更ブロックのみを書き込むことで、ディスクの効率的な使用を可能にするテクノロジーです。一般的に、重複排除にはターゲット側とソース側の2つの手法がありますが、Commvaultはどちらの手法にも対応しています。

  • ターゲット側 (= MediaAgent側、ストレージ側) の重複排除: MediaAgentサーバーとクライアントがLANのような高速ネットワークで接続されている場合、ターゲット側で重複排除機能を使用することで、バックアップ対象クライアントのCPU使用率を下げることができます。
  • ソース側 (= クライアント側) の重複排除: MediaAgentサーバーとクライアントがWANのように遅延が大きく、帯域幅の狭いネットワークで接続されている場合、ソース側で重複排除機能を使用することで、ユニークなデータのみを転送することができ、バックアップ時のネットワーク トラフィックを削減することができます。

さて、こうして重複排除したバックアップ データですが、その後、どのような用途に使用されますか。今、注目されているのは、クラウドを利用したディザス タリカバリ (DR) ソリューションです。ローカルでバックアップした重複排除データを、DRサイトとするクラウドにコピーする際、どのように処理が行われるかご存知でしょうか。

市場にあるほとんどのバックアップ ソリューションは、バックアップ データをDR利用のためクラウドへ (もしくは、遠隔サイトへ) コピーしようとすると、リハイドレーション (= 重複排除したコピーを取り出し、元の形に戻す処理) する必要が生じます。つまり、せっかくバックアップ時に重複排除で費用と時間を削減しても、そのデータをDRサイトへコピーしようとすると、データをすべてリハイドレーションする必要が生じ、CPU/ネットワーク/ストレージの負荷が増えます。リハイドレーションは、余計な費用と時間が掛かるだけで、ユーザーに何のメリットももたらしません。

Commvaultは、この問題を解決するため、DASH (Deduplication Accelerate Streaming Hash) Copyと呼ばれる独自の重複排除テクノロジーを採用しています。

DASH Copyってなに?

DASH Copyは、重複排除フォーマットを維持したまま、次階層のストレージへコピー データを生成する機能です。リハイドレーション処理なしで、重複排除したまま変更ブロックのみを転送してコピー データを作成できるので、データのコピーに掛かる時間を数時間単位から、数分単位へと大幅に短縮することができます。また、リハイドレーション用の余分なディスクを確保する必要もなくなります。DASH Copyにより、CPU/ネットワーク/ストレージ リソースの使用率を最大限に抑えた高速データ コピーが可能になり、クラウドや遠隔サイトを利用したディザスタ リカバリを現実的なソリューションとすることができます。

DASH Copyの構成例

DRサイトへバックアップ データをコピーする方法として、下記のような構成例が考えられます。
  1. オンプレミスでの重複排除コピー
    まず、ローカル サイトで、重複排除バックアップを行います。
  2. ディザスタ リカバリ (DR) 用コピー
    次に、DR用のバックアップ コピーを作成するため、クラウドへ、定期的にDASH Copyを行うようスケジューリングしておきます。DASH Copyを使うことで、通常のWAN経由でも、このオペレーションを短時間で完了することができます。このコピーには、要求に合わせて保持期間を設定することができます。
    クラウドへのDASHコピー

以上、今回は、いったんローカル サイトで重複排除バックアップを行い、DRコピー作成のため、そのデータをDASH Copyで重複排除したままクラウドへ送る方法をご紹介させていただきました。なお、Commvaultは、Amazon S3やAzureなどのクラウド ストレージへ、バックアップ データを重複排除したままダイレクトに送るソリューションも提供しています。クラウド ストレージへのダイレクト バックアップに関する詳細はこちらをご覧ください。

 

前回の記事へ | 次の記事へ

2015.08