Tips-08

今更訊けないCommvaultのDASH Full (合成フルバックアップ)

今回はCommvaultの合成フルバックアップ機能であるDASH Fullの概要や必要性、簡単な例でDASH Fullの実行方法や動作の説明を行います。

DASH FullはCommvaultの重複排除機能を使って合成フルバックアップを行う機能で、既に多くのお客様が実際にご活用されています。DASH Fullを使うことでフルバックアップ時に発生するネットワークへの負荷の削減やバックアップ ウィンドウの大幅な短縮などのメリットが得られます。
今回はこれからCommvaultを使われる方、検討される方を主な対象としてDASH Fullをご紹介していきます。

DASH Fullの概要と必要性

DASH FullはCommvaultの重複排除機能を使って合成フルバックアップを行う機能です。
ここでは典型的なバックアップ方式である週次のバックアップ・日次の増分バックアップを行う運用との比較により、DASH Fullを使用するとどのようにバックアップ運用が改善されるのかをご説明します。

週次でフルバックアップ・日次での増分バックアップを行う運用の場合はどうしても週次でのフルバックアップが課題となります。フルバックアップは全データのバックアップを取得するためバックアップ時間が長くなってしまいます。
つまりバックアップ対象のサーバーに対して負荷がかかる時間が長くなり、これはサーバーの利用者に対する影響が大きくなるということを意味します。

DASH Fullを使用するとこの週次でのフルバックアップによる影響を大幅に改善することができます。

DASH Fullはデータの移動を伴いません。
DASH FullはCommvaultの重複排除機能を活用したバックアップを前提としていますが、重複排除を使用した場合はバックアップ対象のデータはファイルよりも細かいブロックの単位で一意なものであるかどうかを判別し一意なブロックのみがバックアップ保存先のディスクに保存されます。
Commvaultの重複排除機能はこれらの全てのブロックがディスク上のどこに保存されているかを把握しています。
DASH Fullはフルバックアップとそれ以降の増分バックアップのデータを合成することで最新のフルバックアップを生成するのですが、この生成に必要なブロックは既にバックアップ保存先のディスク上に存在しています。
そのため合成の処理はCommvaultのMediaAgent上で実行可能で、バックアップ対象サーバーからデータの移動は必要ありません。DASH Fullを使うことでフルバックアップ時に発生するネットワークへの負荷を削減し加えてバックアップ対象サーバーへの負荷も抑えることができます。

またDASH Fullは極めて短時間で実行できます。
重複排除を使用したバックアップの場合は一意なブロックのみがバックアップ保存先に存在するため、DASH Fullでは合成後のフルバックアップがどのブロックを使用するかを示す参照情報のみが作成されブロックの移動やコピーは行われません。
具体的には新しいインデックス (カタログ情報) を作成し重複排除データベースの更新が行われています。
ブロックの移動やコピーが行われないため分単位での実行が可能になります。

こうしてDASH Fullにより生成された合成フルバックアップはバックアップのサイクルの中で通常のフルバックアップと同様に扱われます。
そのためDASH Fullを活用することで、バックアップ管理者にとっては頭の痛い問題であるフルバックアップを初回のバックアップ実行時のみとし、以降は増分バックアップの取得と定期的なDASH Fullによる合成フルバックアップの生成でバックアップ運用を継続することが可能となるわけです。

DASH Fullの実行方法と動作解説

ここからは簡単な例でDASH Fullの実行方法と動作をご説明します。

DASH Fullを行う前に、まず、DASH Fullが有効になっているかを確認しておきます。
※重複排除機能を使用するストレージ ポリシーの場合、DASH Fullはデフォルトで有効になっていますので通常はあえて確認する必要はありません。

DASH Fullが有効かどうかは使用するストレージ ポリシーのプライマリ ストレージ ポリシー コピーのプロパティの中で確認できます。プライマリ ストレージ ポリシー コピーはストレージ ポリシー作成時に自動的に作成され、特に変更していなければ通常は「1次」もしくは「Primary」という名称になっています。

使用するストレージ ポリシーのプライマリ ストレージ ポリシー コピーを右クリックし [プロパティ] を選択します。

ストレージ ポリシーコピープロパティのウィンドウが表示されますので [重複排除] タブ以下にある [詳細] タブを選択します。重複排除オプションの枠内に「DASH Full の有効化 (読み取りを最適化した合成フル) 」というチェックボックスがありますが、このチェックが入っていればDASH Fullが有効な状態となっています。

これでDASH Fullが有効な状態になっていることが確認できましたので、フルバックアップと増分バックアップを取得の後、実際にDASH Fullを実行してみます。

ここでは下記のような例 の場合にDASH Fullでどのような合成フルバックアップが出来上がるかをご紹介します。

  • 最初、バックアップ対象として、File1、File2、File3、File4の4つが存在する状態でフルバックアップを実施 
  • フルバックアップ完了後、新しいファイルであるFile5を追加
  • File5の追加後、1回目の増分バックアップを実施
  • 1回目の増分バックアップ完了後、File2を削除し、新しいファイルであるFile6を追加
  • File2の削除、File6の追加後、2回目の増分バックアップを実施
  • 2回目の増分バックアップ完了後、DASH Fullを実行

この場合、どのファイルがDASH Fullによる合成フルバックアップに含まれることになるでしょうか。

この例の場合に各バックアップに含まれるファイルを示したものが下図です。
DASH Fullによる合成バックアップには、File1・File3・File4・File5・File6の5つのファイルが含まれることになります。

途中で削除されているFile2は合成フルバックアップには含まれません。
Commvaultは増分バックアップ実行時にファイルが削除されたという履歴情報を取得しています。
そのため合成フルバックアップの材料となるフルバックアップには既に削除済みのFile2が含まれていても、このファイルが既に削除されていることをCommvaultが認識していますので合成フルバックアップには含まれません。

それではここから実際に試して動作を確認してみます。
ここではフォルダ”C:Folder01”をバックアップ対象としたサブクライアント”C_Folder01”を使って試してみます。

最初にこのフォルダにFile1・File2・File3・File4を入れた状態でフルバックアップを実行します。

サブクライアント名を右クリックして[バックアップ]を選択します。
バックアップタイプで「フル」を選択して[OK]をクリックしてフルバックアップを実行します。

※初回のバックアップであれば [増分]を選択してバックアップを実行しても自動的にフルバックアップが実行されます。

ジョブコントローラでフルバックアップの完了を確認します。

取得したバックアップに含まれる内容を確認する場合はサブクライアントを右クリックして [バックアップ履歴] を選択し、その後表示されるバックアップ履歴フィルタのウィンドウで[OK]をクリックしてバックアップの履歴を表示させます。

その後、内容を確認したいバックアップの履歴を右クリックして [バックアップ項目の表示] を選択します。

そうするとフルバックアップなので当然ですが、File1・File2・File3・File4の4つすべてのファイルがバックアップされているのが確認できます。

次に、File5を追加して1回目の増分バックアップを取得します。

サブクライアント名を右クリックして[バックアップ]を選択します。
バックアップ タイプで「増分」を選択し、[OK]をクリックして増分バックアップを実行します。

ジョブ コントローラで増分バックアップの完了を確認します。

先程のフルバックアップの時と同様の手順で実行した増分バックアップジョブのバックアップ内容を確認すると ([バックアップ項目の表示]を実行) 、追加したFile5がバックアップされたことが確認できます。

今度はFile2を削除し、File6を追加してから2回目の増分バックアップを行います。

上述の手順で[バックアップ項目の表示]を実行して2回目の増分バックアップの内容を確認するとFile6が取得されていることが確認できます。

それでは準備が整いましたので、いよいよDASH Fullを実行してみます。
サブクライアント名を右クリックして[バックアップ]を選択します。

表示されるサブクライアントのバックアップオプションのウィンドウで、バックアップタイプから[合成フル]を選択します。その下にある「増分バックアップの実行」にチェックを入れると合成フルバックアップを生成する前に増分バックアップを実行してから合成フルを実施する (「合成フル前」の選択肢を使用) 、あるいは合成フルバックアップを生成した後に増分バックアップを実行する (「合成フル後」の選択肢を使用) こともできます。
ここでは「増分バックアップの実行」にはチェックを入れずに合成フルを行うことにしますので設定を変更せずに[OK]をクリックします。

ジョブ コントローラで合成フルバックアップの完了を確認します。

DASH Fullの場合もフルバックアップや増分バックアップと同様にどのファイルが中に含まれるのかをバックアップ履歴から[バックアップ項目の表示]を実行することで確認できます。

バックアップ項目の履歴の表示内容を確認すると、File1・File3・File4・File5・File6の5つ合成フルバックアップが含まれており、既に削除されているFile2は含まれていないことが確認できます。

今回はDASH Fullをテーマとして取り上げましたが、非常に簡単に実行できることがご理解いただけたのではないかと思います。ここではDASH Fullを手動で実行する手順でご説明していますが、普通のバックアップと同様にスケジュールを指定して実行することもできます。
長時間かかるフルバックアップにお悩みのバックアップ管理者の方は是非DASH Fullをご活用ください。

※手順および画面ショットは、Commvault v11 Service Pack 11の環境で確認したものです。


【参考資料】
・用語集
・Deduplication Overview
・Running Accelerated Synthetic Full Backup (DASH Full)
・Primary Copy
・Job History – Advanced

Posted on 2018.10