Tips-16

Commvaultの基礎的な用語を今一度整理してみる (その2)

今回はCommvaultを利用する方の大半が使うと思われる重複排除機能に関連した用語の「重複排除データベース (DDB)」と「グローバル重複排除ポリシー」の2つについて、その必要性も含め紹介していきます。

以下の2つのCommvault用語を説明していきます。

  • 重複排除データベース (DDB)
  • グローバル重複排除ポリシー

重複排除データベース (DDB) とは

重複排除データベースとはCommvaultで重複排除を有効にしたバックアップを実施する際に使用されるデータベースで、バックアップ対象のデータが既に一度バックアップされたかどうかを判別するためのシグネチャを保持しています。
重複排除データベースは英語では “Deduplication Database” と表記されるため、しばしばDDBと略されます。
そのためここでも手短にDDBと記載し、DDBがどのように機能するのかの理解をもう少し深めていただくために重複排除の動きをご説明します。

重複排除を有効にしたバックアップを行った場合はバックアップ対象データが読み込まれ、
ブロック(デフォルトの設定では128KB)単位でハッシュアルゴリズムによるシグネシャが生成されます。

ここで生成されたシグネチャが過去にバックアップされディスク ライブラリ上に既に存在するブロックのシグネチャと比較されます。この既にバックアップされたブロックのシグネチャを保持しているデータベースがDDBです。

生成されたシグネチャが既にDDB上に存在する場合はそのブロックは既に存在していると判断されます。
この場合はバックアップ対象として読み込まれたブロックは廃棄され、既にディスク ライブラリ上に存在するブロックを参照するためのポインタが作成されます。

生成されたシグネチャがDDBに存在しない場合はそのブロックは新規のものと判断されます。
この場合はシグネチャはDDBに追加され、ブロックはディスクライブラリに書き込まれます。

ここまでの説明で重複排除バックアップ時のDDBの役割についてはご理解いただけたかと思います。
Commvaultでは重複排除を有効にしたストレージ ポリシーを作成した際にMediaAgent上にDDBが作成されます。
しかしこれでは重複排除の効率低下につながるため「グローバル重複排除ポリシー」を使用するのが一般的です。
ここからはもう少し詳しく「グローバル重複排除ポリシー」についてご説明していきます。

グローバル重複排除ポリシー とは

グローバル重複排除ポリシーは「複数のストレージ ポリシーで共用できるDDBを提供するための仕組みです。」

グローバル重複排除ポリシーを使用すると、使用しない場合に比べて重複排除の効率を上げることができ、バックアップデータの保存先ディスク ライブラリの容量を抑えることができます。

グローバル重複排除ポリシーが効果を発揮する典型的な例としては、保持期限の異なる複数のストレージ ポリシーを作成する場合が挙げられます。

バックアップ対象のデータにも色々あるかと思いますが、大事なデータで長期間保管したいもの・直近の数週間程度保存できていればよいもの等、保持期限に関する要件がデータによって異なることはよくあることです。
このような場合、Commvaultでは保持期限の異なる複数のストレージ ポリシーを作成しそれらを各サブクライアントに割り当てることで対応します。

グローバル重複排除ポリシーを使用しない場合はストレージ ポリシー作成時にDDBが作成されますのでストレージ ポリシーの個数分のDDBが作成されます。

以下の図はグローバル重複排除ポリシー「未使用の場合」に3つのサブクライアントA・B・Cにそれぞれ保持期限の設定の異なるストレージ ポリシー1・2・3を割り当てた場合の概念図です。
グローバル重複排除ポリシーを使用しない場合は各ストレージ ポリシー専用のDDBが作成され、重複排除の処理はストレージ ポリシー内に限定されます。
そのためこの例の場合ではサブクライアント間に重複データが存在する場合でも重複排除は実施されず、重複排除の効果は各サブクライアント内のデータに限定されます。

※1台のMediaAgentが複数のDDBを持つ構成は可能ですが、この場合もDDBは2つのみ持つことを推奨しています。
1台のMediaAgentが複数のDDBを持つ構成(Deduplication Extended Mode)については こちらを参照してください。
DDBの数を不必要に増やさないようにするためにも是非グローバル重複排除ポリシーを活用してください。

グローバル重複排除ポリシーを使用する場合は最初にグローバル重複排除ポリシーを作成することになります。
DDBはグローバル重複排除ポリシーの作成時に作成されます。
ストレージ ポリシーの作成時に既に作成済みのグローバル重複排除ポリシーを使用するように設定することでストレージ ポリシー間でDDBを共用できるようになります。

以下の図はグローバル重複排除ポリシーを「使用する場合」に3つのサブクライアントA・B・Cにそれぞれ保持期限の設定の異なるストレージ ポリシー1・2・3を割り当てた場合の概念図です。
グローバル重複排除ポリシーを使用すればストレージ ポリシー間でDDBを共用しストレージ ポリシー間でも重複排除が実行されます。
そのためこの例の場合ではサブクライアント内はもちろん、サブクライアント間に重複するデータが存在した場合にも重複排除が実施されバックアップ先のディスク ライブラリに保存される冗長なデータをより効率良く削減することができます。

設定手順
ここからはCommCell Consoleでグローバル重複排除ポリシーを作成する手順をご紹介します。
CommCell Console左側のCommCellブラウザの「ストレージ ポリシー」を右クリックし、表示されたメニューから[新しいグローバル重複排除ポリシー]を選択します。

「グローバル重複排除ポリシーの作成ウィザード」のウィンドウが表示されます。
まずグローバル重複排除ポリシー名を入力するように促されますので任意の名前を入力してから[次へ]をクリックします。

ライブラリを選択するように促されますので、使用したいライブラリをリストから選択して[次へ]をクリックします。

MediaAgentを選択するように促されますので、使用したいMediaAgentをリストから選択して[次へ]をクリックします。

バックアップしたデータを暗号化したい場合は「ソフトウェア暗号化」にチェックを入れ、使用したい暗号化のアルゴリズムやキーの長さを選択して[次へ]をクリックします。
ここでは暗号化を使用しないこととし、チェックは入れずに進めます。

「プライマリ コピーに対して重複排除を有効にしますか?」の画面では自動的に「はい」の箇所にチェックが入っていますので、特に何もせずに[次へ]をクリックします。

「重複排除データベースを格納する場所を指定してください」の画面では重複排除データベースを格納するパスを指定します。パスを指定したら[次へ]をクリックします。

最後に設定した内容を確認するように促されます。
[完了]をクリックするとグローバル重複排除ポリシーの作成は完了です。

グローバル重複排除ポリシーを作成した後にこれをストレージ ポリシーから使用する方法を簡単にご紹介しておきます。

ストレージ ポリシーを作成する過程で、以下のように「既存のグローバル重複排除ポリシーを使用」の選択箇所で「はい」を選択して作成を進めます。

そうするとグローバル重複排除ポリシーを選択するように促されますので、作成したグローバル重複排除ポリシーをリストから選択します。こうしてストレージ ポリシーを作成することでグローバル重複排除を行うストレージ ポリシーを作成できます。

まとめ
今回はCommvaultの基礎的な用語として「重複排除データベース (DDB)・グローバル重複排除ポリシー」の2つを説明しました。「ライブラリ・ストレージ ポリシー・サブクライアント」の関係性に「グローバル重複排除ポリシー」を追加しこれら4つのコンポーネントの関係性を図にしてみました。

  • 「ライブラリ」はバックアップしたデータの保存先です。
    重複排除機能を使用してバックアップを行う場合はディスクライブラリ・クラウドストレージライブラリのいずれかを使用します。
  • 「グローバル重複排除ストレージポリシー」は複数のストレージ ポリシーで共用できるDDBを作成し重複排除の効率を上げるために設定します。
    グローバル重複排除ポリシーの中には使用するライブラリやMediaAgent・重複排除や暗号化等の設定が含まれます。
  • 「ストレージポリシー」はバックアップしたデータをどのように管理するかを定義します。
    グローバル重複排除ポリシーを使用する場合はストレージポリシーの中では保持期限の設定や使用するグローバル重複排除ポリシーを指定します。
  • 「サブクライアント」はバックアップ対象のデータをどれにするかを定義します。
    このサブクライアントにストレージポリシーを割り当てることでバックアップされたデータがどのように管理されるか、すなわちどこに・どのようにして保存されるかが決まります。

Commvaultのインストール後の設定でグローバル重複排除ポリシーを使用する場合は「ライブラリ・グローバル重複排除ポリシー・ストレージ ポリシー・サブクライアント」の順に設定を行っていくとスムーズに進められるのでお奨めです。
今後Commvaultの構築を行う機会のある方は是非試してみてください。

※画面ショットは、Commvault v11 Service Pack 13の環境で確認したものです。


【参考資料】
・用語集
・Deduplication Overview
・Deduplication for Data Protection and Archiving
・Global Deduplication
・Creating a Global Deduplication Policy
・Hardware Specifications for Deduplication Extended Mode

Posted on 2019.04