第13回 Commvaultの基礎的な用語を今一度整理してみる (その2)

第13回となる今回は、「Commvaultの基礎的な用語を今一度整理してみる (その2)」と題して、Commvaultを使う場合には避けては通れない用語について解説します。第11回のブログ「Commvaultの基礎的な用語を今一度整理してみる (その1)」では、Commvaultの基礎的な用語である「ライブラリ」、「ストレージ ポリシー」、「サブクライアント」についてご紹介しました。今回は、おそらくCommvaultを利用する方の大半が使うと思われる重複排除機能に関連した用語の「重複排除データベース (DDB)」と「グローバル重複排除ポリシー」の2つについて、その必要性も含めご紹介していきます。

今回ご紹介するCommvault用語

今回は以下の2つのCommvault用語をご説明していきます。

(1) 重複排除データベース (DDB)
(2) グローバル重複排除ポリシー


(1) 重複排除データベース (DDB) とは

重複排除データベースとは、Commvaultで重複排除を有効にしたバックアップを実施する際に使用されるデータベースで、バックアップ対象のデータが既に一度バックアップされたかどうかを判別するためのシグネチャを保持しています。重複排除データベースは英語ではDeduplication Databaseと表記されるため、しばしばDDBと略されます。そのため、このブログでも手短にDDBと記載します。

ここでは、このDDBがどのように機能するのかの理解をもう少し深めていただくために、重複排除の動きの概要をご説明します。 

重複排除を有効にしたバックアップを行った場合、バックアップ対象のデータが読み込まれ、ブロック(デフォルトの設定では128KB)の単位でハッシュ アルゴリズムによるシグネシャが生成されます。

ここで生成されたシグネチャが、過去にバックアップされディスク ライブラリ上に既に存在するブロックのシグネチャと比較されます。既にバックアップされたブロックのシグネチャを保持しているデータベースがDDBです。

生成されたシグネチャが既にDDB上に存在する場合、そのブロックは既に存在していると判断されます。今回バックアップ対象として読み込まれたブロックは廃棄され、既にディスク ライブラリ上に存在するブロックを参照するポインタが作成されます。

生成されたシグネチャがDDBに存在しない場合、そのブロックは新規のものと判断されます。シグネチャはDDBに追加され、ブロックはディスク ライブラリに書き込まれます。 

ここまでのご説明で重複排除バックアップ時のDDBの役割についてはご理解いただけたかと思います。このDDBですが、次にご説明するグローバル重複排除ポリシーを使用しない場合、Commvaultで重複排除を有効にしたストレージ ポリシーを作成した時にMediaAgent上に作成されます。しかし、これでは重複排除の効率の低下につながるため、それを避けるためにグローバル重複排除ポリシーを使用するのが一般的です。ここからはもう少し詳しくグローバル重複排除ポリシーについてご説明していきます。 


(2)「グローバル重複排除ポリシー」とは

グローバル重複排除ポリシーは、複数のストレージ ポリシーで共用できるDDBを提供するための仕組みです。このグローバル重複排除ポリシーを使うと、使わない場合に比べて重複排除の効率を上げることができ、バックアップ保存先のディスク ライブラリの容量が冗長なデータの保存により消費されるのを抑えることができます。 

グローバル重複排除ポリシーが効果を発揮する典型的な例としては、保持期限の異なる複数のストレージ ポリシーを作成する場合が挙げられます。

バックアップ対象のデータにも色々あるかと思いますが、大事なデータで長期間保管したいもの、直近数週間程度保存できていればよいもの等、保持期限に関する要件がデータによって異なることはよくあることです。このような場合、Commvaultでは保持期限の異なる複数のストレージ ポリシーを作成し、それを各サブクライアントに割り当てることで対応します。 

グローバル重複排除ポリシーを使用しない場合、ストレージ ポリシー作成時にDDBが作成されますので、ストレージ ポリシーの個数分のDDBが作成されます。

以下の図は、グローバル重複排除ポリシー未使用の場合に、3つのサブクライアントA、B、Cにそれぞれ保持期限の設定の異なるストレージ ポリシー1、2、3を割り当てた場合の概念図です。グローバル重複排除ポリシーを使用しない場合、各ストレージ ポリシー専用のDDBが作成され、重複排除の実施はストレージ ポリシー内に限定されます。そのため、この例の場合では、サブクライアント間に重複データが存在する場合でも重複排除は実施されず、重複排除の効果は各サブクライアント内のデータに限定されます。

※1台のMediaAgentが複数のDDBを持つ構成は可能ですが、そのような構成とする場合もDDBは2つのみ持つことを推奨しています。今回のブログでは詳細は省略しますが、1台のMediaAgentが複数のDDBを持つ構成(Deduplication Extended Mode)についてはこちらをご参照ください。DDBの数を不必要に増やさないようにするためにも是非グローバル重複排除ポリシーを活用してください。

 

グローバル重複排除ポリシーを使用する場合、最初にグローバル重複排除ポリシーを作成することになります。DDBはグローバル重複排除ポリシーの作成時に作成されます。ストレージ ポリシーの作成時に既に作成済みのグローバル重複排除ポリシーを使用するように設定することで、ストレージ ポリシー間でDDBを共用できるようになります。 

以下の図は、グローバル重複排除ポリシーを使用する場合に、3つのサブクライアントA、B、Cにそれぞれ保持期限の設定の異なるストレージ ポリシー1、2、3を割り当てた場合の概念図です。グローバル重複排除ポリシーを使用すればストレージ ポリシー間でDDBを共用し、ストレージ ポリシー間でも重複排除が実施されます。そのため、この例の場合では、サブクライアント内はもちろん、サブクライアント間に重複するデータが存在した場合にも重複排除が実施され、バックアップ先のディスク ライブラリに保存される冗長なデータをより効率良く削減することができます。

ここではCommCell Consoleでグローバル重複排除ポリシーを作成する手順をご紹介します。CommCell Console左側のCommCellブラウザの「ストレージ ポリシー」を右クリックし、表示されたメニューから[新しいグローバル重複排除ポリシー]を選択します。

「グローバル重複排除ポリシーの作成ウィザード」のウィンドウが表示されます。まず、グローバル重複排除ポリシー名を入力するように促されますので、任意の名前を入力してから[次へ]をクリックします。

ライブラリを選択するように促されますので、使用したいライブラリをリストから選択して[次へ]をクリックします。

MediaAgentを選択するように促されますので、使用したいMediaAgentをリストから選択して[次へ]をクリックします。

バックアップしたデータを暗号化したい場合、「ソフトウェア暗号化」にチェックを入れ、使用したい暗号化のアルゴリズムやキーの長さを選択して[次へ]をクリックします。ここでは暗号化を使用しないこととし、チェックは入れずに進めます。 

「プライマリ コピーに対して重複排除を有効にしますか?」の画面では自動的に「はい」の箇所にチェックが入っていますので、特に何もせずに[次へ]をクリックします。

「重複排除データベースを格納する場所を指定してください」の画面では重複排除データベースを格納するパスを指定します。パスを指定したら[次へ]をクリックします。

最後に設定した内容を確認するように促されますので、[完了]をクリックするとグローバル重複排除ポリシーの作成は完了です。

グローバル重複排除ポリシーを作成した後にこれをストレージ ポリシーから使用する方法を簡単にご紹介しておきます。 

ストレージ ポリシーを作成する過程で、以下のように「既存のグローバル重複排除ポリシーを使用」の選択箇所で「はい」を選択して作成を進めます。 

そうするとグローバル重複排除ポリシーを選択するように促されますので、作成したグローバル重複排除ポリシーをリストから選択します。こうしてストレージ ポリシーを作成することでグローバル重複排除を行うストレージ ポリシーを作成できます。

 

まとめ

今回はCommvaultの基礎的な用語として、重複排除データベース (DDB)、グローバル重複排除ポリシーの2つをご説明しました。第11回のブログではライブラリ、ストレージ ポリシー、サブクライアントの関係性を図にしましたが、今回はここにグローバル重複排除ポリシーを追加し、これら4つのコンポーネントの関係性を図にしてみました。下図をご覧ください。 

 

  • ライブラリは、バックアップしたデータの保存先です。重複排除機能を使用してバックアップを行う場合、ディスク ライブラリ、クラウド ストレージ ライブラリのどちらかを使用します。
  • グローバル重複排除ストレージ ポリシーは、複数のストレージ ポリシーで共用できるDDBを作成し、重複排除の効率を上げるために設定します。グローバル重複排除ポリシーの中には、使用するライブラリやMediaAgent、重複排除や暗号化等の設定が含まれます。
  • ストレージ ポリシーは、バックアップしたデータをどのように管理するかを定義します。グローバル重複排除ポリシーを使用する場合、ストレージ ポリシーの中では、保持期限の設定や使用するグローバル重複排除ポリシーを指定します。
  • サブクライアントでは、バックアップ対象のデータをどれにするかを定義します。このサブクライアントにストレージ ポリシーを割り当てることで、バックアップされたデータがどのように管理されるか、すなわち、どこに、どのようにして保存されるか、が決まります。 

Commvaultをインストール後に設定を行う時、グローバル重複排除ポリシーを使用する場合は、ライブラリ、グローバル重複排除ポリシー、ストレージ ポリシー、サブクライアントの順に設定を行っていくとスムーズに進められるのでお奨めです。今後Commvaultの構築を行う機会のある方は是非試してみてください。 

※このブログでご紹介している画面ショットは、Commvault v11 Service Pack 13の環境で確認したものです。
※このブログ中で紹介している画面ショットには、一部ぼかしが入っておりますことをご了承ください。

 

【参考資料】

前回の記事へ | 次の記事へ

Posted on 2019.04