Skip to content
Clumio, Cyber Resilience & Data Security, Data Protection

Closing the Gap in Data Lakehouse Protection: Clumio for Apache Iceberg on AWS

Consider the business risk behind AI and analytics.


AIとアナリティクスは、あらゆる業界において競争優位性をもたらしています。この変革の中心にあるのが、Apache Icebergを基盤とするデータレイクハウスです。Icebergは現在、Amazon S3などのオブジェクトストレージにおける構造化データの標準規格として、最も急速に普及しているもののひとつとなっています。小売や医療から金融、テクノロジーに至るまで、IcebergはAIによるインサイトを支えるパイプラインを駆動しています。

しかし、導入が急増している一方で、耐障害性はそれに追いついていません。Icebergのネイティブツールは、長期的なデータ保護を目的として設計されていません。コンプライアンス、ランサムウェアへの耐性、迅速な復旧という点では不十分です。企業にとって、このギャップは単なるデータ損失にとどまらず、規制当局からの罰金、AIモデルの不備、そしてイノベーションを阻害する高額なダウンタイムにつながる可能性があります。

ネイティブツールが機能しなくなった事例:ある金融企業の事例

毎日数十億件の取引を処理するグローバルな金融サービス企業を例に挙げてみましょう。数分おきに、取引データがIcebergのテーブルに書き込まれます。規制により、この企業は取引の完全な履歴を7年以上保持することが義務付けられています。

Icebergのネイティブスナップショットでは、これはすぐに管理不能な状態に陥る恐れがあります。スナップショットの数が多すぎるとパフォーマンスのボトルネックが発生し、わずか5か月前のイベントへの復旧には、時間がかかり、手作業を要するプロセスが必要となります。ダウンタイムが数百万ドルの損失に直結する金融業界において、これは到底容認できる状況ではありません。

そして、この課題は金融業界に限ったものではありません。Iceberg上でAIや分析を実行しているあらゆる業界が、保存期間の制限、脆弱な復旧プロセス、ランサムウェアへの曝露といった、同様のリスクに直面する可能性があります。

汎用的なS3バックアップでは不十分な理由

一部の組織では、その場しのぎの対策として標準的なS3バックアップツールを利用しています。これらはエアギャップ化が可能ですが、データファイルはコピーされるものの、Icebergテーブルを定義する関係性は保持されません。

つまり、復旧は単純なリストアではなく、テーブル構造全体を再構築するための、複雑で手作業を要する「再配線」プロセスとなります。数十億件の取引を扱う金融企業にとって、これはダウンタイムの長期化、コストの増加、そして潜在的なデータ損失につながります。

ClumioはIcebergをネイティブに理解することでこの問題を解消し、高速かつ正確で、トランザクションの一貫性を保った復旧を実現します。

スマートな解決策:Clumio for Apache Iceberg

Commvaultは、Icebergに対応し、エアギャップ環境におけるサイバーレジリエンスを実現する業界初かつ唯一のソリューション「Clumio for Apache Iceberg on AWS」により、この課題を解決します。

その特徴は以下の通りです:

  • パフォーマンスを損なうことなく無制限の保存期間を実現 – 本番環境の速度を低下させることなく、長期的なコンプライアンス要件を遵守します。
  • エアギャップ方式による不変性の保護 – ランサムウェア、アカウントの乗っ取り、誤削除からシステムを守るよう設計されています。
  • 高速かつIceberg対応の復旧 – テーブルの整合性を完全に維持したまま、任意の時点または指定されたスナップショットへの復元が可能です。
  • リージョン間およびアカウント間の復旧 – AWS環境全体に回復力を拡張し、検証可能な災害復旧を実現します。
  • コスト効率に優れた増分バックアップ – 変更部分のみをキャプチャすることでコストを最小限に抑えつつ、大規模なワークロードに合わせてスケーリングが可能です。

詳細については、当社のプレスリリースに掲載された発表記事をご覧ください

ネイティブ・スナップショット、汎用 S3 バックアップ、および Apache Iceberg 向け Clumio の比較

機能 Iceberg ネイティブスナップショット 汎用 S3 バックアップ Apache Iceberg 向け Clumio
保存期間 制限あり。スナップショットが過剰になると、パフォーマンスのボトルネックを引き起こす可能性があります 長期保存は可能ですが、ファイルレベルに限定されます 無制限、コスト効率に優れ、コンプライアンス対応を前提に設計
エアギャップによる保護 ✘ 同じAWSアカウント内に存在(テーブルが削除されると失われる) ✓ エアギャップ化は可能だが、Icebergには対応していない ✓ ランサムウェアへの耐性を備えた、エアギャップ化された不変のストレージ
復旧プロセス 手動(特に古いスナップショットの場合) テーブルのメタデータとマニフェストを手動で「再設定」 高速かつ自動化された、Iceberg対応の復旧
データの整合性 トランザクションの一貫性は確保されますが、ガバナンスおよびコンプライアンス上の責任が生じます Iceberg メタデータの理解が不十分であり、復元結果に一貫性がない トランザクションの一貫性を維持し、完全な忠実度で復元
エンタープライズ規模 長期保存には不向き。ストレージコストが高い 大規模環境では脆弱でエラーが発生しやすい 数十億のオブジェクトを抱えるペタバイト規模で実証済み

 

貴社のビジネスにとって重要な理由

Clumioは単にファイルを保護するだけでなく、AIやアナリティクスへの投資を保護し、それらが確実に成果を生み出すようにします。この新機能により、企業は以下のことが可能になります:

  • 重要なパイプラインを支えるデータを保護することで、自信を持ってAIイノベーションを加速させることができます
  • 無制限かつコスト効率に優れたスナップショットの保持により、コンプライアンス違反による罰則を回避できます
  • 脆弱で手作業に依存したプロセスを排除するように設計された、Iceberg対応の自動化により、数日ではなく数分で復旧を実現します
  • ランサムウェアや内部脅威に対する真のエアギャップ保護により、サイバーレジリエンスを強化します

未来に向けたレジリエンスの構築

データレイクハウスがデジタルビジネスの基盤となる中、レジリエンスは後回しにしてはなりません。AWS上のApache Iceberg向けClumioにより、企業はついに、AIおよび分析ワークロードの規模、速度、重要性にふさわしいソリューションを手に入れることができます。

結局のところ、重要なのは単にデータを保護することだけではありません。ビジネスそのものを保護することなのです。

Iceberg対応のレジリエンスを活用し、AWS GlueおよびAmazon S3 Tablesによって管理されるIcebergテーブルを保護する方法をご覧ください

詳細についてご興味をお持ちですか?今すぐデモをリクエストしAWS Marketplaceで無料トライアルにお申し込みください。

 

 

 

More related posts


888×500-blog.4

Solving The Challenges of AWS Backup

Read more about Solving The Challenges of AWS Backup
People-walking-around-meeting-room-Crocus-Thumbnail-2

Exploring Cloud Backup Options: A List of Considerations

Read more about Exploring Cloud Backup Options: A List of Considerations
Thumbnail_Blog-GoogleWorkspace-2026

How the Move to Clumio Delivered 66.7% Savings on AWS Backups

Read more about How the Move to Clumio Delivered 66.7% Savings on AWS Backups