関連アーティクル

仮想化がもたらしたバックアップのパラダイムシフト

2008/04/01
概略 Gartner により 2008 年の「メガトレンド」と評され、あらゆる規模のデータセンターで利用されている VMware ソフトウェア。しかし、仮想化技術の利用に伴い、データ保護に関する新たな問題も発生しています。 さらに、今日多くの企業における年間のデータ増加量は、30% ~ 50%にも上ると言われ、これを解決することが急務です。

はじめに

Gartner により 2008 年の「メガトレンド」と評され、あらゆる規模のデータセンターで利用されている VMware ソフトウェア。この仮想インフラソフトウェアを使用する企業は増え続け、IT 運用の効率とコストパフォーマンスを向上させています。Gartner はまた、仮想化技術が IT リソースの利用率を改善し、変化する要件や作業負荷に対応する柔軟性を向上させると見ています。

しかし、仮想化技術の利用に伴い、データ保護に関する新たな問題も発生しています。仮想環境を保護するための最適なソリューションとはどのようなものでしょうか。「オンホスト」バックアップは、「オフホスト」バックアップより推奨されるべきでしょうか。
このアーティクルでは、異なるバックアップ構成について詳細にわたって見ていきます。また、今日の進化するバックアップとリカバリ要件を満たす「データ重複排除機能の重要性」についても紹介します。

バックアップパラダイムの変化

仮想化は、データ保護におけるバックアップパラダイムを根本的に変えました。 長年利用されてきた標準のバックアップ技術は、仮想環境に十分に対応していなかったのです。

基本的に VMware 環境においては、次の 3 種類のバックアップがあります。

1) 各仮想マシン内のクライアント経由によるバックアップ
2) VMware サービスコンソール 内のクライアント経由によるバックアップ
3) VMware Consolidated Backup をベースとしたオフホスト技術によるバックアップ

次に構成について見てみましょう。

1) 各仮想マシン内のクライアント経由によるバックアップ
仮想化技術が搭載されてはいますが、仮想マシン ( VM ) は、仮想ハードウェアがホストするオペレーティングシステムの完全なインストールです。これらのインストールは、物理マシンと同じ基本的な方法、つまり、ゲスト OS 内のバックアップクライアントによりバックアップされます。 VM 内でのクライアントの実行がサポートされています。標準の OS サポート規則が適用されます。 この方法での VM のバックアップは、本質的には物理マシンのバックアップと同じです。

2) VMware サービスコンソール 内のクライアント経由によるバックアップ
これは、仮想マシン内にバックアップソフトウェアがインストールされていないという意味から、オフホストバックアップ技術と考えられます。サービスコンソール 内にクライアントをインストールすると、VM を構成するファイル ( vmdk ファイル ) に直接アクセスできるようになります。 この方法は、仮想マシンの電源が切れている場合、最も簡単に実施できます。この状況では、仮想マシンは固定で、変更されません。 VM の電源が入っている場合、バックアップ操作中も VM が一貫した状態を保ち続けるために、バックアップ前の処理やスクリプトを追加で実行することをお勧めします。これには、ホストの ESX Server に組み込まれたスナップショット機能を利用することもできます。

3) VMware Consolidated Backup をベースとしたオフホスト技術によるバックアップ
VMware Virtual Infrastructure 3 ( VI3 ) を導入すると、仮想マシンのオフホストバックアップが可能になります。 ESX Server 上で影響を最小限に抑えつつ頻繁にバックアップを行うことは、ESX Server のバックアップにおける理想です。 VCB ( VMware Consolidated Backup ) 技術を利用すると、これを実現できます。VI3 の一部である VCB は、仮想マシンのスナップショットをまとめて、オフホストクライアントに転送します。オフホストバックアップの利点は、ESX Server やホストされている仮想マシンにおけるバックアップ処理の影響を大幅に削減することです。これによって、より頻繁にバックアップを行うことができます。VCB では、仮想マシンの vmdk ファイルのバックアップを行うこともできます。
バックアップソリューションのなかには、vmdk ( 仮想マシン全体 ) レベルでのバックアップのみを行うものや、バックアップパスを 2 つ使用して、vmdk のリストアと 単一の OS ファイルのリストアを行うものがあります。一般的に、ほとんどの企業では、万一の場合に備えてオプションに制限を加えたくないと考えています。たとえば、仮想マシンがウイルスに感染したり、ユーザーの不注意なエラーによりダメージを受けたりした場合、単一ファイルのリストアはあまり意味を持ちません。仮想マシン全体をリストアする必要があります。しかし、削除した 1 つのファイルだけをユーザーがリカバリする場合 ( リストア操作の最も一般的な例です )、仮想マシン全体をリストアするのは大掛かりになり、またダウンタイムが発生します。

このソリューションでは、当然単一ファイルのリストアと vmdk ( 仮想マシン全体 ) のリストアのどちらでも可能です。また、リストアする際には、オフホストバックアップと 1 つのバックアップパスによるパフォーマンスの利点を保持するようにします。

データ重複排除の重要性

今日の多くの企業におけるデータの継続的な増加量は、1 年間に 30%~50%にも上り、バックアップ処理の負担は非常に大きくなっています。ほとんどの場合、利用可能なネットワーク帯域幅は、データの増加に対応することができません。 バックアップウィンドウへの対応は、依然としてデータセンターだけにとどまらない課題です。

このような状況では、データ重複排除技術によりバックアップ ( そしてバックアップに必要なネットワーク帯域幅 ) のサイズを削減するディスクベースのバックアップソリューションを検討する企業が増えるのも当然です。データ重複排除技術を利用すると、費用対効果の高い方法で、テープによるバックアップをディスクベースのバックアップで代用することができます。

一般的に、データの重複排除では、すべてのバックアップデータおよびすべての場所にわたって、バックアップデータ内のサブファイルまたはブロックレベルで冗長なインスタンスを検出することによって、バックアップに必要とされるストレージを削減できます。データ重複排除技術はまた、異なるサイト間で大量のデータを送信する際に必要な帯域幅を削減できるため、ディザスタリカバリ機能も向上します。

シマンテックでは、データセンター、仮想環境、リモートオフィスにデータ重複排除を配備することで、毎日の完全バックアップに必要なネットワーク帯域幅が最大で 1/500 になり、バックアップで消費される総ストレージ容量が 1/10 ~ 1/50 になるものと推測しています。

まとめ

VMware の仮想インフラソフトウェアはあらゆる企業で使用され、IT 運用の効率とコストパフォーマンスを向上させています。しかし、仮想マシン技術が革新的であるのと同時に、データ保護に関する新たな問題も発生しています。VMware 仮想化技術を採用している組織では、VMware 環境に特化して拡張されたバックアップおよびリストア機能を備えたソリューションを検討することを強くお勧めします。同時に、仮想環境、データセンター、そしてリモートオフィスで使用するデータ重複排除技術についても検討することをお勧めします。