« ONTAP8.3降臨編 これであなたも!ONTAPシミュレーターマスターだだだっ!!⑦ | メイン | PernixData FVP 3.0 What's New »

2015/11/01

いま、そこにある高速バックアップNetBackup編

さっそくですが今回は"できるだけバックアップ時間とバックアップ容量を減らしたい"という視点でNetBackupの重複排除バックアップアクセラレーターバックアップを紹介しようと思います。

まずは基本的な【フルバックアップ】、【差分バックアップ】、【増分バックアップ】の違いを確認します。

【フルバックアップ】はバックアップ対象として指定したパス内に存在する全てのファイルをバックアップします。

【差分バックアップ】はフルバックアップ以降に追加されたファイルや変更されたファイルをバックアップします。NetBackupでは累積増分バックアップと呼称します。

【増分バックアップ】は前回の増分バックアップ以降に追加されたファイルや変更されたファイルをバックアップします。NetBackupでは差分増分バックアップと呼称します。

差分バックアップや増分バックアップについて、他のバックアップ製品とは用語の扱いが異なることがありますのでご注意いただきたいところです。

毎日1回バックアップを実行すると仮定して、これら3種のバックアップをイメージ化すると次のようになります。

Photo

フルバックアップ】は何度も同じ対象をバックアップするので、大容量のバックアップ保存領域を用意する必要がありますし、バックアップに要する時間も長くなります。

累積増分バックアップ】は回を重ねるごとに同じ対象をバックアップする量が増えますので、やはりバックアップ保存領域の少量化、バックアップに要する時間の短縮のために同じファイルをバックアップすることが少ない【差分増分バックアップ】を選択したいところです。

しかしながら、【差分増分バックアップ】の効果が半減することがあります。

それはバックアップ対象のファイルの状態が頻繁に更新される場合です。

A1_3

例えば、上図ようにファイルの内容は変えずにファイル名を変更します。ファイルの内容は同じなのに、たったこれだけの変更でも、【差分増分バックアップ】の対象となり、ファイル全体が再度バックアップされます。ファイル名の変更はバックアップ対象になる変更の一例として挙げただけで、ファイルの内容そのものに更新があれば、もちろんファイル全体が次のバックアップの対象になります。このように、バックアップ対象サーバーのストレージ内のファイルの多くが高頻度に更新されるような場合、【差分増分バックアップ】のバックアップ保存領域の少量化、、バックアップに要する時間の短縮効果はなくなってしまいます。

実際に試してみました。

Photo

80GB(715ファイルの合計サイズ)をフルバックアップすると、所要時間は22分55秒でした。

次にバックアップ対象に何も変更を加えずに差分増分バックアップを実行すると24秒でバックアップが完了しました。

最後に、バックアップ対象ファイル全ての名前を変更したあとに再度差分増分バックアップを実行すると所要時間は21分15秒でした。

そして、バックアップに必要は容量は1回目:80GB、2回目:ほぼゼロ、3回目:80GBという

結果になりました。つまり、ファイルの更新が少なければとても高速なバックアップが可能ですが、更新ファイルが多ければバックアップに必要な時間も容量もフルバックアップに近くなる傾向があります。

これらをできるだけ改善するために使用する機能がこれからご紹介する重複排除バックアップとアクセラレーターバックアップです。

 

前述した従来の増分バックアップでは、バックアップ対象の最小単位が"ファイル"です。

そのためファイル名の変更や、ちょっとした内容更新であってもファイル全体をバックアップしなおします。また、異なるファイル同士の内容の比較を行うこともありませんので、まったく内容が同じであってもファイルが10個あれば10個バックアップします。

2_5

対して、重複排除バックアップはファイルをさらに小さなブロックとして認識し、重複ブロックを排除して結合したものをバックアップとします。従って、類似のブロック構成のファイルを無駄なくバックアップすることになります。

Photo_3

NetBackupの重複排除バックアップには大きく分けて2種類あります。

・メディアサーバー重複排除

・クライアント重複排除

NetBackupでは、サーバーOSかクライアントOSかに関わらずNetBackupのバックアップエージェントをインストールした対象をクライアント(NetBackupクライアント)と呼称します。

また、バックアップ装置を認識し、制御するサーバーのことを、メディアサーバーと呼称します。

NetBackupクライアント側で重複排除を実施するバックアップをクライアント重複排除バックアップ、メディアサーバー側で重複排除を実施するバックアップをメディアサーバー重複排除バックアップと言います。

重複排除バックアップのためのバックアップ先にはメディアサーバーのOSがブロックデバイスとして認識できるストレージを使用します。*テープ装置やVTL装置、ネットワークドライブは重複排除バックアップに利用することはできません。

以下に重複排除バックアップの種類を図示します。

1_3

 

Photo_4

2_2

Photo_5



3_3

メディアサーバー重複排除バックアップの対象にできるものとして、NetBackupクライアント内のファイルのほか、VMwareVMや、NDMP対応NASのファイルなどがあります。

Photo_3

クライアント重複排除はNetBackupクライアントをインストールしたバックアップ対象で重複排除処理を行ってからバックアップデータを送信しますので2回目の以降のバックアップに際してNetBackupクライアント-NetBackupメディアサーバー間のネットワーク負荷が低く済むという特徴があります。この特徴を利用して、複数拠点サーバーのバックアップを狭帯域のネットワークを利用して1箇所の拠点に集める構成も可能になります。

Photo_6

重複排除バックアップは重複排除ブロックを検出するためにファイルのすべてのブロックをバックアップの度にスキャンします。過去にバックアップしたファイルもブロックスキャンするため、バックアップタイプをフルバックアップにしてしまうと、バックアップの速度が遅くなってしまいます。

Photo_7

そこで、NetBackupのバックアップポリシー(バックアップジョブ実行時の動作を決めるパラメーター)で、Accelerator機能を有効にするためのチェックボックスをマークすることをお奨めします。

Photo_9

Accelerator機能はバックアップ済みファイルをトラックログに記録しておき、次回以降の重複排除処理スキャンを実行しないようにします。加えて、バックアップの度に既存のバックアップと最新のバックアップを合成してバックアップイメージを作成します。

これによって、フルバックアップのみの運用で"差分増分バックアップ"と同等のバックアップ速度を得られることとなります。

*Accelerator機能は従来の合成バックアップとは異なり、合成のためのテンポラリ領域を必要としません。

*テープやVTLへの重複排除バックアップ、Acceleratorバックアップはできません。

Accelerator機能を有効にした状態で3回フルバックアップを実行した結果を下記に示します。また、比較のために従来のフルバックアップと差分増分バックアップの結果も示します。

バックアップ条件:

バックアップ対象:計100GB(20万ファイル)

1回目と2回目のバックアップ間はバックアップ対象データ更新ナシ

2回目と3回目のバックアップ間に10万ファイルのファイル名変更を実施

1_2

アクセラレーターバックアップのメリットを下記にまとめてみます。

・差分バックアップのバックアップ速度をフルバックアップケジュールのみで運用できる

・フルバックアップのみの運用なので全ファイル復旧時も最後のフルバックアップからリストアすれば良い

・バックアップに必要なストレージ容量が他のバックアップ手法に比べて少ない

それでは今回はこれで失礼します。

担当:磯前