« FVPのリンククローンの最適化 パート1 | メイン | EMC Electってご存知ですか? »

2015/03/18

なぜなに Data Domain - 第五回 - Data Domain Snapshot 機能を使ってみよう

Dd

全国の Data Domain ファンの皆様こんにちは。

Data Domain のブログも第五回目です。

前回までで、Data Domain の基礎、、重複排除機能、レプリケーション機能、DD Boost機能、と良く使用される有名どころの機能をご紹介してきましたが、今回はData Domain の Snapshot 機能をご紹介します。

 

Snapshot は Data Domain の要となる「重複排除機能」「ブロック管理」を使用して実現していますので、どんなだったかな~という方は第一回~第四回までをおさらいして頂くと良いかもしれません。

 

■Snapshot って何でしょう

最近のミッドレンジ以上のストレージ製品ではこの機能が無いストレージは無いと言って良いほど使用されるメジャーな機能ですね。最近はエントリーモデルのストレージにも搭載されていたりします。

Snapshot はその時点のストレージ上のデータを保存しておく機能です。例えば1999/12/31 にSnaphot を実行した場合、いつでもその時点のデータを参照・復元することができます。Windowsで言えばVSS(Volume Shadow Copy Service)がそれにあたります。シャドウコピーとか言われているやつですね。これも、Snapshot を取った時点のファイルに戻すことができます。

 

 

■Data Domain Snapshot の特徴
 4つほど上げてみました。1つ、通常のストレージ製品と大きく異なる部分があります。

 

無償です

Snapshot 機能は別途ライセンスをご購入くださいな製品がある中、Data Domain は Snapshot 機能を使用するために別途ライセンスを必要としません。Data Domain をご購入頂いたお客様はどなたでも使用できます。使い放題です!これは使わない手はないですね!!

 

Snapshot用の領域は必要ありません

誤解されそうな書き方をしましたが、Snaptshot 機能を持っているストレージの多くは、Snapshot 機能を使用する場合は予め、ボリューム容量に対して何%までSnapshotで使用するのか定義します。この定義が、「一日の変更差分がこれくらいだから、1週間分の Snapshot を補完するのには○○% 必要だ」「○○%で本当に足りるのか?足りなかったらどうなる?」なんて議論を呼んでいたりもします。

Data Domain は Snapshot 用の領域は持っていません。というか持つ必要がありません。必要な容量を必要な時に必要な分だけ使用します。これは「Data Domain の保存データが全て重複排除データ」だからこそです。Snapshot データも当然重複排除されていますので、Snapshot の世代があってもボリュームの消費量はほんの少しです。

004

 

スケジューリングできます

基本機能と言えば基本機能ですが、Snapshot の名前や曜日指定、日付・時間指定、もちろん Snapshot の保持期間も指定できます。これができないと管理に人の手が必要になりますのでちょっと大変ですよね。Snapshot は「不要になったら消す」これ大事です。不要になっても何となくそのままにしていたら・・・いつの間にかディスクがいっぱいになっていた、なんてことにもなりかねません。
Data Domain では現在の Snapshot の一覧やスケジュール一覧はGUIで確認できますので管理もしやすいですね。

003_2

 

 

一瞬でSnapshot からファイルを復元できます

Data Domain では、Snapshot はもちろん、Snapshot から復元したファイルまで Snapshot 元の実体ファイルと同じブロックを参照します。新たにデータの書き込みがないため、ファイルのメタ情報を作成しておしまい!大容量ファイルであっても非常に高速に復旧できます。

015_2

 

 

■Data Domain Snapshot の仕組み


ご存知の通り、Data Domain は以下のようにファイルをブロックで管理しています。

Data Domain の Snapshot 機能を使用するとこのような管理になります。

005_5

 

 

006_2

 

 

実際は「.snapshot」という隠しフォルダが作成され、Snapshot データはこちらから Read することができます。

007_3

 

 

Snapshot データを使用(Read/Write)したい場合は Fast Copy 機能を使用します。

通常のフォルダ/ファイルとして復元(コピー)され Read/Write 可能になります。上述していますが、復元時はメタデータを作成するだけですので非常に高速です。

008

 

009


Write 後はこのようなブロックの管理となります。

ファイル変更後のブロックと同じブロックが存在していれば下図のように重複してくれます。さすが重複排除ストレージ!

010

 

 
■Data Domain Snapshot ってほんとうに容量を気にしなくて良いの?


厳密にはファイルに変更があると必要な容量は増えます。が、実は Data Domain の場合は Snaphot を使用していても使用していなくても Data Domain が使用するデータ容量はほとんど変わりません。なぜなら、Data Domain が自身の不要なデータを削除するのは通常一週間に1回なのです。何もしなくても一週間分のデータが Data Domain に蓄積されています。

それでは、一日だけ保持する Snapshot を毎日実行する場合と Snapshot を使用しない場合を比べてみましょう。

 

デフォルトは火曜日に不要なデータを削除しますので、火曜日に少しだけ使用容量が少なくなります。


Snapshot 未使用

011_4

 

 
Snapshot を使用

012_4

 

 

ほとんど変わらないですね。
Snapshot を保持する期間を長期間に設定しているとディスク容量を圧迫する場合がありますが、通常の運用ではそれほど気にする必要はありません。

 

 
■Data Domain Snapshot どんな時に使うの?

当然バックアップデータの破損に備えて、なのですが Data Domain ではこのような使い方ができます。

 

バックアップの度に前回のファイルを書き換え(マージし)てしまうバックアップソフトに対して


バックアップソフトの中には、前回のバックアップファイルとマージして新たなバックアップデータを作成するものもあります。このようなバックアップソフトを使用して、Data Domain のレプリケーション機能を使用している場合、レプリケーション途中で障害が発生するとレプリケーション先の Data Domain のバックアップファイルが中途半端な状態で更新され、データが役に立たなくなる可能性があります。

そのような場合は Data Domain の Snapshot 機能で1日一回 Snapshot を取りましょう。万が一レプリケーション途中でレプリケーション元サイトに障害が発生して、データの転送途中でレプリケーションが止まってしまってもレプリケーション先の Data Domain のデータを正常な1日前の状態に戻すことができます。

013_2

 

 
レプリケーション先のバックアップサーバでリストア試験を行いたい!!!

Data Domain のレプリケーション先フォルダは読み取り専用フォルダとなっていますので、バックアップソフトによってはレプリケーション先でそのまま使用することができません。通常、そのような場合はレプリケーションの削除(Destroy)を行わない限り読み取り専用を解除できません。リストア試験のためにレプリケーションを解除するのはイヤですよね。

Data Domain の Snaphot で解決しましょう!!!
Snapshot をFast Copy で復元することで Read/Write フォルダとして作成することができます。あらかじめ共有フォルダを作成しておいて、その配下に置くことで簡単にレプリケーション先のバックアップソフトでリストア試験をすることができます。

014

 

 

あまり使用されていない、でも意外とできる子な Snapshot 機能、如何でしたでしょうか。前述のとおり、Snapshot を使用しても使用していなくても Data Domain に必要な容量はほとんど変わりません。特にData Domain 同士でレプリケーションしている場合に効果を発揮しますので、ぜひご活用してみてください。

担当 齋藤・吉田