皆さんこんにちは。
Data Domain の時間がやってまいりました。
Data Domain の担当を行っているとお客様から色々なご質問を頂きますが、今回ご紹介するご質問はこれ!
Data Domain をファイルサーバのように使用したいです!
似た質問に、「ファイルサーバのコピー先として Data Domain を使用したい」等があります。
DD Boost (第四回を参照ください) を使用しない場合は、Data Domain へのアクセス方法は CIFS や NFS になることがほとんどです。
ファイルサーバも CIFS でアクセスすることが多いので、Data Domain をそのように使用したくなる気持ちもわかります。よ~くわかります。
ファイルサーバと同じように使用出来て、保存した瞬間に重複排除で容量削減!!!もう保存先の容量を気にする必要もないという夢のような話ですよね。
ですが、Data Domain はバックアップデータ専用の重複排除ストレージです。残念ながらファイルサーバのようには使用できません。これから Data Domain をファイルサーバのように使用してはいけない理由をご紹介致します。
1. Data Domain への同時接続数には制限があります。
下の表をご覧ください。Data Domain への最大同時接続数を表にしてみました。エントリーモデルである DD160 や DD2200(mini) は同時に読み取れるストリーム数は 4~6 しかありません。同時書き込み数も 16~35 と決して多くはありません。
数人が Data Domain 上のファイルを開いていたら他の人は Data Domain にアクセスすることが出来なくなってしまいます。
これではファイルサーバとして使用することは出来ません。
2. Data Domain は細かい大量のファイル操作が苦手です。
Data Domain は大きなファイルを書き込みすることは得意です。それこそ、バックアップデータのような。
ですが、大量のファイルを書き込みすることは苦手です。
Data Domain はファイルを書き込みする際に重複排除処理の他にファイル情報も処理します。ファイルのパスや属性値などは通常のファイルサーバも持っていますが、Data Domain はその他にファイルを復元するためのポインタ情報も持ちます。
つまり Data Domain は通常のファイルサーバが行う処理に加えて「重複排除」「ポインタ取得」という処理を行っているため、大量のファイルを保存しようとするとパフォーマンスが非常に悪くなります。
大量のファイル、良くない…
少量のファイル、良い!!!
上記の処理はファイル単位に行われますので、同様に細かいファイルの場合もパフォーマンスが下がってしまいます。
3. Data Domain はファイルの読み込みも苦手です。
2つ目の理由と似たような話ですが、ユーザが Data Domain 上のファイルを参照(読み込み)する場合、Data Domain の中ですがファイルの複合処理が実行されます。その処理分、読み込みも遅くなってしまうんですね。そのため、Data Domain は最大書き込み数よりも読み込み数の方が少なく設定されています。
今回の内容はここだけで良いかもしれません。
簡単に言うと、Data Domain は読み込み / 書き込み時に通常のファイルサーバよりもたくさん処理を行うため、頑張ってもパフォーマンスが出ません。
また Data Domain へ同時にアクセスできる数が限られているため、ファイルサーバとしての使用に耐えられない可能性が高いです。
大容量ファイルの書き込みに特化していると言っても良いと思います。
で、終わってしまうと Data Domain 使えないね、で終わってしまうので少しだけ続けましょう。上記については、裏返すと上の3つの制限に引っかからない、もしくは引っかかっても問題のない場合にはファイルサーバのように使用することができます。
・同時にファイルを読み込まない。
・1日一回ログファイルを保存する等の用途として使用。
・パフォーマンスなんて飾りですよ!的にパフォーマンスが遅いのを気にしない。
既にファイルサーバとしてどうなの、という感じですが、実際は Data Domain をファイルサーバとして使用しようと思えば出来てしまいますので、そこは自己責任でお願いします。
以上、今回は やってはいけない Data Domain というお話しでした。
担当 齋藤・吉田
- 過去記事 -
- なぜなに Data Domain - 第一回 - Data Domain って何ですか?
- なぜなに Data Domain - 第二回 - Data Domain の重複排除でバックアップの悩みを解決!
- なぜなに Data Domain - 第三回 - Data Domain 重複排除レプリケーションで手軽にDR
- なぜなに Data Domain - 第四回 - Data Domain DD Boostでバックアップ性能を向上!
- なぜなに Data Domain - 第五回 - Data Domain Snapshot 機能を使ってみよう
- なぜなに Data Domain - 第六回 - Data Domain ファイルシステムの使用状況の監視