みなさん、こんにちわ。本記事は「実況中継!? VSAN 6.2 中の人によるふかーい話」の続編にあたります。
以前の記事はこちらです。
本記事はTech Field Day主催のイベントStorage Field Day 9内で2016年3月18日に実施されたVMware社のStorage & AvailabilityのCTOであるCristos Karamanolis氏のプレゼンテーションの録画から様々な情報を抜き出したものです。妙にマニアックな質問もありますし、実装手法をどう選んだかについてもCTO自ら意見しているケースも有りますので興味のある方は是非ビデオもご覧になってください。
実況中継というか、なんというか、ビデオから文字を起こしていますのでなんとなくゆる~い感じになってしまっていますが、内容はかなり濃いです。濃すぎてあえて文字にしなかった部分もありますので、そこは生のビデオを御覧ください。こちらの記事は雰囲気も含めてお楽しみいただければ幸いです。ベンチマークソフトを利用しての検証結果が中心ですので、重複排除や圧縮が特に聞きやすいテストになっていたり、ということもありますので、あくまでご参考としてご理解いただければ幸いです。
トランザクショナルワークロードでのIOPS
DVD StoreはTPC-Cのようなワークロードで、DVDのオンラインショッピングで顧客がDVDを購入するというトランザクションを発生させるツールです。そしてBrokerageはTPC-Eのようなワークロードで証券マンが顧客の要望を元にトレーディングを行うようなトランザクションを模したものとなります。分析を行ったり、株式マーケットのシステムとも統合されているものです。
DVD Storeの処理はCPUで多くのことが行われさほどIOはかかりません。結果はすべての機能を有効にしたとしても殆ど変わらないということが出来ます。
Brokerageの場合は小さなサイズのIOが高いIOPSで処理されます。ベースラインは40,000IOPSですが、圧縮処理とイレイジャーコーディングで25,000IOPSほどまで性能が劣化しています。エンドユーザーとしては選択肢が用意されます。つまりパフォーマンスを取るか、キャパシティを優先して効率化機能を利用するかどうかです。パフォーマンスは崖から落ちるような具合には劣化はしません。
会場より : 重複排除で大体25%ぐらいの劣化ということですね。
その通りです。このワークロードでは非常に重複排除のコストが高かったです。基本的にこうしたワークロードでは重複排除での削減効果あまりないはずです。(補足:実際には重複排除と圧縮の機能を切り離して有効にすることはできません。また、後のスライドで容量削減効果のスライドが出てきますが、そこではベンチマークであるがゆえにそこそこの効果を得られていますが、実際の環境では重複排除効果はここで言うように小さなものになるはずです。)
トランザクショナルワークロードでのレイテンシ
DVD Storeの場合のレイテンシは2ミリ秒~3ミリ秒の間で様々な機能の有効/無効はほとんど影響がありませんでした。
一方でBrokerageを利用した場合、1ミリ秒ほどだったレイテンシがすべてを有効にすると6ミリ秒近くまで上昇しています。先ほどのスライドであらかた予想できたことですが、その通りになっています。
会場より : そうすると、クラスタ単位で重複排除するのではなく、アプリケーションごとに選べるようにしたほうが良かったのでは?
そうすると、今度は別のパラメーターを考えなくてはいけなくなり、複雑になってしまいます・・・。
トランザクショナルワークロードでのCPU利用率
DVD StoreはCPUを多く利用しますが、IOのためにそれが使われているということはなく、機能を有効にしてもほとんど代わりはありません。3%~4.2%程度で一貫しています。
Brokerageの方では20%近くのCPU負荷がかかっています。そしてCPUの負荷は70%程度に下がってしまっています。どうしてでしょうか?これはレイテンシが高いためにIOをそれ以上押しこむことができなくなっているからです。ですからCPUの負荷が下がっているのです。
会場より : とすると、単独のIOあたりの負荷は変わっていなくて、IOが少なくなった分負荷が下がっているだけなのか・・・。(訳注: VSANのIO処理が増えているのではなく、CPU全体の利用率が下がっているため、割合としてVSANのCPU利用率が増えているということです。)
そのとおりです!
トランザクショナルワークロードでの容量削減効果
これについてはさほど詳しくお話するつもりはありません。(訳注: ベンチマークテストゆえの結果であり、実際の環境の値ではこれと大きく異る可能性があります。)
DVD Storeの場合75%ほどの容量削減効果が得られています。実際のデータセットを考えれば予想ができる数字です。
Brokerageの方も同様です。実際のデータセットのサイズを反映した値になっています。
さて、次でいよいよ最後です。次回は障害発生時のパフォーマンスについての内容です。
記事担当者: マーケティング本部 三好哲生 (@pernixdata_netw)