株式会社ネットワールドのエンジニアがお届けする技術情報ブログです。
各製品のエキスパートたちが旬なトピックをご紹介します。

【Dell Blog】PowerStore Prime!! Version 4.0の性能向上の秘密に迫る!!

皆さんこんにちは

ネットワールドストレージ担当武田です。

 

今回も引き続きDell Technologies Worldでも目玉として発表されたPowerStore Primeについてのご紹介です。

私も現地ラスベガスへいきDell Technologies Worldへ参加してきましたが、様々な製品の紹介がある中で、Dell社がもっとも力を入れて発表していたのがこのPowerStoreでした!

Michael Dell氏が基調講演で紹介し、展示ブースでも大きく場所をとって展示されておりました。

PowerStore PrimeというのはPowerStore OSの Ver4.0系以降のバージョンを指すローンチIDとのことです。

従来のVer3.xまでは多くのプライマリストレージにおいてできることがPowerStoreではできないということがありました。

それらの課題を解消しつつ新たに性能改善や新機能を盛り込みパワーアップしたのがVer4.0であり、PowerStore Primeであると考えていただけてければいいのかなと思います。

主な新機能や改善点についてざっと上げると以下の通りとなります。


ごらんの通り様々なエンハンスが行われたのですが、今回は性能向上について深堀りしていきたいと思います。

まず性能が向上したといってもどの程度かという点ですが、Dell社が発表した内容によるとVer4.0になったことでソフトウェアベースで最大30%程度の性能向上が見込めるとのことです。

ソフトウェアベースで……つまり全く同じハードウェアモデル、物理環境であってもOSのバージョンをVer3.xからVer4.xに上げるだけで性能が30%アップするという話です。

もちろん利用用途やその他環境によって増減はあるため、あくまで最大という点は理解しつつVer3.xVer4.xの性能の比較を行っていこうと思います。

まずは検証に使う環境についてご紹介します。以下の通りでモデルはPowerStore 1200T100Gポートを搭載しているモデルとなります。サーバはPowerEdgeを使用します。

こちらの条件でiSCSINVMe over TCPの性能を検証していきます。



ワークロードパターンは125パターンの異なるワークロードを用意し確認していく性能検証となります。

1パターンごとにブロックサイズを4KB、8KB、16KB、32KB、64KBと大きくしていき次に5パターンずつRandom/Sequentialの割合を100%/0%、75%/25%、50%/50%、25%/75%、0%/100%と変更していきます。

最後に25パターンごとにReadとWriteの比率を100%/0%、75%/25%、50%/50%、25%/75%、0%/100%と変えていき、異なるワークロード125パターン分を流していく形での性能検証となります。

HCIベンチを利用するにあたってスレッド数や負荷かけ時間などのチューニング要素はあるのですが、長くなってしまうので本稿では割愛させていただきます。

この条件でまずはiSCSIの平均IOPSの値を見ていきます。


少し見づらくて申し訳ないのですが、Ver3.6オレンジの点線Ver4.0です。ReadのみやReadの方がメインのパターン1~50までであれば一定の性能向上(15%程度)が見られました。

数字で言うとVer3.6だと130,000IOPSほどだったワークロードパターンがVer4.0になったことで150,000IOPSほどへ向上した個所もありました。

その中でもブロックサイズが小さい方が差は大きく、ブロックサイズが4KB...8KB...16KB…と大きくなるにつれて差は小さくなっていき64KBになるとほとんど差は無くなっています。

その後、ReadとWriteの割合が同じかWriteの方が多くなるパターン51~125までで見るとほぼ同程度の性能値となっており、ほとんど性能の向上はないという結果になりました。

続いてNVMe over TCPの平均IOPSの結果です。

NVMe over TCPについても概ね同様でReadがメインのワークロードにおいては一定の性能向上が見られました。

もっとも差の大きいRead100%、BlockSize4KB、Random100%のワークロードにおいてはVer3.6204,029IOPSでVer4.0265,219IOPSとなりましたので、事前情報通りおよそ30%程度の性能向上となりました。

Writeの割合が増えてくる後半部分についてはVer3.6Ver4.0でほとんど差はみられませんでしたが、ややグラフは安定してきたように見えます。

 

念のためどこのコンポーネントがネックになっているのかという点についても補足させていただきますが、これはPowerStoreのCPUがネックになっているものとみられます。

サーバ側を確認すると各ホストとも性能検証時に負荷は上がっておりますが、それでも50%~60%ほどですし、ネットワーク構成は100Gの環境となっています。

それに対してPowerStore1200T側は下図の通り両ノードともWriteが50%を超えてくる後半のタイミングでCPUの使用率が90%以上で張り付いておりますのでボトルネックPowerStoreのCPUであると考えられます。

この傾向はいずれのバージョン、プロトコルであっても同様でした。

赤の点線で囲われた前半の部分が性能の上がったReadがメインのワークロードにあたると思われます。

つまり比較的負荷の低いReadがメインのワークロードであれば性能上昇の余地があったが、Writeが入り負荷が上がってくるとCPUが限界のためこれ以上の性能向上が見込めなかったと考えられます。

これらの結果からPowerStoreの製品レンジの中でもローエンドにあたるPowerStore1200Tモデルで本検証を行ったため、期待するような劇的な性能向上は見られなかったものと思われます。

たとえばさらにハードウェアリソースが潤沢な5200T以上のモデルなどで検証を行えばReadがメインの時に限らず、より顕著にバージョンアップによる性能向上の恩恵が得られたのではないでしょうか。

 

 

結論をまとめさせていただきますとVersion3.6Version4.0になったことで間違いなく性能は向上しました。

しかしながらその効果は限定的でReadが優位のワークロードパターンに限られました。

全体で見たら少々期待外れという方もいらっしゃるでしょうか。。。

ただこれは冒頭で申し上げました通り、ソフトウェアベースで得られた結果となります。

まるっきりハードウェアの構成は変えずにバージョンアップを実施するだけですので、追加の費用は一切かかっておりません。

PowerStoreはバージョンアップをオンラインで実施できますし、所要時間も私が実施した際は2時間弱で完了しました。

また今回は1200Tモデルを使用した検証だったので、ハードウェアが増強された上位のモデルであればバージョンの違いによる性能差はさらに大きくなっているものと思われます。

Ver4.0になったことによる機能強化はこれまでも記事にしてきた通りですが、バージョンが上がるだけで性能も向上するという点はユーザー様はもちろん。製品を提案する立場の方にとっても非常にありがたいのではないでしょうか。

 

最後にこれらの性能検証はあくまで弊社独自の環境で行った内容となります。

特定の製品の組み合わせ、ツール、負荷パターンの中での比較検証となりますので、条件によっては異なる結果となる点と性能値を保証するものではないことをご理解頂ければと思います。

 

以上、最後までご覧いただきありがとうございました!!

 

Networld Techのブログ一覧はこちら!

https://www.networld.co.jp/product/emc/tech-blog/