本ブログエントリーはPernixData社の顧客であるJon Byrum氏がPernixData社のブログに寄せた記事の翻訳版です。 Jon Byrum氏について、詳しくはこちらのLinkedinもご参照ください。
本記事の原文はIn the Trenches: PernixData FVP Software at a Leading Telecommunications Providerで閲覧可能です。
ネットワールドのPernixDataに関する情報はこちら。本ブログのPernixDataの記事のまとめはこちら。
編集者による注意事項: この投稿はPernixDataの顧客によるゲスト投稿シリーズの1つです。
我々のVMware環境は複数のテナントからなり、EMC社のVMAXストレージをバックエンドとしています。3つのクラスタに渡って550以上の仮想マシンがあり、それらの仮想マシンは程度の差はあるものの、ほとんどがリソースを多く利用するものです。ディスクリソースに対する高い負荷で、レイテンシの問題が出てくるようになってきました。そこで、我々はストレージ上の他のアプリケーションに影響が出ないようにパフォーマンスを上げる方法を模索し始めます。我々はSSDとして主流になってきたフラッシュをいくつかのホストに追加してみました。しかし、パフォーマンスは高い負荷がかかっていない時のFC SANと大体同じ程度でした。サーバサイドフラッシュをソフトウェアなしで追加しても効果はさほど出ないということが分かっただけでした。
我々はPernixData FVPソフトウェアを、まずはReadの高速化のためだけに使うところからはじめました。有効にした対象はほとんどの仮想マシンがSQLサーバを動作させているクラスタです。各ホストに搭載されていたSSD2本を再利用する形で割り当てしました。インストールは驚くほどあっさりと、簡単でした。本番環境で動き出すところまでに大体1日程度でした。にも関わらず、ストレージから取り除かれたトラフィックの総量は非常に感動的なものでした。このスクリーンショットは導入から大体1か月後に取得されたものです。15億回以上ものIOによる61TBのトラフィックがSANから取り除かれ、多くの負荷が減ったのです。ストレージを迫害していたものがなくなったという事実にスポットライトを当てる以外には、これがどんなに素晴らしいことなのかを伝えるための言葉が思いつきません。
最初の導入での素晴らしい結果から、我々はFVPの導入を3つ全てのクラスタに広げるべきだという確信を得ます。我々は1.2TBのFusion-IO ioDrive2 PCIeカードをHPのホストに追加しました。ホスト上は台所の流し台のような状態で、Webサーバやアプリケーションサーバ、VDI、E-mailセキュリティ、それから他のMicrosoft SQLサーバのデータベースも含まれています。我々はReadと同じようにWriteも高速化させるWrite Back(耐障害性のために1ホストへレプリケーション)も利用し始めました。我々は最初は単一のアプリケーション(この場合SQL)の高速化に集中していましたが、このソリューションは様々なワークロードにわたって効果を発揮するということがわかりました。ですから、全てを高速化するというのがベストな選択だったわけです。「プレミアムな」フラッシュへのアップグレードとWrite Backを有効にすることで、これを実現できたわけです。
最初のクラスタを覚えていますか? 2月から、8ヶ月ほど動作させています。今では160億回のIOが削減されています。2つ目のクラスタではさらに56億回のReadがVMAXからなくなっています。Write-Backを有効にしたクラスタではたったの2週間で13百万(大体ReadとWriteが50%&50%)のIOがサーバ層で実行されています。すべてを統合するとバックエンドのストレージは220億回のデータリクエストを気にする必要がなくなっています。これはFVPによって高速化されている仮想マシンのスピードを上げるだけではありません。同じ共有ストレージ上のアプリケーションも負荷がなくなったことによって高速化しているのです。
さて、ここでは仮想化の運用面にフォーカスを当てましょう。運用面は非常に仮想化によって良くなります。しかしながら仮想化されたアプリケーションはベアメタルの上で動作していたものより、必ず遅くなってしまいます。当社のデータベース管理者は本稼働環境で動作させる前にSQLIOのようなベンチマークをテスト環境上で動作させて、パフォーマンスが不足するようなことがあればサポートチケットを発行します。みなさんも同じような経験をしたことがあるでしょう? PernixData FVPソフトウェアはストレージのボトルネックを取り除き、仮想化後のパフォーマンスを保持することでこれを一発で完全に変えてしまったのです。ここにWrite-back状態の評価ワークロードのスクリーンショットがあります。500Mb/sのスループットを8Kの比較的大きなブロック転送で観測できています。大体15000IOPSです。これはVMwareのインフラはパフォーマンスが充分でないと文句ばかり言っていたSQL側の人間を本気で感動させるには十分な値でした。
我々はPernixData FVPソフトウェアで驚異的な体験をしましたが、もちろんこれはみなさんのりようの状況によって変わります。いい話があるとすれば、PernixData社は30日の無料評価版を提供していることです。ご自身でFVPを体験し、それでどれほどストレージの炎が抑えられるか、やってみてください!
記事担当者: マーケティング本部 三好哲生 (@pernixdata_netw)