株式会社ネットワールドのエンジニアがお届けする技術情報ブログです。
各製品のエキスパートたちが旬なトピックをご紹介します。

Nutanixのスケーラビリティ – パート 3 – 一つの仮想マシンへのストレージパフォーマンス

本記事の原文はもともとNutanix社のStaff Solution Architectで、Nutanix Platform Expert (NPX) #001、

そしてVMware Certified Design Expert (VCDX) #90として活動しているJosh Odger氏によるものです。

原文を参照したい方はNutanix Scalability – Part 3 – Storage Performance for a single Virtual Machineをご確認ください。

情報は原文の投稿時のままの情報ですので、現時点では投稿時の情報と製品とで差異が出ている場合があります。

当社のNutanix社製品についてはこちら。本ブログのNutanix関連記事のまとめページはこちら

ネットワールドのNutanix関連情報は、ぜひ当社のポータルから取得ください。

(初回はID、パスワードの取得が必要です)

 

 


 Part 1 からの継続となりますが、Part1では、どの様にストレージオンリーノードを利用してNutanixがストレージをコンピュートとは別に拡張する事ができるかをお話しました。今回はNutanixがどう仮想マシンのストレージのパフォーマンスをスケールアップ出来るのかをお話していきます。

 

これまでの物理サーバで構築している仮想マシンはストレージコントローラーや複数のドライブ(HDD/SSDなどに関わらず)からのメリットがあります。

Nutanix ADSFの仮想マシンにも同じ事が言えます。多くのストレージコントローラーと多くの仮想ディスクがストレージパフォーマンスを向上することになるのです。

 

これまでのESXiHyper-Vといったハイパーバイザーで最大限のパフォーマンスと低遅延の要求により最大となる4つのSCSIコントローラーをVMへ割り当てを行います。複数のコントローラーは仮想ディスクへの多くのキューの処理が出来ることを示しており、結果より少ないボトルネックの削減による低遅延を可能としているのです。

この複数の仮想SCSIコントローラーはとても素晴らしい事なのでNutanixはこの機能をデフォルトで次世代のハイパーバイザー AHVで利用する事にしました。これはTurbo Mode“.として良く知られている機能です。

これはAHV上の仮想マシンがストレージコントローラーのレイヤでお客様がすでに持っているストレージコントローラーの構成、複雑性を排除し初期状態で最適化されているのです。

仮想ディスクに関わらずお客様が最適なパフォーマンスを得るために必要な事は4つの準仮想化SCSIコントローラーを使う事です。いくつか例を見ていきましょう。

 

MS Exchange サーバで20のデータベースを持っており、各データベースのパフォーマンス要求は100IOPSの範囲とすると、一つの仮想ディスクと一つのデータベース、それとログ用に別の仮想ディスクの割り当てが良いでしょう。

LargeタイプのMS SQLサーバに関していえば、数万から数十万にもなるIOPSが一つのデータベースで求められます、このようなケースでは複数の仮想ディスクをこのデータベースに割り当てSplitting SQL datafiles across multiple VMDKsを利用する事がVMのパフォーマンスの最適化となるでしょう。

 

2つの例ともにいえる事ですが、ESXiHyper-Vをご利用の場合は、仮想ディスクは4つの準仮想化SCSIコントローラーを通してアクセスできるように構成するべきです。一方でAHVを利用いただいているお客様は単純に仮想ディスクの作成すると、それぞれの仮想ディスクはStargateと呼ばれるNutanixADSFI/Oに占有のパスで直接接続できます。

 

詳細な情報はSQL & Exchange performance in a Virtual Machine も合わせてご覧ください。

ここではハイパーバイザーの仮想ディスクの数、ESXiHyper-vといったハイパーバイザーに関わらず、複数の準仮想化SCSIアダプターを設定する事が最適なパフォーマンスを得る方法であると学びました。

ではモンスター級のSQLワークロードがあり、ノードとクラスタが正しく構成されており、アクティブなワークロードが100% SSD層にあるかオールフラッシュクラスタについてお話ししましょう。

 

AHVで稼働している仮想マシンはターボモード(ESXi/Hyper-Vの準仮想化SCSIコントローラー)を利用するし、16の仮想ディスクを追加して、お客様のデータベースはvDiskを越えて追加していくことが出来ますが、もっとパフォーマンスが必要になったら???

良いニュースとしては、Nutanixはパフォーマンスを向上する多くの方法があるので、いくつか見てみましょう。

 

  • CVMのvCPUを向上する

これは稀な場合ですが、NutanixVMで稼働しているソフトウェアという事を理解する事は大事です。単純にvCPUを増やしCVMへアサインする事がより多くのI/Oパフォーマンスとクラスタ機能のバックグラウンド処理を向上します。

CVMは自動的にCVMN-2vCPUStargateI/O)に割り当てられます。つまり、多くのvCPUCVMへ追加する事がI/Oパフォーマの向上につながるのです

アプリケーションのパフォーマンスがローカルCVMにより影響を受けた場合(このケースはかなり稀なケースですが)2つ以上のvCPUCVMへアサインする事でCVMにはボトルネックを軽減しアフォーマンスを向上する事になります。

実際、私は以前このような状況を見たことがあります。

 

一つのCVM,複数のCVM,また、クラスタの構成やお客様のクラスタの要求事項の範囲で全てのCVMvCPUを増やせるのを知ることは大事です。

22コアプロセッサーと10コアプロセッサーの混在環境のクラスタだとするとクリティカルなVM22コアプロセッサーのノードへ移動しCVM のvCPU2つ追加し、10コアのvCPUはそのままにして置いてください。

これでパフォーマンスを向上させることが出来ますし、22コアノードの利益を最大限に利用できるのです。

この記事に関してはさらにCost vs Reward for the Nutanix Controller VM (CVM)にも詳細があるのでご参照ください。

 

  • Nutanix CVMのメモリーを増やす

メモリーを増やすのはもう一つの簡単にパフォーマンスを向上する方法です。

メモリーの追加でパフォーマンスを向上する主な2つの利用としてはCVMのメモリーはリードキャッシュを行いますので、アプリケーション、データセットのサイズには依存します。従来のリードキャッシュと全く違うのです。

 

次の理由としてはCVMRAMMedusa(metadata)のキャッシュとして利用されるようになるので、読み込み遅延がすくなくなるのです。

もしhttp://cvm-ip:2009/cache_stats(下にサンプルがあります)を見てキャッシュヒット幅が50%であれば、良いキャッシュヒットと言えます。一方5%程度ならワークサイズによりますが、大幅にリードパフォーマンスを向上するかもしれません。

他のパフォーマンスで大事な要素はMedusaのキャッシュです。

vDisk block map CacheExtent group id map Cacheを出来るだけ100%に近づけたいと考えています。

 

stargatecachestats


上記はワーキングセットのRange Cache 50% , vDisk block map Cache , Extent group id map Cache 100%CVMメモリーが最適なシステムの例です。

The above cache and medusa hit rates are from a test cluster and it was achieving the following performance for a database checksum task (100% read).

上記のキャッシュとMedusaのヒットはテストクラスタからのもので、データベースのチェックサムタスク(100%Read)の際は次の値を達成しました。

 

exampleperformancewith100medusahitr


ポイントはとても低いリードのレイテンシであるという事です。

最大でも0.35ms 0.18ms近辺の値が数時間にわたって継続されています。

 

CVMのメモリーが不十分だと一貫した読み込み遅延とはならないので、この問題に直面したらhttp://cvm-ip:2009/cache_status を確認してサポートにCVM RAMのサイジングについて相談してください。

ノート:CVMメモリーがNUMAノード内で最適な状態で構成されている環境でCVMへメモリーを追加する事は「害」ではありません。唯一のインパクトは仮想マシンに割り当てるメモリーが減る事です。

 

おさらいしましょう

AHVの仮想マシンはターボモードを利用し16の仮想ディスクでデータベースを仮想ディスクのスパンかして全体でアクセスさせ、CVMvCPUを追加します。

そして、Readキャッシュが正しくヒットしているかを確認しましょう。しかし、さらに多くのパフォーマンスが必要な場合は何を確認したらいいでしょうか?

 

  • ストレージオンリーノードの追加

もしまだ私投稿したScale out performance testing with Nutanix Storage Only Nodesを読んでいない場合に向けて簡単におさらいしますが、是非こちらのドキュメントも読んでください。

簡単に言うと、MS Exchange jetstress ワークロードを4VMで最適化されている4ノード構成のHybridクラスタで稼働させて達成した値が次の通りです。

jetstress4nodessummary


 

  • ベースラインテストからの観測
  1. VM辺り1000IOPSの達成
  2. パフォーマンスは全てのJetstress インスタンスを通して安定
  3. ログ書き込みは1ms の範囲
  4. データベースの読み込みは平均で10ms以下 (Microsoftが推奨している20msよりもよい結果)
  5. データベース作成時間の平均は2時間24分
  6. 3つのデータベースの複製は平均で4時間17分
  7. データベースのチェックサムの取得の平均は38分

 

その後、4ノードをクラスタへ追加したのですが、Jetstress仮想マシン、クラスタのコンフィグは何もしていませんがIOPS2倍になったのです!

4つのJetstressの各結果は次の通りです。

 

jetstress8nodessummary


ストレージオンリーノードを4ノード追加した概要は次の通りです

 

  1. IOPSはおおよそ2倍となる
  2. ログ書き込みの平均遅延は13%程度低くなる
  3. データベースの書き込み遅延は20%改善
  4. データベースの読み込み遅延はおおよそ2倍低くなる
  5. データベースの作成時間は15分ほど早くなる
  6. 3つのデータベースの複製は約35分改善
  7. データベースのチェックサムは40秒ほど早くなる

結果から分かる通り、ストレージオンリーノードの追加で変更を行わないでパフォーマンスが向上する事が解りました。Jetstressの構成を変更していたならば、より高いパフォーマンスとより低い読み込み、書込み遅延が達成できたことでしょう。

 

言い換えると、ストレージオンリーノードの追加は簡単にパフォーマンスと共にクラスタのresiliency and capacityも向上するのです。

 

これで、ワークロードに対して高いパフォーマンスを得るためのコンビネーションとしてCVMの最適化とストレージオンリーノードの話しをしました。

もし未だ求められているパフォーマンスを達成できていなきのであれば、Acropolis Volumesでパフォーマンスを向上させられるかもしれません

 

  • Acropolis Volumes

Acropolis Volumes は 2016にアナウンスし、お客様がNutanixがデータセンターの標準化のためのエッジの使用例として発表しましたが、多くの理由からこのビジョンを達成できませんでした。

  • 既存のサーバの再利用の要望、要求
  • 仮想化でないアプリケーション
  • パフォーマンス/外部接続しているサーバの拡張性
  • 外部iSCSIを含めたオペレーションへの複雑性

さらに多くの詳細はこちらをご参照ください。

In-guest ISCSI を利用しているNutanix VolumesはゲストOSの仮想ディスクを直接提供します。この仮想ディスクは自動的にNutanixクラスタ内で最適なパフォーマンスが提供できるようにロードバランスされるのです。

次のツイートにはNutanix Volumesを利用した際にどの様に分散されるかのFAQがあります。下のが示す通り、4ノードクラスタでは4つのiSCSIのパスとなりますが、クラスタを8ノードへ拡張するとNutanix Volumesは自動的に8パスに拡張しているのが解ります。

 

ABSの欠点といえばデータローカリティがなくなる事ですが、もしデータのローカリティを持てなかったとしても、その次に素晴らしいのは高い拡張、レジリエンシー、動的な分散ストレージファブリックを利用できる事です。

Nutanix Volumesは即時パフォーマンスのスケールが出来ますが、制限はネットワークのバンド幅、ノード数になってくるので、100GBNIC32ノードの物理クラスタでは数百万レベルのIOPSというとんでもないパフォーマンスを提供する事になるでしょう。

このIn-guest iSCSI の設定はとてもシンプルで、単にiSCSIターゲットをNutanixのクラスタIPとして設定するとクラスターサイズが増えた際に自動で計算しロードバランスをすることになります。仮想ディスクは自動的に新しいノード間でお客様の介入なしにバランシングが行われます。

これと同じことがノードの削除、メンテナンス、アップグレード、障害などに関しても言えます。

全て自動的に管理される為、Nutanix Volumesは管理者にとって非常にシンプルな実装といえます。

 

要約

Nutanixは仮想マシンに素晴らしい拡張性を提供し、より多くのパフォーマンスが求められるニッチなワークロードの為のNutanix Volumesはシングルノードが提供するものよりも多くのパフォーマンスを提供できるのです。

 

パフォーマンスを向上させる方法として簡単にできるのは次の2つですので是非覚えておきましょう

 

Writeパフォーマンスを向上させる方法はCVMへvCPUの追加

Readパフォーマンスを向上させる方法はCVMへメモリーの追加

 

記事担当者 : SI技術本部 カッシー @Nutanix_NTNX