HPE教育サービスの中川明美です。
1回目はvSAN 6.6で提供された新機能や強化された機能をご紹介しました。2回目以降はトラブルシューティング時に役立つツールや機能についてです。
#1: VMware vSAN 6.6 What’s New
#2: トラブルトラブルシューティング時に役立つツール 1
#3: トラブルトラブルシューティング時に役立つツール 2
vSANの監視やトラブルシューティング時に使用するツールは大きく分けると次の3つがあります。状況に応じて使い分けられますね。
- GUIツール (vSphere Web Client / vShere Host Client
- コマンドラインツール (esxcli / Ruby vSphere Console)
- VMware vRealize Operations Manager / VMware vRealize Log Insight
今回は、vSANクラスタのリバランスに役立つツールと、vSAN 6.6で追加された「esxcli」コマンドについてご紹介します。
vSANディスクバランス
VMware製品に関心のある方は、vSANがESXiホストのローカルディスクを利用して、データストアを構成していることをご存知かと思います。
このアーキテクチャを前提にすると、仮想マシンを構成するコンポーネント (仮想ディスクファイル等) がどのような配分でディスクに置かれるのかは気になるところだと思います。あるディスクの使用率が高いから、すぐにディスクを追加しましょうとはならないですよね。コンポーネントはすべてのディスクにバランスよく配置されるのが望まれるところです。
コンポーネントの配置によっては、パフォーマンスの低下やトラブルを引き起こすかもしれません。それらを回避するには、バランスの監視や状況によって手動でのリバランスが必要になるかもしれません。これから紹介するツールはディスクバランスの監視に役立ちます。vSANコンポーネントのリバランスは通常自動で行われます。
自動リバランス
デフォルトでは、キャパシティ層のデバイスの使用率が 80% に達すると、自動的にvSANクラスタはリバランスされます。リバランスは、vSANを構成するESXiホストがメンテナンス モード時にも行われます。
ディスク容量の使用率がクラスタ内でバランスが取れているかどうかは、「制限_現在のクラスタの状態」を確認します。ディスク容量使用率が80%を超えると自動でリバランスされます。
「制限_1件の追加ホスト障害後」では、1台のホスト障害があった場合に、再保護用の容量に不足はない(使用率)のか、クラスタコンポーネント/ディスク容量/キャッシュ予約に影響する可能性がある(健全性)のかを確認することができます。「現在のクラスタの状態」では全ディスク容量が449GBですが、「1件の追加ホスト障害後」では299GBで分析されています。
手動リバランス
一部のディスクの負荷分散がしきい値30%を超えると、警告が表示されます。しきい値は、「クラスタ_vSANディスクバランス」の最大分散で確認します。
たとえば、ディスク1の使用率が 50% で、ディスク2が15% の場合、ディスク1と2の負荷分散は35%です。この状況はしきい値の30を超えていますから警告が表示されます。
手動リバランスをするには、「ディスクのプロアクティブリバランス」をクリックします。
ディスクの負荷分散がしきい値を超えると、「ディスクバランス」タブに詳細情報が表示されます。「ホスト名」「該当ホストのストレージデバイス名(例えばmpx:vmhba0:C0:T0:L0)」「リバランス状態(Proactive rebalance is needed)」「しきい値を下回るようにするために移動する必要のあるデータ量」を確認できます。下図は最適な状況のため、表示されていません。
ディスク容量使用率が80%近くになっているか、最大分散で警告が表示されていれば、手動リバランスを試みます。クラスタのリバランスでは大量のI/O操作が生成されるため、仮想マシンのパフォーマンスに影響を及ぼす可能性があることを考慮ください。「移動するデータ(量)」はリバランスをいつ実施するべきかの参考値になりますね!
※vCenter Serverの健全性サービスを利用できない場合
vCenter Serverのサービスが停止している時には、vSphere Host Clientでも同様の情報を入手可能です。
vSAN 6.6で追加されたesxcliコマンド
6.6から、次のコマンドが追加されています。
< esxcli vsan health >
「vSANディスクバランス」はコマンドラインでも確認可能です。
< esxcli vsan debug >
debugには次のオプションがあります。
仮想マシンオブジェクトの情報を表示します。点線枠はコンポーネントのステータスです。どの物理ディスクに配置されているかを確認可能です。
再同期されている仮想マシンオブジェクトのステータスを表示します。障害後のホスト再起動時/ホストのメンテナンスモード時/ディスク容量使用率のしきい値の超過時に再同期が開始されます。
再同期が原因でクラスタに遅延が生じている場合や、再同期によるトラフィックがホスト上に大量に発生している場合には再調整を検討します。下図の赤点線枠の警告メッセージも考慮ください。
vSANクラスタを選択し、「監視」-「vSAN」-「コンポーネントの再同期」で「再同期の調整」をクリックします。再同期の調整の設定で、IOPS数を大きくするにはスライダを右に、IOPS数を小さくするには、スライダを左に移動します。
GUIやCLIを使用して、vSANの様々な情報を入手可能ですね。状況に応じて選択いただければと思います。次回は、vRealize Operations ManagerとVMware vRealize Log Insightをご紹介します。
HPE教育サービスでは、vSANのVMware認定コースを提供開始します。トラブルに対応するにはアーキテクチャを知ることは重要です。ぜひこの機会に学んでみませんか。
次の開催日程は、1/29(月)-31(水)です。申し込みはお早めに!
VMware vSAN: Deploy and Manage [V6.6] 3日間コース
日本ヒューレット・パッカード株式会社 教育サービス 中川明美
記事担当者: マーケティング本部 三好哲生 (@miyo4i)
さて、第2弾です。今回はトラブルシューティング系ですね。トラブルには出くわしたくないものですが、もしもであってしまったときに・・・こうした情報がまとまっているのは良いですね。GUIからはもちろん、CLIからも様々な診断や操作が行なえます。次回もVMwareの別の有償ソフトウェアを利用したより運用の観点からの記事になるそうです。今回中川さんに記事を依頼したのは彼女の運用目線での記事がとても素敵だからです。どんな記事なのか、楽しみですね。
さて、第3弾は来週の公開です。