株式会社ネットワールドのエンジニアがお届けする技術情報ブログです。
各製品のエキスパートたちが旬なトピックをご紹介します。

Nutanix 回復性能 – パート4 – RF3からイレージャーコーディングへ変換

本記事の原文はもともとNutanix社のStaff Solution Architectで、Nutanix Platform Expert (NPX) #001、

そしてVMware Certified Design Expert (VCDX) #90として活動しているJosh Odger氏によるものです。

原文を参照したい方はNutanix Resiliency – Part 4 – Converting RF3 to Erasure Coding (EC-X)をご確認ください。

情報は原文の投稿時のままの情報ですので、現時点では投稿時の情報と製品とで差異が出ている場合があります。

当社のNutanix社製品についてはこちら。本ブログのNutanix関連記事のまとめページはこちら

ネットワールドのNutanix関連情報は、ぜひ当社のポータルから取得ください。

(初回はID、パスワードの取得が必要です)

 


このシリーズでクラスタはRF2からRF3に変換されている状態です。

いま、お客様は回復性能の影響なしに容量効率を良くしたいと思うとすると

イレージャーコーディングの有効化のプロセスとスピードを見る必要があります。

Nutanixのイレージャーコーディング(EC-X)はRFの構成が完了していて至上な状態のコールドデータに対してのみ実施されます。そしてEC-Xはポストプロセスで実行するため、クラスタに対するインラインの書き込みには影響が無いようになっています。

Nutanix EC-Xについてもっと知りたいかたは Nutanix – Erasure Coding (EC-X) Deep Dive.を参照ください

 

どんなI/OがNutanixのEC-Xに有効なのですか? いい質問!です

書込みのコールドデータのみです。

EC-XはデータがコールドデータになったらNutanixADSF キューレーターが低優先のタスクとしてバックグラウンド処理でEC-Xを実施します。

どのくらい RF2/3 からEC-Xにするのは早いのですか?

簡潔にいうと全パートで示したように基盤のなるディスクは高速処理が可能ですが、EC-Xは容量削減を目的とした技術で、データにリスクが無いため、ドライブ障害やノード障害の様にスピードは必要ないので、“ErasureCode:Encode”タスクのプライオリティが下に示すように3となります。

ノード・ディスク障害はプライオリティは「1」となります。

 

ecxpriority3tasks


もしお客様がこの処理をどんな方法を使ってもそれがキュレータをメンテナンスにしソフトリミットを削除して多くの処理を実施させることになったとしても、出来るだけ早く実施したい場合はサポート対応となりますので、ここでは方法を共有しません。

次にスループットとEC-X後のストレージプールの状態です。

途中で一部スループットが落ちているのは、バックグラウンドのキューレータースキャンを通してEC-Xを部分的に有効にしたたため、結果データのいくつかが変換されたものです、その後手動で他のフルスキャンを実施し、高いスループット(> 5GBps)を実現し完了しました。

 

ecxsavingsandstoragepoolcapacityusa


次に示すのは理論的に最大値の2:1に近い、1.97:1の容量の最適化の結果です。

EC-Xがこのように最大値に近い結果にたどり着いたのはアクティブなワークロードがクラスタ内になるく、テストデータがすべてコールドとなりEC-Xがストライプ出来たからです。

ecxsavingscompletedmultiplescans


だから37.7TB近いデータセットのリードと再書き込みを18TB近く使われているEC-Xへ行い、結果は18.54TBのデータ削減につながることになりました。

単純計算で37.7TBのデータがADSFで読み込まれ、18TBのEC-XストライプデータがADSFによる全体の56TBのIOサービスのため、90分以内で書かれたのです。

Summary:

  • Nutanix EC-X has no additional write penalty compared to RF3 ensuring optimal write performance while providing up to 2x capacity efficiency at the same resiliency level.
  • ADSF uses it’s distributed storage fabric to efficiently stripe data
  • Background EC-X striping is a low priority task to minimise the impact on front end virtual machine IO
  • ADSF can sustain very high throughput during EC-X (background) operations
  • Using RF3 and EC-X ensures maximum resiliency and capacity efficiency resulting in up to 66% usable capacity of RAW storage (up to 2:1 efficiency over RF3)

 

記事担当者 : SI技術本部 カッシー @Nutanix_NTNX