株式会社ネットワールドのエンジニアがお届けする技術情報ブログです。
各製品のエキスパートたちが旬なトピックをご紹介します。

Nutanixが最高のオールフラッシュプラットフォームであるその11の理由

本記事の原文はNutanixコミュニティのブログNutanix Connect Blogの記事の翻訳ヴァージョンです。原文の著者はNutanix社のVP of Client Strategy at Nutanixを務めるSteve Kaplan氏によるものです。原文を参照したい方は11 Reasons why Nutanix is the Best All-Flash Platformをご確認ください。情報は原文の投稿時のままの情報ですので、現時点では投稿時の情報と製品とで差異が出ている場合があります。

当社のNutanix社製品についてはこちら。本ブログのNutanix関連記事のまとめページこちら

本ブログ記事に関連して、Nutanix社、Mellanox社に協賛をいただき、セミナーを実施致します。ここではお話できないもっともっとDeepな内容も!!

Nutanix x Mellanox 次世代フラッシュメモリと高速ネットワークセミナー

次世代フラッシュの登場でデータセンターアーキテクチャーに何が起ころうとしているのか?PernixData社を買収したNutanix社は何を目指しているのか?

お申込みはこちらから。ぜひ足をお運びください。

Fig166

オールフラッシュ装置 : 死刑囚が(処刑台に向かって)歩く

オールフラッシュ装置(AFA)を製造メーカーは確実な回転ディスクの陰りに感極まっていることでしょう、しかし、ハイパーコンバージドインフラストラクチャ(HCI)が全ストレージカテゴリーを逆さまに飲み込んでしまいそうにもなっています。AFAは従来型のストレージ装置に比べ高速で、管理が簡単ではあるものの、依然としてSANなのです。NutanixのエンタープライズクラウドはAFAよりも優れたフラッシュのためのプラットフォームであるだけでなく、その他のHCIソリューションよりも優れたものです。以下にその11の理由を挙げます :

1) ネットワークレイテンシの効果を劇的に削減

NutanixのHCIは既にネットワークのレイテンシを削減することで最高のAFAのパフォーマンスを誇っています(@vcdxnz001の記事を見てください。ネットワークは遅すぎる、どうしたら?)。NVMeや3D Xpointのような革新はハイパーコンバージド環境で、データをコンピューティングのすぐ傍らのフラッシュやもしくは他のストレージクラスメモリ(SCM)上に置くその効果をより強調することになります。従来型のモデルである、オールフラッシュ装置から低速のネットワークを経由してデータにアクセすることは高速なフラッシュ/SCMからのメリットを阻害することになります。

Fig167※訳注 NVMe = 30マイクロ秒のレイテンシ、40GbE = 40マイクロ秒のレイテンシ、ネットワークはフラッシュには遅すぎる!

コンピューティングの傍らではなく、ネットワークに接続された磁気メディアのレイテンシのために設計されたプロプライエタリの装置へとフラッシュを追加するということは全く意味をなしません。これは単に距離の問題であるという簡単な物理の問題へ帰結します。フラッシュはアクセスのために直接(ダイレクト)接続されるべきであり、複数のホップ、プロトコル、パフォーマンスを制約するコントローラが必要な間接(リモート)で接続されるべきではないということです。単なる物理です!

Fig168

NutanixとAFAのI/Oパスの長さの比較

AFAのベンダーは高速なネットワークとNVMeをファブリックに利用することで、低遅延で高帯域を実現できるという提案をしてくることも有ります。Nutanixはお客様へ高価で従来からの複雑性を継続させるような新しいストレージファブリックを買うこと無く、フラッシュのメリットを最適化して利用することを実現します。

Fig169

Michael Webster氏のLong Virtual White Cloudsからの引用画像

2) 統合率の優位性

Nutanixは全てのサーバのリソースに加え、92TBまでのフラッシュをたった2Uに積み込むことを実現しています。AFAはその装置以外にもコンピューティング、ストレージファブリック、そして、大抵は(※バックアップ用?)低コストのディスクストレージも必要とします。これははそれぞれ更に電源、ラック領域、空調が追加で必要です。

3) コモディティのハードウェア

PureなどのほとんどのAFAはプロプライエタリのハードウェアを利用しています、しかし、これは新しいハードウェアの革新を迅速に取り入れようとする場合には通行止め標識になってしまいます。オールフラッシュ装置はテクノロジの飛躍的な進化によって製品が古臭いものとなり、次にキャパシティが必要なタイミングでフォークリフトアップグレード(訳注 : 全てフォークリフトで取り外されて、別のものを入れ替えること)されてしまい、顧客が離れていくのを危険視しています。今日の早いペースのテクノロジ環境において、成功するのは世界で最も大きなコモディティハードウェアの製造メーカーによって駆り立てられた革新を活用したグローバル経済の規模での拡張を足がかりにした会社のみです。

サン・マイクロシステムズのケースを取り上げましょう。業界がよりコスト効率の良い、パーソナルコンピューターで人気を博したインテル互換のマイクロプロセッサへと舵を切っているにも関わらず、サンはプロプライエタリのハードウェアに賭けました。サンは投げ売り状態でOracleに買収される前にはその価値を80%も落としていました。

ヴァイオリンメモリがもう一つの例です。ヴァイオリンは市場へオールフラッシュメモリソリューションをいち早くもたらした最初の会社の一つです。これは非常にクールで、高速なテクノロジであり、優れたエンジニアリングに支えられて10年ほど前に創業しました。

しかし、コンシューマは別の考えを持っていました。彼らはソリッドステートドライブ(SSD)の速さと信頼性を愛し、今日ではほとんど全てのノートPC、デスクトップ、メモリ装置の中でそれが使われています。SSDの価格が急落しても、ヴァイオリンは自身のプロプライエタリのフィールド-プログラマブル ゲート装置(FPGA)を利用する設計を選択しました。洗練されたソリューションでしたが、おそらくは、SSDの急速な改善についていけなくなったのです。ヴァイオリンのプロプライエタリのハードウェアは急速に力を失い、会社はNYSEのリストから消えてしまうことになりました。

ハイパーコンバージドのビジネスはいみじくもコモディティハードウェア上で唯一、活況を呈しているエンタープライズテクノロジーであると言えるでしょう。すべての有力なクラウドプロバイダーもコモディティサーバを利用しています。プロプライエタリのハードウェアは一時的には会社の革新を保護する基盤となった時期もありますが、今は製造メーカーの競争力の邪魔に、もしくはその破壊すら行いつつ有ります。

4) 分散されたストレージコントローラ

ほとんどのAFAは物理の、分散されていないストレージコントローラを利用しており、これはトラフィックによって容易に飽和してしまいます。コントローラーがボトルネックになることによって、それ以降はいくらSSDのシェルフを追加してもパフォーマンスが向上することはありません。

単独のエンタープライズSSDが最高で500MB/sほどのスループットが出ると仮定すると、デュアルの4GbのFCアダプタを利用している場合ではコントローラはSSDが2本でボトルネックとなります。デュアルの16Gb FCアダプタへとアップグレードしたとしても、8本をさばけるだけです。

これらの制限に打ち勝つために、AFAは複数のアダプタを用意する必要があり、結果としてファブリックの構成は複雑になります。しかし、これは確実にコントローラーの制限にかかってしまい、お客様は更にAFAシステムを購入しなくてはならず、さらなるサイロを生むことになります。

これとは対象的にNutanixは常にクラスタにノードを追加する事になりますが、この度に仮想ストレージコントローラを追加することにもなります。これによってすぐさまパフォーマンスを上げることが出来ます。信頼性も著しく向上し、一つのコントローラが失われたとしても影響は非常に小さなものになります。これがNutanixが環境を破壊すること無く、1クリックで小さな影響のみでアップグレードとメンテナンスを行うことが出来る理由です。

5) データローカリティ

ロサンゼルス市内の車の75%が道路から突然なくなったとしたらなにが起きると思いますか? 渋滞があっという間に無くなるだけではなく、市は事故の減少、道路保全工事の削減、汚染の削減など他にも多くのメリットを得ることになるでしょう。

Nutanixのデータローカリティはデータセンタ環境においてこれと似たように作用します。ほとんどのReadのトラフィックをネットワークから削減し、そのかわりにReadはノード内のローカルSSDから提供されるようになります。Writeやエンドユーザーのアプリケーションが利用できるネットワーク帯域は効率的に増え、ストレージのパフォーマンスのみならず、ストレージが提供しているアプリケーションのパフォーマンスまでもが改善するのです。

Fig170

6) 拡張性

キャパシティパフォーマンス : AFAは大抵は2つの物理ストレージコントローラしか持ち合わせておらず、システム内に搭載されているRAM/NVRAMの総量によってメタデータのキャパシティの拡張がボトルネックとなってしまいます。SSDを追加しても、殆どの場合、パフォーマンスが向上することはありません。

同様に、AFAのお客様はもっと大きな処理能力をもつ多きなユニットへアップグレードするか、複雑なファブリックの相互接続を追加するか、もしくはサイロを作る以外に方法がありません。AFAの製造メーカーは既存のコントローラーを新しく高速なものに置き換え可能だとしていますが、その際の停止や出費を差し置いても、これはボトルネックをネットワークへと移動させるか、既存のフラッシュメディアに対してしか効果はありません。

Nutanixでは対象的に、AFAとは異なり、2つの物理ストレージコントローラによってボトルネックを生じることはありません。それぞれのノードの仮想マシンはそのノード上のコントローラー仮想マシン(CVM)によってサービス提供されます。クラスタにノードが追加される度に1つのCVMも追加されます、ですからキャパシティがリニアに拡張されるん見ならず、パフォーマンスと信頼性とが、管理スタック機能とともに拡張されていくのです。Acropolis ブロックサービス(ABS)とAcropolis ファイルサービス(AFS)はNutanixがお客様が拡張可能な物理と仮想のワークロードに使えるだけではなく、同じNutanixクラスタからファイルサーバとしても使えるということも実現しました。これによって非効率なサイロを削減できるのです。

Fig171

重複排除/圧縮パフォーマンス : Nutanixのユニークな重複排除と圧縮の実装はパフォーマンスへのオーバーヘッドを最小化します。Nutanixは物理リソースをより多く利用し、また結果に関係なくすべてのIOへ影響を及ぼす総当りでのすべてのデータの重複排除/圧縮は行いません。

信頼性 : 信頼性と高可用性の両方が全てのNutanixのスタックを通じて組み込まれています。レプリケーションファクター2(RF2)またはRF3をイレイジャーコーディング(EC-X)とともに利用することでディスクに対して優れた耐障害性を実現できます。ブロックアウェアネスはノード障害の回避を実現しますし、同期と非同期のレプリケーションはデータセンタ全体の信頼性を提供します。

オールフラッシュのストレージオンリーノード : ストレージオンリーノードによって、Nutanixのお客様はコンピューティングとストレージを別々に拡張することが出来るようになり、これによって自身のオールフラッシュ環境のコストを最小化することが出来ます。

7) シンプルさ

Nutanixのワンクリックアップグレードはアップグレードに関わる複雑さとリスクの両方を削減します。複雑な相互の組み合わせマトリックスや運用のガイドなどはありません。NutanixはフラッシュベースのアーキテクチャをLUNを排除し、ストレージの構造ではなく、その表示のフォーカスを仮想マシンにして、集中管理とキャパシティプランニングを含めることで、さらなるシンプルさを提供しています。

Fig172

8) ワークロードの統合

AFAはフラッシュ装置から情報をネットワーク越しに処理のためにコンピューティングまで送信する必要があります。以前に述べたレイテンシが追加される以外にも、これによってさらなるキュー管理とオーバーヘッドが追加されることになります。CPUはアプリケーションの要求で小さなブロックを同時に高いIOPSで受け取る、または大きなブロックを高いスループットでを受け取ると簡単に過負荷状態になります。一貫したパフォーマンスを保証するため、AFA管理者は頻繁に同じプラットフォームで動作しているOLTPとOLAPのワークロードを分離しなくてはなりません。

Nutanixはコンピューティングからダイレクトにアクセス可能なストレージを提供できます。限られたオーバーヘッドでリクエストをさばき、混在したワークロードに一貫した低遅延をもたらします。そして、Nutanix Acropolis ブロックサービスを利用すれば、Nutanixは異なるタイプのアプリケーションにたいしてまとめて対応が可能なストレージのバックプレーンとなります。お客様は物理のワークロードと下層のワークロードを同一クラスタ内で統合することさえできるようになるのです。

加えて、AFAはブロックのためのブロックストレージデバイスとファイルのためのフラッシュ装置を搭載しています。Nutanixでは、ストレージはブロックとファイルで共有されます。

Fig173

9) ミッションクリティカルアプリケーションの展開実績

Nutanixはたとえ、それが幾つかのワークロードの混在であったとしてもクリティカルアプリケーションのための適切なパフォーマンスを箱から出してすぐに提供することが出来ます。ストレージアクセスの障害回避、自己回復、常に行うデータの整合性のチェックなどを実装し単一障害点を排除しています。ストレージのパフォーマンスは想定通りで、複雑な構成やチューンングは不要です。

非破壊的なソフトウェアの更新で、計画的なダウンタイムを排除し、ミッションクリティカルアプリケーションをホストしているNutanixに新たな機能をもたらします。ソフトウェアのアップグレードや拡張のためのメンテナンスウィンドウはもはや過去のものとなりました。他の殆どのHCIとは異なり、NutanixはエンタープライズにSplunk、Oracle、SAP、SQLサーバ、Exchange、そして、他にも多くのミッションクリティカルアプリケーション(NutanixとVxRackのみがSAP認定を取得しています)での導入の数年もの実績と成熟が有ります。

Fig174

10) 総所有コスト(TCO)の低減

AFAは最終的にはコントローラーのキャパシティ不足に陥ります。テクノロジーは既存のAFAソリューションが比較しても経済的ではないと言うところまで進歩するか、もしくは、単に機材が古くなってしまうかです。いかなる場合であってもAFAを所持している場合にはフォークリフトアップグレード(完全入れ替え)ー その手順は大抵の場合、高価で複雑かつ、時間のかかるものですーに直面することになります。その結果として、AFAを所持していた人は殆どの場合、最初に必要な以上のキャパシティを購入し、4年か5年後に利用を終えるまで、要件に見合うリソースが充分かどうか、祈り続けることになるのです。

Nutanixを利用している人はフォークリフトアップグレードを今後経験することはなくなり、そのときに必要としている以上のノードを購入する必要はなくなります。テクノロジーが変化ても、新しいノードはクラスタにマウスクリックだけで追加が可能です、他の全てはソフトウェアが面倒を見てくれます。Nutanixはその下のリスクも排除してくれるのです。

ストレージ装置そしてストレージファブリックとそれに付帯して最初に購入しなくてはならない必要以上のキャパシティの必然性を完全に排除することで、Nutanixは導入コストの低減のお役に立ちます。プロジェクトがその後数年にわたって拡大したとしても、ムーアの法則とNutanixソフトウェアのパフォーマンス面での改善の両面に支えられ、ノードあたりの統合率は向上し、同じワークロードを動作させるのに必要なノード数は少なくなっているのです。

Fig175※ 訳注 : VDIのためのNutanixを4.5から4.7.2にアップグレードしたら、IOPSが40%向上し、レイテンシが50%も下がりました。ユーザーは「私のVDIセッションは今日はより早くなった」とコメントしています。私は[E:happy01]です。

11) エンタープライズクラウドプラットフォームの先進性

最終的には、業務そのものについてだけではありません。どのようにそれを行うか、なのです。ウェブスケールアーキテクチャの利用はNutanixのユニークな差別化要素であり、ハイパーコンバージェンスをエンタープライズクラウドプラットフォームの一部へと昇華させています。Sassandra、NoSQL、MapReduce、そしてCuratorなどの分散テクノロジーはオールフラッシュ環境を最適化して、優れたパフォーマンスと効率性を実現しています。

データアクセス : 古くからある樹木構造でのメタデータのクエリアーキテクチャ(BtreeとR&B)はメタデータがそれぞれの物理コントローラに保存されているような装置環境では上手く動作しましたが、オールフラッシュのHCI環境では最適とはいえません。HCIでは、メタデータは多くのノードに分散されてー樹木構造での検索は非効率ですーいます。この非効率さに対処するため、NutanixはCassandraとNoSQLのようなビッグデータのテクノロジーを利用し、非常に高速な検索と、高い耐障害性を実現しています。単一障害点はありません。

データの保存 : 古の3階層や他のHCIのIOパス内でデータを並び替えるアプローチとは異なり、Nutanixはそれをバックグランド処理として行い、より高いパフォーマンスを実現します。ノードが追加される毎にシステムは拡張され、重複排除と圧縮はより高速になり、さらにデータのローカリティは増加します。シームレスな拡張性によって、データをメモリか利用可能なストレージ層に置くべきかという昇格、降格の評価も迅速になります。

分析 : オールフラッシュの環境であっても異なる階層のフラッシュ(パフォーマンスと耐久性)が存在します。メタデータは継続的に増え続けるため、メモリやもっとも高速な層へおいておくのはコスト効率的に難しくなります。

Nutanixはここでもビッグデータのアプローチでこの課題を解決しています。NutanixのためにカスタマイズされたヴァージョンのMapReduce/Curatorがデータのホットデータか否か、圧縮できるか否か、重複排除出来るか否かなどの主要素情報を決定するために利用されます。同様のフレームワークを用いて、ローカリティのために、どのデータを別のノードへ移すべきなのか、どのデータを消すべきなのか、どのデータが再配置または再均一化されるべきなのか決定されます。これは特に障害イベント時に利用されます。

こうした解析は傾向分析、リアルタイム分析、事前的な監視、根本原因の分析、アラートの発行のための深い知見を実現します。

タイミング : 最適とはいえない、インラインでの圧縮やプロプライエタリハードウェアによる重複排除などに依存している他のソリューションとは対象的に、NutanixはオフラインでのMapReduce/Curatorによるソートに対応しています。これによって圧縮するか、重複排除するかの判断をする以前に、より多くのWriteを実行でき、一極集中しているデータベースのパフォーマンス要件の制限を回避しています。

ユニファイドキャッシュ : キャッシュはローカリティを実現します。重複排除はより多くのデータをこのパフォーマンス層に格納することを可能にし、ローカルキャッシュのヒットの可能性を最大化します。パフォーマンスに制限をうけることなく効率性を最大化するため、Nutanixはインラインでコンテントキャッシュのローカルでの重複排除を行います。

Fig176

NVMe : 死刑囚が(処刑台に向かって)走っている?

少なくとも1つの従来からのストレージ製造ベンダーがNVMeをそれこそが未来だとしてプロモーションしています。しかし、NVMeへの移行は今まで以上にデータはコンピューティングの隣りにあるべきで、ネットワークの彼方ではないということを強調することになるでしょう。これはすべてのファブリックを延長しただけの一枚板の滅亡への道のりを早めるだけです。ーもちろん、AFAもそれに含まれます。

コンテンツと編集について以下のメンバーに謝辞を述べたいと思います。@joshodgers @briansuhr @_praburam @Priyadarshi_Pd @sudheenair @binnygill @vcdxnz001 @RohitGoyal

もっと詳しく

NutanixのFlash ForwardウェブサイトのランディングページとeBook

Ten Things You Need to Know About Nutanix Acropolis Block Services (後日翻訳予定)

Nutanix Acropolis ファイルサービスについて知っておくべき10の事

免責事項: このブログはNutanix.com以外へのコンテンツへのリックが含まれています。Nutanixこうしたサイトへの統制は行うことが出来ないため、全ての外部サイトのコンテンツと正確性について、免責とさせていただきます。外部サイトへのリンクはこうしたサイトのコンテンツへの承認を表明するものではありません。

記事担当者: マーケティング本部 三好哲生 (@Networld_NTNX

Ntc2017_2

さて、10の事シリーズですが、いきなり11つあります。前回、前々回とMichael Webster氏の記事を翻訳してきたのはこの記事のための伏線だったわけです(単に、引用を辿っただけとも言う・・・)。Nutanixの(特にI/O周りの)技術を知れば知るほど「一つ一つの技術」ではなく、それを積み上げた「アーキテクチャ」であるということが言えると思います。特にストレージのパフォーマンスに関しては色々と痛い目を見てきたり、その技術自身の素晴らしさに夢中になって学んでしまったり(かくいう私もそうですが・・・)と、一筋縄ではいかない人間が集中しています。今回の記事はそんな方に読んでいただきたい内容です。若干いろいろなところで(理解のしやすさのために例を上げているのだと信じていますが)バチバチと火花を飛ばすような表現も有りますが、実によくまとめていると思います。ぜひセミナーへも足をお運びください!