アームが完全な状態に近づく
新しいコンピューティング エンジンを現場に導入するには時間がかかりすぎ、誰もがそれについて不満を抱いています。 顧客は、より高いパフォーマンスと、常に新世代のチップに付属するより優れたコストパフォーマンスを求めているため、せっかちです。 そして、CPU、GPU、その他の計算エンジンを製造している人々も焦っています。 彼らは競争を打ち負かして、より多くのお金を稼ぎたいと考えています。
今週の Hot Chips 2023 で、Arm Ltd が株式公開を (再び) 発表した直後に「Demeter」 V2 コアを披露していたとき、同社は「Genesis」 N2 Compute Subsystems (略して CSS インテリジェント パッケージ) も公開しました。 。 (V2 コアの詳細については、別途説明します。) この Genesis の取り組みにより、Arm CPU がこれまでよりも早く市場に投入される可能性があります。
Arm は長年にわたり、顧客が修正してより直接市場に投入できるよう、本格的な CPU の構築に少しずつ近づいてきました。 2000 年代後半、Arm がスマートフォンを引き継ぎ、サーバー メーカーが本質的に独占だった X86 アーキテクチャを Arm アーキテクチャでどのように改善できるかを検討していたとき、サーバー チップの設計者は Arm アーキテクチャのライセンスを取得してスタートし、それを使い続けました。 これはサーバー チップを作成するための非常に高価で時間のかかる方法でしたが、カスタム ISA から始めるよりは優れていましたが、大規模なソフトウェアの移植作業のために世界は容認できませんでした。
Arm サーバー チップの試みはブロードコム、クアルコム、AMD、サムスンなどの既存の半導体大手と、カルクセダやアプライド マイクロなどの新興企業の両方によって何度も失敗し、ThunderX および ThunderX2 CPU を搭載した Cavium による限定的な成功を経て、Arm はそれを実現することを決定しました。 Neoverse の取り組みでは、2018 年 10 月に展開され、サーバー チップ コアのロードマップだけでなく、オンダイなど他の Arm の知的財産を組み合わせた適切な CPU にこれらを変換するためのリファレンス アーキテクチャも提供されました。メッシュ インターコネクトとサードパーティ製メモリ、PCI-Express コントローラ、イーサネット コントローラ。 これらの Neoverse 設計は、台湾積体電路製造会社の特定のプロセス ノード向けに調整されており、サーバー チップ メーカーがより迅速に対応できるようになりました。
Neoverse が建築ライセンスよりも安いのか高いのかはわかりませんでした。 さまざまな方法で議論することができます。 Neoverse ではより多くの作業が行われましたが、Arm アーキテクチャ ライセンスに比べて自由度が限られていました。 おそらくもっと重要なことは、1 年前に「Arm は新しい RISC/Unix、RISC-V は新しい Arm」で指摘したように、Arm がオープンソースである RISC-V ISA および設計よりも安くならないのであれば、より速くすることができます。 顧客の焦りからアームはとにかく速くなければなりません。
2022 年 9 月に発表された最新の Neoverse ロードマップは次のとおりです。
当初、コア ファミリは N シリーズ 1 つだけでしたが、Arm はそれを 3 つのコア ファミリと 3 つの対応するプラットフォームに分割し、それぞれがシステム市場の異なる部分をターゲットにしました。 N シリーズのコアとプラットフォームは、ワットあたりのパフォーマンスが設計を左右する主流のサーバー ワークロードを対象としていましたが、V シリーズはより重いベクトル処理を備え、AI のトレーニングと推論、HPC シミュレーションとモデリングなど、より計算集約的なワークロードを対象としていました。 E シリーズはスループット コンピューティングを目的としており、ワットあたりのパフォーマンスが高いだけでなく、N シリーズよりもさらに低い熱エンベロープで最大のスループットを実現できるように最適化されています。 コアとプラットフォームの 3 つのファミリーだけでなく、DIY と CSS という 2 つのアプローチが存在することになります。
新しい Neoverse ロードマップは、CSS オプションが組み込まれて次のようになります。
各コアとプラットフォームのコード名がわかっている場合は、それらのコード名を追加しました。
Neoverse の取り組みにより、チップ企業は設計において優位性を得ることができ、多くの企業がそれを実現しています。 富士通は、現在のどのベンダーよりもはるかに早く、Neoverse への取り組みが行われる数年前に、A64FX チップの開発を開始しました。富士通は、スケーラブル ベクター エクステンションを発明し、512 に導入したため、多くの点で「Kronos」 V0 実装と考えることができます。 Intel AVX-512 の -bit ベクトルの極限。 Amazon は、Graviton1 チップのオリジナル Neoverse スタックの「Maya」 Cortex A72、Graviton2 チップの「Ares」 N1、および Graviton3 チップの「Zeus」 V1 を使用しました。 Nvidia は、10 年以上前に当初 Arm アーキテクチャ ライセンスを使用して「Denver」サーバー プロセッサを開発していましたが、現在市場に投入されている「Grace」CPU チップでは V2 コアに切り替えました。 Ampere Computing は、Altra および Altra Max Arm CPU に N1 コアを搭載していましたが、現在はカスタム コアを使用しています。 アリババはどうやら Yitian 710 プロセッサ用にカスタム Arm v9 コアを開発したようで、それが本当であれば、Nvidia の Grace は市場初の Arm v9 コアを搭載していないことになります。 インド政府は、「Aum」A48Z プロセッサで V1 コアを使用しています。