インテルの新しいGaudi 2プロセッサーが中国市場に登場、大規模なディープラーニング訓練と推理を加速
2023-07-12
今日、インテルのAI製品戦略およびGaudi 2新製品発表会が北京で開催されました。会議では、インテルが中国市場で第2世代ガウディディープラーニングアクセラレーター、ハバナを正式に発売® Gaudi®2。インテルのクラウドからエンドまでの製品ポートフォリオの重要な構成として、Gaudi 2は先進的な性価格比の優位性で、AI訓練と推理を加速させ、中国のユーザーにより高い深さの学習性能と効率を提供することに力を入れ、それによって大規模なAI配置のより優れた解となった。
インテル、中国市場でGaudi 2ディープラーニングアクセラレータを発売

インテルのSandra Riveraエグゼクティブバイスプレジデント兼データセンターおよび人工知能事業部ゼネラルマネージャーは、「インテルは、お客様に幅広いハードウェアの選択肢を提供し、オープンなソフトウェア環境をサポートすることで、人工知能技術の発展を加速させることに力を入れています。Xeon拡張可能プロセッサーとGaudi 2ディープラーニングアクセラレーターを含む製品の組み合わせにより、インテルは人工知能の参入障壁を低減し、クラウド上のネットワークと知能エッジを介してこの重要なビジネス技術を導入するお客様の能力を強化し、中国の人工知能技術の構築を支援していますスマートな未来」
ディープラーニングのために生まれた新しいGaudi 2トレーニングアクセラレータ

このGaudi 2深度学習加速器及びGaudi 2メザニンカードHL-225 Bは、第1世代Gaudi高性能アーキテクチャを基礎として、多方位性能とエネルギー効率比を向上させ、高性能大言語モデルの運行を加速させる。この加速器は、

•24個のプログラマブルTensorプロセッサコア(TPCs)

•21個のGbps(RoCEv 2)イーサネットインタフェース

•96 GB HBM 2 Eメモリ容量

•2.4 TB/秒の総メモリ帯域幅

•48 MBオンスライスSRAM

•統合マルチメディア処理エンジン
Habana® Gaudi®2深度学習加速器

Gaudi 2アクセラレータの優れた性能を6月に発表したMLCommons® MLPerf®ベンチマークテストでは、GPT-3モデル、コンピュータビジョンモデルResNet-50(8つの加速器を使用)、Unet 3 D(8つの加速器を使用)、および自然言語処理モデルBERT(8つと64つの加速器を使用)で優れた訓練結果を得たことが十分に認証されている。Gaudi 2は、大規模な生成AIや大言語モデル向けの市場の他の製品と比べて、優れたパフォーマンスと優れた価格競争力を持ち、ユーザーの運用効率を向上させるとともに、運用コストを削減することができます。

さらに、Gaudi 2は大規模なマルチモーダルと言語モデルに優れた推論性能を提供することができる。最近のHugging Face評価では、Stable Diffusion(テキストから画像を生成するための別の最先端生成AIモデルの1つ)、70億および1760億パラメータBLOOMzモデルを実行する際に、業界内でリードを維持するなど、大規模な推論におけるパフォーマンスが評価されています。

大言語およびマルチモーダルモデルの要件を満たす

Gaudi 2ディープラーニング加速器のアーキテクチャは、大規模言語モデル及び生成式AIモデルのニーズを満たすために効率的に拡張することを目的としている。各チップには、内部相互接続専用の100 Gbps(RoCEv 2 RDMA)イーサネットインターフェース21個が統合されており、低遅延サーバ内の拡張を実現しています。

Stable Diffusionトレーニングでは、Gaudi 2は1枚のカードから64枚のカードまでのほぼ線形99%の拡張性を示している。また、MLCommonsが発表したばかりのMLPerfトレーニング3.0の結果も、Gaudi 2プロセッサが1750億パラメータのGPT-3モデル上で、256個の加速器から384個の加速器まで印象的な線形に近い95%の拡張効果を実現できることを検証した。

成熟したソフトウェアサポートを備え、Gaudi 2製品が中国市場で正式に発売された

増大する生成型AIおよび大言語モデルの需要に伴い、インテルも先進的で成熟したソフトウェアサポートを構築し、Gaudi 2深度学習加速器の性能を十分に解放することに力を入れている。

お客様が簡単にモデルを構築したり、現在GPUベースのモデルビジネスとシステムを新しいGaudi 2サーバに移行したりすることを支援し、ソフトウェア開発への投資を保護するためにSynapseAI®ソフトウェアスイートは、広範なソフトウェア生態系とともにモデルの開発と移行を容易にすることを目的として、Gaudiプラットフォームの深さ学習ビジネスに最適化されています。SynapseAIはTensorFlowとPyTorchフレームワークのサポートを統合し、多くの流行しているコンピュータ視覚と自然言語参照モデルを提供し、ディープラーニング開発者の多様なニーズを満たすことができる。

現在、インテルはInspur情報と提携し、Gaudi 2ディープラーニング加速器に基づくInspur情報AIサーバーNF 5698 G 7を構築し、発売している。このサーバには、2ソケット第4世代インテルXeon拡張性プロセッサーを含む8つのGaudi 2アクセラレータカードHL-225 Bが統合されています。
Gaudi 2アクセラレータを用いたInspur NF 5698 G 7サーバ

中国の産業生態と手を携え、人工知能の新編を共啓する

長年にわたり、強力なAIソフトウェアハードウェアの基礎を借りて、インテルはAI分野の各種ワークロードに業界をリードする卓越した性能を提供することに力を入れてきました。そして、開放的な生態、豊富で多様な製品選択を通じてAI配置の敷居を絶えず下げ、そして中国のAI発展に確固とした支持を提供してきました。

今回の発表会では、美団、百度、Inspur情報などのエコパートナーがそれぞれインテルのソフトウェア・ハードウェア製品の組み合わせに基づく多様なスマートビジネスの進展を共有した。百度インテリジェントクラウドサーバ上級マネージャの何永占氏は、Intel®AMX加速エンジンの第4世代インテル®Xeon®拡張性のあるプロセッサーはERNIE-Tinyモデルに何倍もの性能最適化をもたらし、百度はリードするAIフルスタック能力と全面的なオープンエコを持続的に構築し、インテルと将来のAI分野でより広く、深く協力することを期待している。Inspur情報高級製品マネージャーの王磊氏は、NF 5698 G 7は生成式AI市場の革新に向けて開発された次世代AIサーバーであり、8つのOAM高速相互接続のGaudi 2加速器をサポートし、高性能、高拡張、高エネルギー効率、開放生態などの利点を備え、AI顧客に強大なモデル訓練と推理能力を提供すると強調した。将来、Inspur情報は引き続きインテルと手を携え、業界のために革新的で先進的な製品方案を構築する。

また、複数のネイティブエコパートナーも、現在および将来の製品提携におけるインテルとの確固たる立場と長期的な展望を示しています。新華三集団コンピューティングストレージ製品ラインの劉宏程副総裁は、「新華三智慧コンピューティングは内生知能の技術理念を堅持し、ハードウェアエネルギー、展望技術、グリーン低炭素などの全方位能力に基づいて、AI産業の高速発展を支援する」と指摘した。インテルGaudi 2 AIアクセラレーターに基づいて、新華三正はインテルと緊密に協力し、大モデルの訓練と推理に適した高性能AIサーバーを開発し、知能計算力の普遍的な革新を推進している。一方、超融合デジタル技術有限会社コンピューティングインフラストラクチャ分野の唐啓明総裁は、インテルGaudi 2のリリースを目撃して光栄だと述べた。インテルの長期的な戦略的パートナーとして、超融合は従来通りインテルと手を携え、Gaudi 2ベースの新しい製品とソリューションを共同で発売し、企業のAIシーンの成熟したビジネスと規模の定着を支援します。

将来的には、インテルは製品技術の発展を引き続きリードし、大規模なディープラーニングの配置をさらに加速させ、中国のローカルAI市場の発展を支援する。