AI晶片戰升溫!英特爾推Gaudi 3一系列新品 輝達主導地位遇重大威脅

美國晶片大廠英特爾英特爾 (INTC-US) 周二 (9 日) 推出最新的第三代 AI 晶片 Gaudi 3,將在今年第 3 季跟 AI 晶片大廠輝達輝達(NVDA-US) 目前最受歡迎的 AI 處理器之一 H100 正式展開競爭,執行長基辛格當晚更手舞足蹈地展示這一最新產品,這也凸顯英特爾在 AI 硬體競爭中取得顯著進步。基辛格還誇口 Gaudi 3 的性能將跟輝達最新的 H200 相當,在某些領域的性能甚至更好,Gaudi 3 已經在 Llama 做測試,可有效地訓練或部署 AI 大模型,包括 Stable Diffusion 和語音辨識的 Whisper 等。

事實上,基辛格此前便曾指 Gaudi 3 的性能將超越輝達的主打 AI 晶片 H100。英特爾表示,Gaudi 3 在效能上比輝達 H100 高 40%,推理速度快 50%,在訓練常見大型語言模型 (LLM) 時比 H100 快 1.7 倍,甚至在處理較長輸入輸出序列的推理性能的某些語言模型時,Gaudi 3 處理速度比輝達更強大的 H200 平均快 1.3 倍。

採用 5 奈米製程製造的 Gaudi 3 將加快 AI 運算能力的浮點格式 BF16 效能提高 4 倍,記憶體頻寬提升 1.5 倍,並增強網路頻寬支援大規模系統的擴展,這對需要大規模部署生成式 AI 的企業尤其重要。

英特爾引述市場研究數據指出,企業在生成式 AI 設備上的支出將在 2027 年成長到 1510 億美元,較今年 400 億美元成長三倍以上。

Gaudi 3 使用兩組板載核心進行計算,第一種核心類型 TPC 在最佳化後可加快深度學習模型在處理資料時的計算,另一種核心類型 MME 核心則用來加速 AI 模型用於處理資料的計算,MME 的電路可加速用於影像辨識模型中常見軟體建構基礎的卷積層的運作。

Gaudi 3 共有 64 個 TPC 和 8 個 MME,分佈在兩個晶片或半導體模組上,這些模組以允許它們作為單一晶片運行的方式連結在一起。

英特爾指出,一台伺服器可安裝八顆 Gaudi 3 晶片,每個晶片都包含 21 個乙太網路連結鏈,用於跟鄰近的 Gaudi 3 單位交換資料,每個處理器上還有另外 3 個網路連結,使其能與主機伺服器外部的晶片進行互動。

Gaudi 3 的推出不僅凸顯英特爾推動企業級生成式 AI 領域的領先地位,也展現該公司在提供高效能、開放式架構及多元化選擇方面的承諾,透過發布全新的開放式可擴展系統、新一代產品和策略合作,進一步加速生成式 AI 的普及和應用。

至於售價,基辛格則拒絕透露,但稱將遠低於英偉達當前和未來的晶片,並將提供「非常不錯的」整體擁有成本 (TCO)。

除 Gaudi 3 外,英特爾周二也展示整合最新英特爾晶片的 AI PC,能夠快速處理的多項任務,另外還推出英特爾第六代 Xeon 處理器,包含兩種架構 Sierra Forest 和 Granite Rapids,Sierra Forest 跟使用減少記憶體資源使用 FP16 技術的第四代 Xeon 相比,可將下一個 token 的延遲時間縮短最多 6.5 倍,能夠運行 700 億參數的 Llama2 模型。Sierra Forest 架構的第六代 Xeon 預計於今年第二季推出。

在英特爾推出新 AI 晶片後,AI 主導地位面臨挑戰的輝達股價周二應聲收跌逾 2% 至每股 853.54 美元,盤後也下跌近 1%。華爾街投行高盛指出,鑑於 AI 領域的發展趨勢和競爭,未來可能會有更多競爭者湧現,挑戰輝達的主導地位。

更多鉅亨報導