輝達6大挑戰者總盤點!超微、英特爾、高通⋯優勢是什麼?誰能搶到黃仁勳生意?

GPU大廠輝達(NVIDIA)在AI浪潮下獨領風騷,國際電機電子工程學會(IEEE)旗下雜誌《IEEE Spectrum》近期的一篇報導,盤點能和輝達一較高下的IC設計大廠、AI晶片新創,它們各自有哪些強項?有可能搶到輝達的生意嗎?

IC設計大廠|軟體、硬體各擅勝場

輝達挑戰者1:超微

  • 優勢:GPU為輝達的有力替代品

  • 劣勢:軟體生態系難和輝達的CUDA相比

《IEEE Spectrum》指出,超微(AMD)的GPU銷售和市佔雖難以和輝達匹敵,但在硬體仍有不俗成績。

超微擁有廣泛的GPU產品組合,從筆記型電腦到資料中心的GPU皆有,並且也是高頻寬記憶體(HBM)的早期支持者和採用者。超微的MI300X獲得微軟、Meta、戴爾(Dell)等企業採用,並且預計在今年第4季推出的MI325X,將成輝達H100的競爭對手。

然而, 軟體是超微較大的弱項 ,例如GPU開發平台ROCm的普及度,便不如輝達的CUDA。但超微也努力補上軟體生態系的不足,近期陸續宣佈收購芬蘭AI新創Silo AI、伺服器供應商ZT Systems;並將過去針對消費市場的RDNA架構,與資料中心用的CDNA架構整合為「UDNA」,更方便於開發 。

延伸閱讀:AMD為何敢砸一年AI晶片營收買ZT?解析蘇姿丰「重金挖輝達牆角」背後盤算

輝達挑戰者2:英特爾

  • 優勢:Gaudi 3 AI加速器表現強勁

  • 劣勢:下一代主要AI晶片2025年底才面世

儘管英特爾(Intel)沒有和輝達的CUDA、超微的ROCm相對應的開發平台,不過2018年所推出的OneAPI開發平台,涵蓋CPU、GPU和FPGA等硬體都可用其開發,軟體生態系甚為強大。

相對地, 硬體方面則是英特爾的弱點 。《IEEE Spectrum》提到,英特爾的Gaudi AI加速器是2019年收購AI新創Habana Labs的成果,最新的Gaudi 3更與輝達H100性能相當。然而,英特爾下一代AI晶片「Falcon Shores」的架構和性能尚不明確,並預計要到2025年底才會推出。

輝達挑戰者3:高通

  • 優勢:擁有廣泛具備AI功能的晶片

  • 劣勢:缺乏用於AI訓練的大型領先晶片

在通訊晶片之外,高通(Qualcomm)以許多安卓手機搭載的Snapdragon處理器聞名。《IEEE Spectrum》指出,和英特爾、超微等對手不同的是,高通更專注於 「AI推論」及「針對特定任務的能效優化」

高通並積極拓展手機之外的版圖,例如針對筆電市場,今年高通與微軟合作推出第一波Copilot+ PC;在智慧車用領域,高通的「Snapdragon Ride」和輝達「Nvidia DRIVE」互別苗頭。

不過《IEEE Spectrum》也點出,高通在現階段為止,較缺乏用於AI訓練的大型領先晶片。

AI晶片新創|專攻特定利基領域

輝達挑戰者4:Cerebras

  • 優勢:晶圓級晶片提供強大性能、大量記憶體

  • 劣勢:由於體積和成本,應用範圍較為狹窄

2015年成立於美國加州的Cerebras,專注於超級電腦的AI運算,2019年以超大型晶片「晶圓級引擎」(Wafer Scale Engine)震撼業界。

該款龐大的晶圓級晶片上有1.2兆個電晶體,最新一代Wafer Scale Engine 3更提升至4兆個。作為比較,輝達最大且最新的B200 GPU「只有」2080億個電晶體。

Cerebras的客戶,包括總部位於阿布達比的企業集團G42,以及美國國防部等。不過《IEEE Spectrum》認為,Cerebras的晶片在大多數情況下,難以挑戰輝達、超微、英特爾,因為它太大、成本太高且過於專業化,但在超級電腦領域有獨特的利基。

延伸閱讀:速度快千倍!Cerebras設計史上最大的晶片,它能做到哪些事?

輝達挑戰者5:SambaNova

  • 優勢:「可重新配置架構」有助提高AI模型效率

  • 劣勢:硬體在大眾市場中的應用仍需驗證

2017年成立於美國加州的SambaNova,致力於AI訓練的晶片設計,採用與眾不同的「可重新配置的數據流架構」(reconfigurable dataflow architecture),促進大型神經網路數據的快速傳輸。

SambaNova的客戶包括軟銀(SoftBank)和亞德諾半導體(Analog Devices),不過能否廣泛推展至大眾市場中,尚有待應證。

延伸閱讀:Google首個AI晶片投資!SambaNova如何結合軟、硬體,提升晶片性能?

輝達挑戰者6:Groq

  • 優勢:出色的AI推論性能

  • 劣勢:目前應用僅限於推論

2016年成立於美國加州的Groq,專注於將記憶體與運算資源緊密結合,以加快大型語言模型對提示(prompt)的反應速度。

《IEEE Spectrum》指出,Groq的晶片運用格羅方德(GlobalFoundries) 的14奈米技術所製造,落後於輝達H100的台積電5奈米技術,但優異的性能令人印象深刻。

延伸閱讀:科技CEO都花多少錢雇用貼身保鑣?一表看懂:祖克柏、黃仁勳、庫克誰花最兇?

參考資料:《IEEE Spectrum》《Tom’s Hardware》

更多報導
黃仁勳都沒他賺得多!Meta股價受惠AI熱潮大漲,祖克柏身家飆40%成2024財富增長王
輝達面試「史上最難」,僅10%的人被錄取!黃仁勳也親自當主考官,哪種人他最青睞?