【換日線科技】Nvidia 這家公司到底強在哪?

作者:Eric/每日矽谷

輝達(Nvidia)在第四季度的財報,帶動了整個股市的活力,甚至挽救了美國股市。過去一年股價更是飆漲了接近 237%,增幅超過兩倍。這些成績不只近期在台灣媒體上被炒得火熱、在我的部落格上也得到了充分的關注。

而以下本篇文章將從較宏觀的角度,為非科技專業領域的廣大讀者,解釋 Nvidia 為何能在近年引領 AI 商機風潮,並獲得資本市場的高度青睞;同時也為讀者分析在人工智慧運算時代,還有哪些後起之後值得留意。

Nvidia CUDA 軟體──輝達引領 AI 運算的關鍵

「20 年磨一劍」的 Nvidia CUDA,正是如今造就輝達在 AI 晶片領域引領風騷的關鍵。

CUDA 是一種專門用於加速 Nvidia GPU(圖形處理器)運算的專利軟體技術。它於 2007 年首次發表,至今已有近 20 年的歷史。簡單來說,它是一種程式語言和編程模型,可以讓開發者利用 GPU 的強大計算能力來加速各種應用程序。由於多年下來不斷的研發調整和最佳化,CUDA 如今已經完善了一整個「GPU 加速生態系統」,它不僅成為許多 GPU 加速應用程序的標準,並且被廣泛應用在科學計算、影像處理、深度學習等領域。許多研究人員和開發者,也早已習慣使用 CUDA 這項工具,來進行產品開發和研究──而這也使得 CUDA「綁定」的Nvidia GPU,在市場上無法被輕易取代。

例如,矽谷許多科技巨頭包括 Meta, Tesla, Microsoft 在內,也都試圖自行研發屬於自己的 AI 晶片;儘管如此,他們依然繼續向 Nvidia 採購大量的 H100 GPU,以擴大自己的運算吞吐量。原因就在於這些公司還沒發展出類似 CUDA 的軟體(與其生態系),讓更多使用者更有效率地運用他們所設計的 AI 晶片。

這些公司設計的晶片,效能其實都比 Nvidia 的強大,但如果這些專門晶片只能加速非常特定的 AI 模型,就無法改進整體的 AI 模型或解決複雜的問題。因此,Nvidia 擁有 CUDA 這樣一個完善的編程模型,絕對是他們(到目前為止)的不對稱優勢。

要知道,目前全球主流的 AI 開發工具 Pytorch 也廣泛支援 CUDA,為開發者提供了更方便的開發環境;也因此我們可以說,目前世界上大多數的 AI 模型程式碼,都有 CUDA 「參與其中」,只要有了 Nvidia GPU,就可以無痛的加速任何一個 AI 模型──而這也讓 Nvidia 成為無數 AI 開發者不可或缺的供應商。

緊追其後、虎視眈眈的 AMD

然而,市場上沒有永遠的霸主,在競爭激烈的 AI 晶片市場中,Nvidia 也正面臨著 AMD 這一主要競爭對手的挑戰:AMD 正積極追趕 Nvidia 的步伐,致力於打造屬於自己的 AI 硬體生態系統。

AMD 最新推出的旗艦 AI 晶片 MI300X,在性能和成本方面不亞於 Nvidia 的 H-100,但其編程模型 ROCm 仍然處於早期階段,大多數開發者尚不熟悉如何使用 ROCm 來加速。此外,將現有的 AI 模型加速也需要將 CUDA 代碼轉換為 ROCm,造成效率的降低。

儘管如此,AMD 仍以其低成本和高效能特性,成為 Nvidia 目前最大的競爭對手。實驗顯示,AMD 的性能可以達到 Nvidia 的 70-80%,但考慮到其低成本,更能滿足 AI 運算所需的性價比(性價比約為 Nvidia 的 2 倍)。然而前面提到的關鍵在此又發揮了作用:當考慮到 Nvidia 的 CUDA 軟體加速後,Nvidia 晶片的性價比頓時拉高到 AMD 的 6 倍左右。

MI300X 的數據並非官方數據, 而是本文推斷出的價格即運算吞吐量,不過是個蠻準確的數據。從表可以發現,在 Performance per Watt 跟 Performance per Dollar MI300X 都比 H100 好約 2 倍左右。圖/Eric 提供

因此,AMD 顯然必須更著力發展其 ROCm 的軟體生態系統,至少使 CUDA 轉換成 ROCm 程式碼的「無痛化」成為可能。這才能使市面上的 AI 模型能夠更廣泛地使用 AMD 晶片進行加速,並充分利用其低成本和低能耗的優勢,從而幫助企業節省 AI 運算的成本,吸引更多企業的青睞。

就像 CPU 產業與老牌 Intel 的競爭一樣:他們專注於 CPU 領域的研發、以性價比更高的 CPU 晶片受到玩家的青睞,從而能夠挑戰 Intel 「套裝」的霸主地位。AMD 在硬體設計上確實也擁有獨特之處,而且在 AI 晶片設計上積極探索創新,例如小晶片技術(Chiplet)、高頻寬記憶體(HBM)等。這些技術將成為未來 AI 晶片發展的關鍵,相比 Nvidia 目前的大晶片架構而言,也顯得更為先進。

誰是下一個 AI 晶片巨人?AI 硬體產業前景展望

根據 Nvidia 於 2022 年和 2023 年的財報數據顯示,AI 資料中心的收益分別達到了 150 億美元和 475 億美元,增長率超過 200%。這顯示市場對 AI 晶片的巨大需求增長。許多機構預測,AI 晶片市場將以每年約 30% 至 40% 的速度持續增長,呈現強勁的發展動能,類似於先前電動車產業的爆炸性成長。

全球 AI 晶片市場價值 2023-2032 變化 (以十億美金為單位) 。圖/Precedence Research 提供

目前,Nvidia 無疑是 AI 晶片市場的龍頭,擁有接近 90% 的市占率,幾乎壟斷了整個 AI 運算資源。要知即使如今幾乎壟斷高階晶片製造的 TSMC,也只佔了全球 66% 的市場份額。因此,90% 的市佔率實在極為驚人。

但這也意味著,接下來必然會有其他公司挑戰 Nvidia 的龍頭地位,將 AI 晶片市場帶入競爭新局面。除了 AMD 之外,還有不少值得矚目的新創公司,如 Tenstorrent 和 SambaNova,均來勢洶洶地開發 AI 晶片。更值得注意的是,如前面提及的許多科技巨頭,也開始自主研發晶片,希望能在 AI 晶片領域取代 Nvidia。因此可以預期,未來 AI 晶片產業的整體發展前景將持續充滿熱度與話題,新競爭局勢所帶來的技術革新,也令人期待!

※本文由換日線網站授權刊載,原標題為《【矽谷熱議】Nvidia 到底強在哪裡?下一個 AI 晶片巨人又會是誰?》,未經同意禁止轉載

更多換日線文章

ChatGPT 之亂:學生用 AI 軟體寫作業,教育局祭禁令有用嗎?

中國青年失業率突破 20%:除了市場供需失衡外,引發失業潮的 3 大關鍵因素

作者簡介:

Eric,目前任職於特斯拉擔任晶片韌體工程師,整合各種感測器、自駕晶片到特斯拉的各個車型。有幸見過 Elon Musk 數次,他經常帶著他的孩子在辦公室開會,相當有趣。平常喜歡分享晶片製造的流程以及產業的最新發展趨勢。希望能讓大眾了解到,晶片是如何改變他們的世界,而不只是知道「台積電」這家公司。 不論是人工智慧、擴增實境/虛擬實境、雲端等科技產業,都離不開硬體提供的基礎,這些基礎為科技的進步做出了卓越的貢獻。一起在這個空間變成科技人吧!