2026 CES（消費電子展）開展，輝達（NVIDIA）在拉斯維加斯宣布推出NVIDIA Rubin平台，以「六款全新晶片」組成新一代AI基礎設施，目標是用更低成本建置、部署並防護全球規模最大的AI系統。輝達強調，Rubin是一套可打造「一台出色的AI超級電腦」的平台，並以六晶片的「極致協同設計」為核心，直接把訓練時間與推論詞元（token）成本往下壓。

在演講現場上，黃仁勳把上述時間表講得更直白：輝達已在量產GB300，而「如果Vera Rubin要趕上今年的節奏，它現在就必須已經進入生產」，因此他在台上宣布「Vera Rubin 已全面量產（in full production）」。

這句話等於替Rubin平台定調：它不是概念或路線圖，而是準備接棒、面向「AI的下一個前沿」的量產世代。

摩爾定律放緩、token爆炸成長，逼出極限共同設計

黃仁勳進一步解釋說，輝達內部原本有個「好規則」：新一代平台最多更換一到兩顆晶片；但問題在於摩爾定律放緩後，晶片電晶體數成長速度已追不上AI的需求曲線：模型規模快速放大、推論生成的token數量年年飆升、而token成本又必須以極快速度下降，否則整個產業無法維持競爭節奏。於是他下結論：若不做「aggressive, extreme co-design」，也就是跨晶片、跨整個堆疊同步創新，「產業不可能跟上」，這一代「沒有選擇，只能把每一顆晶片都重新設計」。

依據輝達所提供的資料：Rubin六晶片採「極致協同設計」，包含Vera CPU、Rubin GPU、NVLink 6交換器、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6乙太網路交換器，目的就是讓整套系統像「一台機器」那樣運作，去承接代理型AI（agentic AI）、先進推理與大規模混合專家（MoE）模型的運算需求。

Rubin關鍵數字：推論詞元成本降10倍、MoE訓練GPU需求減少4倍

在效益宣示上，輝達把Rubin的「成本曲線」放在第一順位。依據輝達的數據指出，相較NVIDIA Blackwell平台，Rubin透過軟硬體協同設計，可將推論詞元成本降低10倍，並將訓練混合專家（MoE）模型所需GPU數量減少4倍。

若把這兩個數字放回黃仁勳的「下一個前沿」主線，意思是：當推理（inference）從「一次性回答」變成「在執行時思考的過程」，每一次推論都要生成更多token；而Rubin的任務，就是把「生成token的成本」繼續壓低，讓代理型AI與長情境應用能在更大規模部署。

輝達（Nvidia）創辦人兼執行長黃仁勳在拉斯維加斯 CES 展前記者會上發表演說。（美聯社）

從機架級NVL72到系統級HGX，把AI超級電腦做成標準

輝達也明確定義Rubin的兩個主要形態：NVIDIA Vera Rubin NVL72 機架級解決方案與 NVIDIA HGX Rubin NVL8 系統。

在CES會場的影片與講述中，輝達用更具象的方式說明「六晶片像一顆晶片」的概念：從「六晶片架構」一路堆疊到NVLink互連，把多顆GPU視為單一運算體，再配合Spectrum-X乙太網路光子學等網路技術，把AI工廠尺度推進到「成千上萬個機櫃」。

黃仁勳則把這套節奏收斂成一句話：「Rubin的問世恰逢其時，因為AI運算對訓練與推論的需求正呈現爆炸性成長。憑藉我們每年推出新一代AI超級電腦的節奏，以及橫跨六款全新晶片的極致協同設計，Rubin正朝AI的下一個前沿邁出重大躍進。」

生態系與客戶端訊號：雲端、模型實驗室與系統廠同步表態

Rubin並非只是一套硬體平台。輝達同時揭露了預計採用Rubin的雲端服務供應商、模型實驗室與系統夥伴，並安排多位指標客戶/夥伴發言，為Rubin的落地來背書。

例如OpenAI執行長Sam Altman指出，智慧會隨運算能力擴展，增加運算資源可讓模型更強大、解更棘手的問題；他表示，Rubin平台能協助把「先進智慧」推進並普及。

Anthropic執行長Dario Amodei則把重點放在「更長記憶體、更佳推理能力與更可靠輸出」所需的基礎設施突破，認為Rubin的效率提升是關鍵。

Meta執行長Mark Zuckerberg也提到Rubin將帶來效能與效率的飛躍，對於向數十億人部署最先進模型是必要條件。

至於落地時程方面，輝達指出，CoreWeave將自2026年下半年起把Rubin系統整合進其AI雲端平台，並搭配Mission Control提供生命週期的效能、可靠性與規模支援。

