輝達創辦人兼執行長黃仁勳於1月21日星期三在瑞士達沃斯舉行的世界經濟論壇上發表演說。（美聯社）





中國的人工智慧「深度求索」去年初主打低推出成本、高效能的人工智慧（AI）模型。如今，美國國會揭露文件指出，這項「高效率突破」背後，曾獲得美國晶片大廠輝達在2024年提供大量技術協助，改善其AI模型，而這些模型後來被中國軍方使用。

中國的人工智慧（AI）公司「深度求索」（DeepSeek）去年初推出低成本、高效能AI模型，其表現甚至可與美國一些最頂尖的產品一較高下，引發市場震盪。華府對此相當擔憂，認為就算當局已限制把高效能運算晶片賣給中國，中國人可能在AI領域趕上美國。

輝達2024年提供技術支援 DeepSeek訓練效率大增

然而，路透社28日看到一封寫給美國商務部長盧特尼克（Howard Lutnick）的信件，其中密西根州共和黨眾議員、聯邦眾議院美國與中國共產黨戰略競爭特別委員會主席穆勒納爾（John Moolenaar）表示，該委員會從輝達取得該公司2024年相關活動的文件顯示，DeepSeek這項成果是在輝達提供大量技術協助後才達成。

穆倫納爾在信中寫道，「根據輝達的內部紀錄，輝達的技術研發人員透過『演算法、框架和硬體的最佳化協同設計』，大幅提升DeepSeek的訓練效率。輝達內部報告甚至自豪地（boasting）指出，『DeepSeek完整訓練僅需278.8萬個H800 GPU小時（GPU Hours）運算時間』，這低於美國開發者在打造前沿級模型（frontier-scale models）時通常所需的運算量。」

所謂GPU小時（GPU hours）指的是訓練一個人工智慧模型時，AI晶片必須運作的總時數，其公式為：執行小時數×GPU數，舉例來說，5張晶片跑了6個小時，那就是30個GPU小時。至於前沿級模型，則是指由美國企業推出的頂尖模型，例如OpenAI、Anthropic，或Alphabet旗下的Google所開發的模型。

穆倫納爾寫道，當時輝達向DeepSeek提供協助時，外界並沒有任何公開跡象顯示DeepSeek的技術會被中國軍方使用，「因此，輝達是以正常方式對待DeepSeek，將之視為一個合法的商業夥伴，來提供標準的技術支援。」

賣給非軍用也不安全 美議員：勢必流向軍用

穆倫納爾寫道，「如果連全球市值最高的公司，在把產品賣給（中國）實體時，都無法排除其被用於軍事用途的可能性，那麼就必須有嚴格的許可限制與執法機制，以防止這些保證變成走過場的表面形式。」並補充，「將晶片出售給中國表面上屬於非軍事用途的終端用戶，最終勢必會違反軍事最終用途的相關限制。」

美國總統川普政府本月稍早准輝達的H200晶片銷往中國，但當中附帶許多限制前提，包括不得將晶片出售給協助中國軍方的實體。H200的效能高於DeepSeek所使用的H800晶片。這項決定引來美國各黨派裡「中國鷹派」的強烈反彈，他們擔心這些晶片將大幅強化北京在AI領域的優勢。

輝達的H800晶片是專門為中國市場設計的，並且在2023年被納入美國出口管制之前，就已經在中國銷售。路透社去年曾報導，美國官員認為DeepSeek正在協助中國軍方。

輝達在一份聲明中表示，「中國本土生產的晶片，已經多到能滿足其所有軍事應用，甚至還會剩下數百萬顆。就像美國軍方使用中國技術是荒謬的一樣，中國軍方依賴美國技術，同樣說不通。」

中國駐美國大使館發言人劉鵬宇表示，中方一貫反對泛化國家安全概念，或將經貿與科技問題政治化，並呼籲美方採取實際行動，維護全球產業鏈與供應鏈穩定。

