隨著AI模型規模日益龐大，政府與大型企業對於數據主權 (Data Sovereignty) 與合規性的需求也越來越高。AWS此次在re:Invent 2025大會上宣布推出全新AI工廠 (AI Factories)服務，將AWS的AI基礎設施，包含最新的NVIDIA加速運算平台與AWS自研Trainium晶片直接佈署至客戶既有資料中心內，協助其快速建立高效能、合規且合乎主權的AI運算環境。

▲AWS宣布推出全新AI工廠 (AI Factories)服務，將AWS的AI基礎設施，包含最新的NVIDIA加速運算平台與AWS自研Trainium晶片直接佈署至客戶既有資料中心內

解決自建痛點，運作如「私有AWS區域」

AWS指出，對於受監管產業與公共部門而言，自建大規模AI基礎設施將面臨巨大的資本投入與採購週期挑戰。AWS此次提出AI工廠服務的核心概念，是將AWS的全套AI堆疊 (包含高速網路、儲存、資安及Bedrock、SageMaker等服務) 直接搬進客戶機房，並且由AWS負責營運。

▲AWS此次提出AI工廠服務的核心概念，是將AWS的全套AI堆疊 (包含高速網路、儲存、資安及Bedrock、SageMaker等服務) 直接搬進客戶機房，並且由AWS負責營運

這使得該環境運作起來就像是一個「私有AWS區域」 (Private AWS Region)，客戶可利用既有的電力與空間，同時享有AWS的管理服務與模型存取權，無需自行與多個供應商談判授權，大幅縮短佈署時間，並且滿足數據在地化的法規要求。

深化NVIDIA合作，將導入Grace Blackwell及後續即將推出的Vera Rubin

在硬體層面，AWS與NVIDIA的合作將進一步深化。AWS AI工廠服務將整合NVIDIA全端AI軟體與加速運算平台，其中包含支援最新的NVIDIA Grace Blackwell加速運算架構，以及接下來即將推出的NVIDIA Vera Rubin運算平台。

此外，AWS的下一代Trainium4晶片也將支援NVIDIA NVLink Fusion高速互連技術，意味接續Qualcomm、聯發科、Intel等業者之後，AWS也將藉由NVLink Fusion技術與NVIDIA的GPU加速運算生態系統更緊密結合，藉此讓AWS的客戶能有更大AI加速運算選擇彈性。

NVIDIA Hyperscale與HPC副總裁Ian Buck表示，大規模AI運算需要全端方法，此次透過與AWS合作，能將這些龐大運算能力直接交付到客戶環境中，讓組織專注於創新而非整合。

▲AWS發表搭載NVIDIA GB300 NVL72系統，專為大規模AI推論運算打造的Amazon EC2 P6e-GB300 UltraServers實例

P6e-GB300 UltraServer登場，首波落地沙烏地阿拉伯

配合AI工廠服務推出，AWS也發表了全新的Amazon EC2 P6e-GB300 UltraServers實例，其中搭載NVIDIA GB300 NVL72系統，專為大規模AI推論運算打造，支援生產環境中具備推理能力 (reasoning capabilities) 的兆級參數 (trillion-parameter) 模型，並且由AWS Nitro System驅動，可無縫整合Amazon EKS等服務。

而P6e-GB300 UltraServer首個應用案例將是隸屬沙烏地阿拉伯公共投資基金的HUMAIN，預計在沙烏地阿拉伯境內建立首個「AI Zone」專區。該專區將佈署高達 150000顆AI晶片 (其中包含NVIDIA GB300 GPU)，由AWS AI工廠服務基礎設施驅動，藉此滿足當地與全球加速增長的AI算力需求。

除了與AWS、NVIDIA合作，HUMAIN先前也已經宣布與AMD、Qualcomm在內業者合作AI運算晶片供應，甚至今年在Snapdragon Summit 202更宣布與Qualcomm合作推出AI PC，藉此推動更貼近使用者的代理AI發展，同時也藉由Qualcomm AI加速運算方案在沙烏地阿拉伯佈署大規模AI推論基礎設施。

至於提供Amazon EC2 P6e-GB300 UltraServers之餘，AWS仍維持提供搭載GB200 NV72系統的Amazon EC2 P6e-GB200 UltraServers，同時也繼續提供搭載B300、B200系統的Amazon EC2 P6。

