AWS針對雲端服務基礎架構進行大幅升級,將導入NVIDIA「Blackwell」、新款Trainium3自製處理器

除了宣布擴大自製處理器應用範疇,並且在伺服器導入更多因應人工智慧執行需求的客製化設計,AWS在re:Invent 2024活動上除了宣布將在其全新Amazon EC2 P6 Instances伺服器導入NVIDIA代號「Blackwell」GPU設計,更透露將於明年正式推出以3nm製程設計的Trainium3處理器,並且針對AWS雲端服務基礎架構進行大幅升級,讓用戶能有更多創新「選擇」。

▲AWS持續針對用戶使用行為進行創新,更藉由協助新創加速技術成長
▲AWS持續針對用戶使用行為進行創新,更藉由協助新創加速技術成長

針對AWS用戶使用行為提出創新

從現任亞馬遜執行長Andy Jassy手中接下AWS執行長職位的Matt Garman表示,雖然此為其以AWS執行長身分首度參與re:Invent活動,但強調過去以來也見證AWS多年針對雲端應用發展所推動改變,並且持續針對用戶使用行為進行創新,更藉由協助新創加速技術成長。

而透過技術堆疊呼應AWS以「Building Blocks」為口號的發展模式,Matt Garman更表示目前已經透過數以百計的AWS應用技術協助更多企業藉由雲端平台加速成長,其中包含彙整熱門趨勢及點子想法的Pinterest、以ESM3模型研究蛋白質結構的EvolutionaryScale,甚至蘋果也是AWS長期合作夥伴,更以AWS雲端平台支撐其iCloud等服務運作,其中更包含近期推出的「Apple Intelligence」服務,乃至於其搜尋服務。

為了支撐諸多企業、新創對於雲端平台使用需求,AWS也持續更新其服務平台,其中包含透過導入Graviton系列自製Arm架構處理器,使其伺服器運作效能大幅提升之餘,更可降低整體耗電量,並且能減少碳排放量。

強調仍與NVIDIA維持合作,但也持續擴展自製基礎架構

同時,AWS表示仍與NVIDIA維持深度合作,在Google、微軟先後宣布在伺服器導入NVIDIA代號「Blackwell」GPU設計之後,AWS在此次re:Invent 2024也宣布會在其新款Amazon EC2 P6 Instance伺服器採用此GPU設計,預計2025年第一季開始佈署應用。

▲新款Amazon EC2 P6 Instance伺服器採用NVIDIA代號「Blackwell」GPU設計
▲新款Amazon EC2 P6 Instance伺服器採用NVIDIA代號「Blackwell」GPU設計

至於對應人工智慧推論使用需求,AWS除了需將以新推出的Trainium2自製處理器提升運算效能,更以4組搭載此處理器的Amazon EC2 Trainium2 Instance伺服器,堆疊構成運算效能更高的超級伺服器「Amazon EC2 Trainium2 UltraServer」,更說明包含Adobe、人工智慧新創Poolside、數據平台服務Databricks及Qualcomm均透過Trainium2處理器訓練其人工智慧模型。

因應人工智慧模型推論執行需求,AWS更宣布將於明年開始佈署以3nm製程打造的Trainium3自製處理器,標榜在能源損耗降低40%,執行效能則可提高2倍。

▲將於明年開始佈署以3nm製程打造的Trainium3自製處理器,標榜在能源損耗降低40%,執行效能則可提高2倍
▲將於明年開始佈署以3nm製程打造的Trainium3自製處理器,標榜在能源損耗降低40%,執行效能則可提高2倍

配合人工智慧運算升級諸多基礎架構設計

配合人工智慧執行運算使用需求,AWS此次更針對諸多基礎架構進行升級,包含針對不同運算架構提供相應合適的儲存環境,其中標榜透過Amazon S3 Intelligent-Tiering儲存類別協助用戶節省超過40億美元的儲存開銷。

此外,AWS更宣布加入支援Apache Iceberg開源儲存表格格式,並且增加可提高3倍儲存速度的Amazon S3 Tables表格系統,並且可透過Amazon S3 Metadata管理系統,藉由元數據比對方式更快找到正確儲存資料,即便資料日後有所異動也能正確找到。

▲增加可提高3倍儲存速度的Amazon S3 Tables表格系統
▲增加可提高3倍儲存速度的Amazon S3 Tables表格系統
▲透過Amazon S3 Metadata管理系統,藉由元數據比對方式更快找到正確儲存資料,即便資料日後有所異動也能正確找到
▲透過Amazon S3 Metadata管理系統,藉由元數據比對方式更快找到正確儲存資料,即便資料日後有所異動也能正確找到

針對提供全球地區使用服務的資料處理需求,AWS也提出透過衛星校正不同時區導致資料處理時間所產生誤差,讓所有資料能正確釐清各自儲存、修改時間,進而可做出不同處理決策,並且透過Aamzon DynamoDB全域表 (global tables)使用全受管、無伺服器、對應多區域、多用途且具99.999%可用性的資料庫。

▲透過衛星校正不同時區導致資料處理時間所產生誤差,讓所有資料能正確釐清各自儲存、修改時間,進而可做出不同處理決策
▲透過衛星校正不同時區導致資料處理時間所產生誤差,讓所有資料能正確釐清各自儲存、修改時間,進而可做出不同處理決策
▲透過Aamzon DynamoDB全域表 (global tables)使用全受管、無伺服器、對應多區域、多用途且具99.999%可用性的資料庫
▲透過Aamzon DynamoDB全域表 (global tables)使用全受管、無伺服器、對應多區域、多用途且具99.999%可用性的資料庫

其他部分則以Amazon Bedrock Model Distillation快速建立更具效率的AI模型,配合Amazon Bedrock Automated Reasoning Checks功能減少人為錯誤,確認人工智慧模型能正確運作,並且提供修正調整建議,而Amazon Bedrock multi-agent collaboration則可快速佈署能對應複雜、多步驟工序的助理服務。

▲透過Amazon Bedrock平台加速人工智慧發展
▲透過Amazon Bedrock平台加速人工智慧發展

在先前針對開發者提供的Amazon Q Developer功能,此次也與軟體開發平台GitLab Duo整合,同時也提供可將適用於微軟.NET環境使用服務移轉至Linux,並且讓行速度提高4倍功能,另外更可將原本在VMware環境工序轉換成雲原生型態,以及可將大型主機上的應用服務整合時間從數年縮減為數個月的功能。

▲先前針對開發者提供的Amazon Q Developer功能,此次也與軟體開發平台GitLab Duo整合,同時也提供可將適用於微軟.NET環境使用服務移轉至Linux,並且讓行速度提高4倍功能
▲先前針對開發者提供的Amazon Q Developer功能,此次也與軟體開發平台GitLab Duo整合,同時也提供可將適用於微軟.NET環境使用服務移轉至Linux,並且讓行速度提高4倍功能

而Amazon Q Business功能則加入可分析非結構化資料,藉此整合更多數據,並且能透過API形式讓開發者透過Amazon Q Business功能自動執行複雜工序等應用設計。至於新版Amazon SageMaker則將透過Unified Studio、Zero-ETL for Applications,以及Amazon SageMaker Lakehouse等工具分析數據,讓數據分析結果加速人工智慧執行運作效率。

▲新版Amazon SageMaker則將透過Unified Studio、Zero-ETL for Applications,以及Amazon SageMaker Lakehouse等工具分析數據,讓數據分析結果加速人工智慧執行運作效率
▲新版Amazon SageMaker則將透過Unified Studio、Zero-ETL for Applications,以及Amazon SageMaker Lakehouse等工具分析數據,讓數據分析結果加速人工智慧執行運作效率

更多Mashdigi.com報導:

蘋果將於12/17於台灣市場開始銷售Vision Pro,預計從12/5開放預訂

分析報告指稱蘋果最快會在2026年第二季推出螢幕可凹折設計的iPhone機種

AWS推出安全事件回應服務,縮減企業從網路攻擊恢復運作時間