Meta宣布推出第二款MTIA系列客製化加速器晶片,對應內容排序與廣告推薦的底層運算加速

去年推出第一款內部開發的客製化加速器晶片系列,專門用於處理推理相關工作的MTIA (Meta Training and Inference Accelerator)加速晶片之後,Meta宣布推出新款客製化加速器晶片,將對應內容排序與廣告推薦的底層運算加速,並且依然由台積電代工,以5nm製程生產。

Meta宣布推出第二款MTIA系列客製化加速器晶片,對應內容排序與廣告推薦的底層運算加速
Meta宣布推出第二款MTIA系列客製化加速器晶片,對應內容排序與廣告推薦的底層運算加速

新一代MTIA加速晶片以8 x 8矩陣運算架構,並且改善稀疏運算管線設計,並且加上更大儲存、記憶體、傳輸頻寬等設計,讓密集運算與稀疏運算能分別提升3.5倍與7倍,同時藉由晶片整合網路功能 (network on chip,NoC)設計,讓晶片可在網路延遲情況下調整不同運算方式,藉此對應更複雜工作負載模式。

同時,新一代MTIA加速晶片運作時達1.35GHz、採用128MB記憶體、PCI Gen 5傳輸介面設計,但熱設計功耗則增加為90W,相較前一代晶片採用25W設計,明顯耗電許多。

Meta宣布推出第二款MTIA系列客製化加速器晶片,對應內容排序與廣告推薦的底層運算加速
Meta宣布推出第二款MTIA系列客製化加速器晶片,對應內容排序與廣告推薦的底層運算加速

而軟體方面則對應PyTorch 2.0、圖層捕捉、分析、轉換,以及擷取機制,因此能直接相容第一代MTIA加速晶片平台環境與相關程式編碼。

Meta預計會在近期內將新晶片更換至既有運算環境,目前更已經透過新款晶片在其16個雲端區域資料中心執行人工智慧相關工作負載,同時降低對外如NVIDIA加速晶片的依賴。

更多Mashdigi.com報導:

Google以Arm架構打造的「Axion」客製化處理器,只是增加雲端基礎架構的初步作法之一

Google Cloud:在基礎架構、模型、工具提供更多選擇,協助推動人工智慧技術發展成長

Uber在北美與拉丁美洲地區增加自動開啟安全功能選項,提高乘車安全