光通訊 串聯AI最後一哩路

-

【莊家源╱先探2269期】

在今年九月舉行的二○二三台灣國際半導體展中,台積電、日月光投控高層分享矽光子技術(Silicon Photonics)的進度,矽光子一躍而成市場熱門話題。根據國際半導體產業協會(SEMI)指出,全球矽光子市場規模將從二○二二年的一二六億美元,成長至三○年的七八六億美元,年均複合成長率達二五.七%,而AI產業將扮演矽光子產業成長的重要推手,由於各項網路應用全面展開,對於資料傳輸、儲存、運算速度已不可同日而語,各大科技巨擘不斷追尋更高速、更節能的技術與產品,也使得雲端運算和超大規模資料中心對矽光子技術有了迫切的需求。

光比電傳輸更有效率

過去,「積體電路」是將上億個電晶體微縮在一片晶片上,進行各種複雜的運算,而矽光子是一種「積體光路」,是電子與光子結合的技術,將光路微縮成一小片晶片,晶片內的線路皆使用可導光材質,這些線路被稱為「光波導」,而光可以在光波導中進行傳輸,從而實現高速率、低功耗的數據傳輸,而矽光子技術的最終願景是全面以光訊號代替電訊號,被視為是新一代半導體技術,不過目前實務上仍有許多問題仍待克服。

在目前的資料中心裡,資料傳輸是透過可插拔式光收發模組將晶片的電訊號轉換成光訊號,再藉由光纖傳送至資料中心其他的交換器、伺服器當中。而在光收發模組中,會需要光接收器來接收光訊號,轉換成電訊號後,還需要放大器來將電流信號放大。

截至二○二一年底,全球已有七二八個超大型資料中心,根據Synergy Research Group公布的數據顯示,預估到二六年全球超大型資料中心數量將達一二○○座,而美國將成此類設施的最大單一市場。隨著生成式AI逐漸商用化,AI伺服器在模型訓練階段需在資料中心內部進行大量運算,此外也要求極高的資料傳輸速率,若是藉由傳統可插拔式光收發模組的方式進行資料傳輸會面臨嚴重的訊號損失,並延長模型訓練時間導致耗電量增加,根據博通(Broadcom)公布數據顯示,若採用傳統可插拔式光收發模組,以銅線為媒介在PCB上傳遞,當訊號傳輸速度上升至二○○G時,訊號損失將會超過每公尺可以接受的損耗量約二○dB,也就是訊號的衰減量達一○○倍,為了提高傳資料傳輸速度,且避免訊號流失,將傳統光收發模組中光通訊元件與交換器晶片整合,減少資料傳輸路徑的共同封裝光學技術(Co-Packaged Optics; CPO)成為各大半導體廠的兵家必爭之地。

CPO由網通IC大廠主導

目前CPO技術主要由美國交換器IC設計大廠所推動,包括Broadcom、Nvidia、思科(Cisco)等,而現階段以Broadcom的技術最為領先,且在交換器(Switch)市場上擁有高度話語權。

Broadcom強項主要在網通領域,專門研發交換器、路由器IC,客戶包含一般硬體品牌商、電信服務供應商(如AT&T、Verizon等)以及超大型資料中心(如Microsoft、Amazon、Meta、Google與阿里巴巴等)。而根據終端應用的不同,Broadcom產品又可分為以下三中,分別為針對超大型資料中心,提供最大化頻寬的Tomahawk、針對企業用戶的Trident與專為AI工作負載設計的Jericho。

Broadcom在近年接連推出頻寬達25.6Tbps的Tomahawk 4與頻寬達51.2 Tbps 的Tomahawk 5交換器IC,Broadcom表示,一台配備有Tomahawk 5的交換器將能替代四八台搭載Tomahawk 1的交換器。由於Broadcom在Tomahawk 4、5 均推出使用插拔式光收發模組與CPO封裝技術的版本,而CPO與插拔式光收發模組技術不同,是將光引擎、交換器晶片、RF晶片等共同封裝,減少過去訊號傳輸需經過多個媒介,包含連接器、PCB、IC載板等,進而降低訊號與能量的損失。

在競爭者方面,Nvidia在二○二○年以六九億美元收購Mellanox後也切入交換器IC領域,專攻高效能運算、資料中心、雲端運算與儲存等市場,Nvidia已於今年發表頻寬達51.2Tbps的Spectrum 4交換器產品;品牌交換器龍頭Cisco最早於一二年收購了Lightwire,開始掌握CMOS光子封裝技術,隨後在一八~一九年間陸續收購Luxtera與Acacia跨入矽光子領域,目前跟Marvell旗下Inphi共同開發,預計明年將推出51.2Tbps的交換器。