到底什麼是“算力網絡”?

前幾天,小棗君和大家聊了一下“算力”(鏈接)。今天,我們再接再勵,聊聊“算力網絡”。

什麼是“算力網絡”

直奔主題,到底什麼是算力網絡?

算力網絡不是一項具體的技術,也不是一個具體的設備。從宏觀來看,它是一種思想,一種理念。從微觀來看,它仍然是一種網絡,一種架構與性質完全不同的網絡。

算力網絡的核心目的,是為用戶提供算力資源服務。但是它的實現方式,不同於“雲計算+通信網絡”的傳統方式,而是將算力資源徹底“融入”通信網絡,以一個更整體的形式,提供最符合用戶需求的算力資源服務。

因此,也有人將算力網絡叫做“Network As A Computer(網絡即計算機)”。

在你面前的,就像一台算力機。你不需要管它背後到底是什麼,你只需要知道,它一定能給你提供最符合你需求的算力資源。

計算與網絡的關系演進

單看前面那段話,會有點暈。接下來,我們還是從網絡的起源開始講起吧。

算力那期文章,我給大家講了算力的發展歷程,其實也就是計算機的發展歷程。

網絡的發展歷程,其實和計算機是密切相關的。(這裡所說的網絡,指的是數據通信網絡,不是語音電話網絡。下同。)

上世紀60年代,正是為了讓美國各大高校之間的大型計算機可以傳輸數據,才有ARPANET(也就是著名的“阿帕網”,互聯網的前身)。

連接了美國中西部4所高校的阿帕網(1969年)

70年代,同樣是為了服務高校和科研機構的計算機間通信,才有了早期的局域網技術(以太網、TCP/IP協議)。

網絡的出現,除了讓點對點(用戶對用戶)能夠進行信息交換之外,更重要的意義在於——它讓一些復雜的、高端的計算能力,能夠被普通用戶所觸達。

在那個時代裡,用戶PC的計算能力是很弱的,能做的事情很有限,內容資源也很少(硬盤存儲容量很小)。

有了網絡後,用戶可以與機房(數據中心)建立連接,可以訪問機房裡的服務器,共享服務器的CPU和存儲。

算力的集中與共享

對於復雜的高難度計算任務,也可以借助網絡,分配給不同的計算機,共同完成計算任務。這也就是網格計算,是分佈式計算的一種形式。

80年代後,網絡的數量越來越多,規模也越來越大。於是,人們建立了連接各大區域的骨幹網,最終形成了全球互聯網。

小網變大網,就是互聯網

有了全球互聯網,承載算力資源的機房,就可以變得更大、更強,為更多用戶提供算力服務。這個機房,也就變成了互聯網數據中心(IDC)。

進入21世紀後,基於互聯網數據中心,為了更好地管理海量的服務器(也是為了用廉價服務器實現高性能高可靠性的計算任務),亞馬遜和谷歌等公司就牽頭搞出了雲計算。

雲計算的核心是虛擬化技術。說白了,就是所有的CPU、內存、硬盤、顯卡等計算資源變成“資源池”,靈活進行分配,分配給用戶使用。

虛擬化技術,把物理資源打散,變成虛擬資源

在網絡這邊,巨變也在同步發生。

起初,網絡這邊關注的重點,是傳輸速率、容量、覆蓋的提升。畢竟,用戶多了,數據中心多了,互聯網廠商多了,帶寬需求就增加了。想要讓用戶訪問速度更快,體驗更好,就必須把“水管”加粗。

這期間,光通信和移動通信得到了快速發展。採用光纖,可以顯著拓展通信帶寬。採用移動通信,可以實現隨時隨地的通信接入。

到了2010年左右,我們的通信網絡,基本實現了人與人之間的物理連接,人與數據中心的物理連接。

棗君畫圖不易,轉載請註明來源

這時,伴隨著雲計算、大數據技術的出現與成熟,通信技術的核心任務開始發生變化——通信的連接對象開始從人拓展到物,互聯網開始從消費領域擴展到行業領域(工業製造、交通物流、銀行金融、教育醫療等)。

行業互聯網開始崛起,物聯網也開始崛起,於是,打開了整個人類社會數字化轉型的大門。

第一階段:雲網協同

在數字化時代,一切都是圍繞數據工作。

專家們大筆一揮,把所有的信息化、數字化、網絡化,都定性為:“挖掘數據價值”、“創造數字財富”、“發展數字經濟”。

以雲計算、大數據、人工智能為代表的IT技術,改名叫算力。以通信技術為代表的通信技術,改名叫聯接力。它們變成數字化轉型最重要的工具。(存儲資源也被稱為“存力”,不過一般歸於算力范疇。)

數據價值的挖掘過程

在這個時代,所有的計算機軟硬件都被抽象化了,變成了和水、電一樣的資源,叫“算力資源”。

所有的應用,例如看劇、玩游戲、辦公自動化、AR/VR,等等,也被統一稱為使用“算力應用”,享受“算力服務”。

算力變成了一種重要的生產力,整個社會都需要它。

不過,算力和電力存在很大的不同——電力就是能源,只要電網通了,你就能夠用。但是算力存在不同的屬性、類型。不同的用戶,不同的場景,對算力的需求不同。

換句話說,算力是存在多樣性的。

算力那期文章裡提到,算力有通用算力、超算算力、智能算力等不同類型。

例如,我玩吃雞游戲,需要的是游戲算法,圖形渲染。結果,你提供的是智能算力,合適嗎?

再例如,我搞路燈物聯網,控制路燈的開和關,非常簡單的操作,結果,你提供的是昂貴的超算算力,給我安排的是天河一號,這合適嗎?

再再例如,我挖礦搞比特幣,你給我提供x86 CPU通用算力,挖礦效率極低,這合適嗎?

顯然都不合適。

有人想要性能強勁的算力,有人想要響應速度快(時延低)的算力,有人想要價格便宜的算力……僅靠雲計算,根本無法靈活滿足用戶的差異性需求。

於是,算力這邊,想到了網絡的配合。

反觀網絡(通信運營商)這邊,也有強烈的合作意願。

原因如下:

1、傳統網絡過於封閉,設備商控制技術,一旦選型,就難以替換。而以雲計算為代表的IT技術,強調的是開源、池化、軟件化,軟件和硬件解耦。運營商作為甲方,可以掌握更多的主動權。

2、傳統網絡雖然是通信范疇,但也使用了算力。在路由和交換領域,在核心網領域,其實都是以算力為主,設備本身就是一台“類x86服務器”。想要提升設備的運行效率,就需要把通信網絡給IT化、軟件化,可以簡化網絡的運維,實現容量的彈性伸縮。

3、運營商是網絡運營的主體,但是鋪設了網絡,卻只能當個“管道”,碰不到用戶的數據,也碰不到用戶的業務。業務比流量包更賺錢,運營商不希望自己被邊緣化,所以,希望以網作為自己的資本,參與雲市場的競爭,分享蛋糕。

4、國內運營商左手有網,右手有雲。但是,運營商的雲,對設備商比較依賴。搞雲和網的合作,可以借雲賣網,借網賣雲,還可以邊賣邊學,增加對雲的掌控力,裡外不吃虧。

於是,2010年左右,雲和網開始打破隔閡,進行第一階段的合作。這時,雲和網屬於“初戀”,雙方還是強調各自的主體身份、合作關系,所以,叫做“雲網協同”階段。

大家所熟悉的SDN(軟件定義網絡)、NFV(網元功能虛擬化),就是雲網協同階段的典型代表技術。

當時,SDN主要針對承載網。把承載網路由器的管理功能和轉發功能剝離,將管理功能集中。這樣一來,相當於把網絡給軟件化了,可以隨時下達指令。

SDN,網絡被拆解了

NFV呢,主要針對核心網。它將雲的技術引入網絡,把通信網絡單元從專業設備變成通用x86設備,網絡功能由虛擬機實現,從而變得更加開放和靈活。

NFV,把網元功能從物理設備,遷移到虛擬設備(雲服務)

其實無線接入網(基站)那邊也有雲化。天線沒辦法雲化(總要收發信號吧),基帶運算處理是可以雲化的,於是,就有了Open RAN、vRAN、C-RAN等。限於篇幅,不多介紹。

SDN和NFV是在通信網絡裡引入雲的技術和理念,相當於用雲來改造網。

站在雲的角度,也從網這邊獲得了“好處”。這個重要的“好處”,就是MEC邊緣計算。

有了網之後,雲發現自己可以順著網“流動”了。它將中心雲的一部分算力下沉,放到通信網絡的各個層級,更加靠近用戶,能夠滿足用戶低時延算力的需求。

這個算力,可以在你家的路由器裡,可以在大樓的弱電機房裡,可以在基站機房裡,也可以在區、縣、市的各級機房裡。反正,無處不在。

邊緣計算=算力下沉

邊緣計算,徹底顛覆了非端即雲的傳統算力架構,使得算力資源變成了“雲、邊、端”三級模型,它們相互協作,為用戶提供所需的算力服務。

“泛在算力”的說法,也因此開始出現。

雲網協同時代,雲可以調動網絡(“雲調網”),網絡也可以配合雲。如前面SDN所說,網被軟件定義,網的功能成為了平台上的選項,在操作雲的時候,點點按鈕,就可以調用網的功能,對網進行配置。

第二階段:雲網融合

雲網協同的出現,揭示了整個ICT行業的變革方向。它所取得的初步成果,也鼓勵了運營商、設備商以及雲計算服務商。

若干年後,大家一致認為,雲和網僅僅協同是不夠的,應該全面走向融合。就這樣,“雲網融合”閃亮登場了。

這次變化的根本原因,其實還是數字化轉型的浪潮。數字化不斷深入,數據變得越來越龐大。尤其是以數據為中心的人工智能業務,廣泛落地,加劇了全社會對算力的需求。

為了滿足緊迫的算力需求,雲和網的融合必須提速。

在這一階段,因為邊緣計算的出現,雲計算已經不能單獨代表算力了,所以,和“雲”有關的詞,逐漸變成了“算”。(智算和超算的強勢崛起,也使“算”這個字眼更有力量,更有逼格,更具代表性。)

而網絡這邊,徹底失去了和算力平起平坐的資格,開始加速與算力的“融合”。其實,坦率地說,是被算力“融合”。

融合是現階段的動作,融合的最終目的,當然是算和網完全合為一體。也就是,將來,要實現“算網一體”。

一體後的“算網”,也就是——“算力網絡”。

整個過程,大家有沒有搞明白?之所以網上的概念特別雜,其實主要是因為三大運營商加上華為等設備商,特別喜歡取名字,炒概念,而且互相還不肯承認、不肯統一。所以,媒體上的叫法有很多種。事實上,很多名詞,都是同一個意思。

那些“1+2+3”的,還有ABCDE啥的,更讓人頭大。運營商在造詞方面,實在是太拼了。

算力網絡的英文名,也有好幾個。例如:

CPN(Computing Power Network,計算能力網絡)

CFN(Computing First Networking,計算優先網絡)

CFN(Computing Force Networking,計算力量網絡)

CAN(Computing-aware Networking,算力感知網絡)

目前使用比較普遍的,是CFN(First那個)。

在本文開頭,小棗君就說過,算力網絡的存在意義,就是為了給用戶提供最適合的算力資源服務。

這個適合,指的是算力類型匹配,算力規模合適,算力性價比最優。

算力網絡要解決的核心問題,是算力需求急劇膨脹下,全網算力供給不足的問題。

目前,摩爾定律逐漸進入瓶頸,單芯片的算力提升空間越來越窄,成本越來越高。在單點算力無法持續倍增的情況下,盤活現有的算力資源,是解決算力不足問題的唯一辦法。

算力已經趕不上數據的增長(圖片來自馭數科技)

換句話說,讓算力流動起來,精準服務用戶,提升算力的利用率,比單純堆砌算力、死磕芯片製程更有價值。

今年很火的“東數西算”,就是算力網絡理念的一次落地實踐。

東部地區對算力的需求高,西部地區的算力成本低(氣溫低,製冷成本低,且能源便宜)。所以,借助強大的通信網絡基礎設施,將時延要求低的算力,遷移到西部地區,就可以實現更完美的算力性價比。

那麼,算力網絡究竟是一個怎樣的架構?它基於了哪些底層技術?它的三大特性——算力路由、算力調度、算力交易,到底是如何實現的呢?目前,算力網絡的標准進展如何?

且看下集:算力網絡的深度技術分析

謝謝大家!

參考文獻:

1、《中國算力發展指數白皮書》,信通院;

2、《算力網絡技術白皮書》,中國移動;

3、《算力網絡(CAN、CFN、CPN)、東數西算是怎麼回事》,QianLing,知乎;

4、《中國聯通算力網絡白皮書》,中國聯通;

5、《算力網絡發展介紹與展望》,曹暢;

6、《什麼是算力網絡》,吳卓然;

7、《關於“算力網絡”底層技術的思考》,鄢貴海;

8、《AI算力需求快增長,平台化基礎設施成焦點》,廣發證券,劉雪峰、李傲遠、吳祖鵬。

本文來自微信公眾號“鮮棗課堂”(ID:xzclasscom),作者:小棗君,36氪經授權發布。

本文經授權發布,不代表36氪立場。

如若轉載請註明出處。來源出處:36氪