【曾子固專欄】人工智慧到底會消耗多少能源?
維吉尼亞州庫爾佩珀縣上空瀰漫著乾草和糞肥的香氣,這裡每三個人就擁有一頭牛。 「我們有大農場,大多數仍為家庭所有,還有大片森林,」該縣 55,000 名居民之一的莎拉·帕默利 (Sarah Parmelee) 說。 “這是一個非常迷人的美國小鎮,”她補充道。
但這種田園詩般的生活正處於二十一世紀的轉變之中。過去幾年,該縣已批准建造七個大型數據中心項目,將支持科技公司實施生成人工智慧(AI)的擴張計劃。在這些巨大的結構內部,一排排的電腦伺服器將幫助訓練 ChatGPT 等聊天機器人背後的人工智慧模型,並為來自世界各地的數十億個日常查詢提供答案。
在維吉尼亞州,該建設將產生深遠的影響。每個設施可能消耗與數萬戶居民相同的電力,這可能會增加居民的成本,並使該地區的電力基礎設施超出其承載能力。帕默利和其他社區人士對資料中心對電力的需求持謹慎態度——尤其是因為維吉尼亞州已經被稱為世界資料中心之都。一份由州政府委託於 2024 年 12 月發布的評估報告指出,儘管數據中心帶來了經濟效益,但它們的增長可能會在十年內使弗吉尼亞州的電力需求翻倍。
Sophia Chen發表在最新一期權威期刊《自然》(Nature)的<人工智慧到底會消耗多少能源?好的、壞的和未知的>( How much energy will AI really consume? The good, the bad and the unknown)指出,研究人員希望企業對人工智慧的電力需求更加透明。(Researchers want firms to be more transparent about the electricity demands of artificial intelligence.)
燈泡有能源效率等級——那為什麼人工智慧聊天機器人沒有呢?
“電力從哪裡來?”帕默利問道,他正在繪製該州資料中心崛起的地圖,並為總部位於維吉尼亞州沃倫頓的非營利組織皮埃蒙特環境委員會工作。 “他們都說,’我們將從隔壁的地區購買電力。’但該地區正計劃向你們購買電力。
在全球許多資料中心以創紀錄的速度湧現的地方,類似的關於人工智慧和能源的衝突正在醞釀。大型科技公司正大力押註生成式人工智慧,與從資料中提取模式但不會產生新文字和影像的舊式人工智慧模型相比,生成式人工智慧需要更多的能量來運作。這促使各公司集體斥資數千億美元建造新的資料中心和伺服器,以擴大其容量。
從全球來看,人工智慧對未來電力需求的影響實際上預計相對較小。但資料中心集中在密集的集群中,它們可能會對當地產生深遠的影響。它們在空間上的集中度比其他能源密集設施(如鋼廠和煤礦)高得多。公司傾向於將資料中心建築建在靠近的地方,以便它們可以共享電網和冷卻系統,並有效地在它們之間以及與用戶之間傳輸資訊。尤其是維吉尼亞州,它透過提供稅收減免來吸引資料中心公司,從而帶來了更多的集群化。
這些資料中心佔該州電力的四分之一以上
帕默利說:“如果你擁有一個,那麼你很可能會擁有更多。”維吉尼亞州目前已擁有 340 個此類設施,而帕默利已繪製了維吉尼亞州 159 個擬建資料中心或現有資料中心的擴建地圖,根據加州帕洛阿爾托研究機構 EPRI 的報告,這些資料中心佔該州電力使用量的四分之一以上。在愛爾蘭,資料中心佔該國電力消耗的 20% 以上,其中大部分位於都柏林邊緣。美國至少 5 個州的核設施耗電量已超過 10%。
使問題更加複雜的是企業對其人工智慧系統的電力需求缺乏透明度。 「真正的問題是,我們在營運時幾乎沒有詳細的數據和知識,」獨立研究員喬納森·庫米 (Jonathan Koomey) 說,他研究計算能源使用已有 30 多年,並在加州伯林蓋姆經營著一家分析公司。
阿姆斯特丹自由大學研究員、荷蘭公司 Digiconomist 創辦人 Alex de Vries 表示:「我認為研究這個主題的每一位研究人員都瘋了,因為我們沒有得到我們需要的東西。」Digiconomist 是一家探索數位趨勢意外後果的荷蘭公司。 “我們只是盡力嘗試各種技巧來得出一些數字。”
計算人工智慧的能源需求
由於缺乏來自公司的詳細數據,研究人員透過兩種方式探索了人工智慧的能源需求。 2023 年,德弗里斯使用了供應鏈(或基於市場)的方法。他研究了在生成式 AI 市場佔據主導地位的一台 NVIDIA 伺服器的耗電量,並據此推斷出一年所需的能量。然後,他將該數字乘以正在運送的伺服器總數或某項特定任務可能需要的伺服器總數的估計值。
生成式人工智慧的環境成本正在飆升——而且大部分都是秘密
德弗里斯使用此方法來估算谷歌搜尋使用生成式人工智慧所需的能量。兩家能源分析公司估計,在每一次谷歌搜尋中實現類似 ChatGPT 的人工智慧將需要 40 萬到 50 萬台 NVIDIA A100 伺服器,根據這些伺服器的電力需求,每年將達到 23 到 29 太瓦時 (TWh)。然後,德弗里斯估計谷歌每天處理多達 90 億次搜尋(來自多位分析師的大概數字),併計算出透過 AI 伺服器的每個請求都需要 7-9 瓦時 (Wh) 的能量。根據Google在 2009 年部落格文章中報告的數據(請參閱go.nature.com/3d8sd4t),這相當於正常搜尋所消耗能量的 23 至 30 倍。當被要求對德弗里斯的估計發表評論時,谷歌沒有回應。
德弗里斯說,這種能量計算就像“抓救命稻草”,因為他必須依賴無法複製的第三方估算。他的數字很快就過時了。正如美國能源分析公司 SemiAnalysis(德弗里斯依賴其估計)在給《自然》雜誌的一封電子郵件中所寫,現在人工智慧整合谷歌搜尋所需的伺服器數量可能會更少,因為今天的人工智慧模型可以以極低的計算成本達到 2023 年模型的精度。
即便如此,該公司表示,評估生成式人工智慧能源足跡的最佳方法仍然是監控伺服器出貨量及其電力需求,這也是許多分析師廣泛使用的方法。然而,分析師很難隔離僅由生成式人工智慧使用的能量,因為資料中心通常也執行非人工智慧任務。
自下而上的估計
研究人工智慧能源需求的另一種方法是「自下而上」:研究人員測量特定資料中心中一個與人工智慧相關的請求的能源需求。然而,獨立研究人員只能使用預計與專有模型相似的開源 AI 模型進行測量。
這些測試背後的概念是,使用者提交提示(例如生成圖像的請求或基於文字的聊天),然後名為 CodeCarbon 的 Python 軟體包允許用戶的電腦存取在資料中心執行該模型的晶片的技術規格。 「在運行結束時,它會為你提供所使用的硬體消耗了多少能量的估算,」幫助開發 CodeCarbon 的人工智慧研究員 Sasha Luccioni 說道,他在紐約市一家為人工智慧模型和數據集提供開源平台的公司 Hugging Face 工作。
盧奇奧尼和其他人發現,不同的任務需要不同數量的能量。平均而言,根據他們的最新結果,根據文字提示產生圖像大約需要消耗 0.5 Wh 的電能,而生成文字則消耗的電能稍微少一些。相比之下,現代智慧型手機充滿電可能需要 22 Wh。但差異很大:更大的模型需要更多的能量(請參閱「人工智慧使用多少能量?」)。德弗里斯表示,實際數字低於他的論文中的數字,但這可能是因為 Luccioni 和其他人使用的模型至少比 ChatGPT 底層模型小一個數量級,並且因為人工智慧變得越來越有效率。
隱瞞軟體估算資料中心冷卻所用能源所需資訊
賓州匹茲堡卡內基美隆大學的電腦科學家兼盧奇奧尼的合作者 Emma Strubell 表示,這些數字是一個下限。否則,“公司就會站出來糾正我們”,她說。 “他們沒有這麼做。”
此外,公司通常會隱瞞軟體估算資料中心冷卻所用能源所需的資訊。 CodeCarbon 也無法存取某些類型晶片的能耗。維護 CodeCarbon 的法國資料科學家 Benoît Courty 表示,其中包括Google專有的 TPU 晶片。
人工智慧會加速還是延緩實現淨零排放進程?
盧奇奧尼也研究了訓練生成式人工智慧模型需要多少能量——當模型從海量資料中提取統計模式時。但是,如果模型每天都會收到數十億個查詢,就像德弗里斯在谷歌估算中所假設的那樣,那麼回答這些查詢所使用的能量(相當於太瓦時的電力)將成為人工智慧年度能源需求的主要部分。訓練 GPT-3 大小的模型(ChatGPT 第一版背後的模型)需要大約千兆瓦時的能量。
上個月,Luccioni 和其他研究人員啟動了AI 能源評分項目,這是一項公共倡議,旨在比較 AI 模型在不同任務上的能源效率,並為每個模型提供星級評估。專有封閉模型的開發人員也能夠上傳測試結果,儘管迄今為止只有美國軟體公司 Salesforce 參與了該項目,Luccioni 表示。
斯特魯貝爾表示,各公司對其最新產業模式的能源需求越來越諱莫如深。她表示,隨著競爭日趨激烈,「公司外部的資訊共享已經被封閉」。但Google和微軟等公司報告稱,他們的碳排放量正在增加,他們將此歸因於為支援人工智慧而建造的資料中心。 (當《自然》雜誌詢問時,包括Google、微軟和亞馬遜在內的公司並未回應有關缺乏透明度的批評;相反,他們強調正在與當地政府合作,以確保新的數據中心不會影響當地的公用事業供應。)
一些政府現在要求企業提高透明度。 2023年,歐盟通過了《能源效率指令》,要求額定功率至少為500千瓦的資料中心營運商每年報告其能源消耗。
全球預測
根據供應鏈估算方法,分析師表示,資料中心目前僅使用了全球電力需求的一小部分。國際能源總署 (IEA) 估計4,2022年此類設施的用電量為 240-340 TWh,佔全球需求的 1-1.3%(如果包括加密貨幣挖礦和資料傳輸基礎設施,則這一比例將上升至 2%)。
人工智慧的蓬勃發展將使這一數字進一步上升,但由於許多行業的電氣化、電動汽車的興起以及空調需求的增加,到 2050 年世界電力消耗預計將增長 80% 以上,數據中心“在整體電力需求增長中所佔份額相對較小”,國際能源署報告(見“世界電力增長”)。
Koomey 警告說,即使對人工智慧當前的能源需求有近似估計,也很難預測未來趨勢。他說:“沒有人知道幾年後資料中心(無論是人工智慧還是傳統資料中心)會使用什麼。”
他說,主要問題在於對所需伺服器和資料中心的數量存在分歧,而公用事業公司和科技公司出於經濟動機而誇大這些數字。他補充道,他們的許多預測都是基於「簡單的假設」。 “他們根據目前的趨勢推斷未來10年或15年的趨勢。”
去年年底,Koomey 與他人合作撰寫了一份由美國能源部資助的報告5,該報告估計,美國數據中心目前使用了該國 176 TWh(4.4%)的電力,到 2028 年這一比例可能會增加一到兩倍,達到 7%至 12%之間。