Google用神經網絡提升數據中心能效

36氪

Google 的數據中心以高能效著稱。但是他們還不滿足,在5/29的Data Centers Europe 2014 上,Google 數據中心副總裁Joe kava 介紹了自己的公司是如何利用機器學習和人工智能來進一步改進數據中心能效的。

業界一般用PUE(電能使用效率)來衡量數據中心的能效,PUE= 數據中心總設備能耗/IT 設備能耗,其基準值為2,越接近1 表明能效越高。Google 之前的PUE 已經達到了驚人的1.12,這說明其用於製冷與配電等的消耗已經很少。

但是Google決定利用神經網絡讓其數據中心能效更上一層樓。據Kava ​​介紹,該項目屬於Google的20%項目(參見Google創新九原則或Google管理黃金法則)。他們每30秒就計算一次PUE,還不斷跟踪IT設備能耗、機外氣溫以及製冷和機械設備的設置情況等。而Google數據中心團隊成員Jim Gao對這些數據非常熟悉,他意識到這些數據還可以進一步利用。於是Gao通過機器學習對這些數據進行研究,並建立起模型來預測並進一步改進數據中心能效。

結果表明,該模型的預測準確率達到了99.6%(參見下圖)。如果高的準確率意味著Google 對數據中心下一步的能量需求情況瞭如指掌,從而可以通過設置調整進一步提升能效。Kava 舉了一個例子。幾個月前,他們有幾台服務器要下線幾天,其結果是數據中心能效會有所降低。但利用Gao 的模型他們臨時調整了製冷設置,從而降低了那段時間對PUE 的影響。

上述情況下Google 進行電力基礎設施升級要重新調整40% 的服務器流量,但是通過PUE 仿真與專家知識的結合,團隊選定了一套新的運營參數,從而將PUE 再降了0.02。不要小看這個值,考慮到Google 有成千上萬台服務器,乘上巨大的能耗就是可觀的節能效果。

Gao在今天發布的白皮書上解釋了自己的做法。他說神經網絡對複雜系統建模具有優勢,因為神經網絡不需要用戶預設模型的交互特徵,而是在特徵中尋找模式和交互,然後自動生成最佳匹配模型。

該神經網絡研究的因素包括了服​​務器總負載,水泵、冷卻塔、冷水機組、乾式冷卻器、運行中的冷水注水泵數量;冷卻塔水溫、濕球溫度、戶外濕度、風速、風向等。Google 利用傳感器部署了億萬個數據點來收集這些基礎設施和電能使用信息。不過令人略為驚訝的是,Google 只用一台服務器就能跑這個神經網絡了。

Gao 在白皮書中寫道,Google 數據中心的實際測試表明,機器學習是利用傳感器數據對數據中心能效建模的一種有效方法,可帶來顯著的成本節省。不過國內較為粗放式管理的數據中心恐怕短時間內難以效仿。

[本文參考以下來源:datacenterknowledge.comarstechnica.com ]

你可能還想看