AI盡頭是電力,隨著AI技術的廣泛應用和深入發展,其背后的算力需求激增,進而引發了全球對數據中心及計算設備能耗激增的廣泛關注。據權威統計數據顯示,AI技術的普及與應用已顯著推動了全球數據中心能耗的攀升,成為能源特別是電力消耗的一大推手,這也是人們在追求科技進步的同時,需要亟待解決的重要議題。
全球AI耗電現狀
總體來看,伴隨著人工智能技術的迅猛發展,以及產業指數級增長,作為重要支撐的數據中心耗電總量和占比大幅上升。據測算,AI大語言模型GPT-3一次訓練的耗電量就達1287兆瓦時,大概相當于3000輛特斯拉電動汽車共同開跑、每輛車跑20萬英里所耗電量的總和。ChatGPT按每天響應約2億個請求計算,這一過程消耗超過50萬度電。國際能源署2024年1月發布報告稱,2022年全球數據中心的總耗電量約460太瓦時(1太瓦時=1×10?千瓦時=10億度),約占全球用電量的2%;到2026年,這一數據將超過1000太瓦時,大約是整個日本2022年全年的用電量。與此同時,大量的碳排放和數百萬加侖淡水的消耗也不容小覷。
歐美等國家AI耗電形勢嚴峻。以跨國公司數據中心“扎堆”的愛爾蘭為例,數據中心的耗電量已超過該國所有城市家庭用電量的總和,占比約為21%。波士頓咨詢集團則預計,到2030年,美國數據中心的用電量將是2022年的三倍,而這一增幅主要來自人工智能。OpenAI首席執行官薩姆·奧特曼和特斯拉首席執行官馬斯克都曾多次表達了對電力供應的擔憂。
從中國來看,AI耗能問題也是日益嚴重。2022年全年,我國數據中心耗電量達到2700億千瓦時,占全社會用電量約3%。預計到2025年,這一占比將提升至5%,到2030年全國數據中心耗電量將接近4000億千瓦時,數據中心的節能降耗迫在眉睫。數據中心是數字經濟發展的基石,從全國一體化大數據中心體系構想到部署“東數西算”,數字中國戰略持續深化落地,算力不斷提高,必然需要更高的能源電力,7×24小時連續運行,電力成本占運營總成本的60%—70%,規模增長迅速。伴隨著我國產業轉型升級和數據中心規模不斷擴大,耗電量會持續攀升。
總之,人工智能及支撐它的數據中心所帶來的耗電問題困擾著全世界,是制約人工智能技術飛速發展的主要障礙之一。
AI為何成為耗電大戶
AI成為耗電大戶的原因比較復雜,涉及數據處理、計算需求、芯片技術、算力中心等多個方面。
首先,從芯片上分析,大語言模型需要巨大的算力支撐,特別是擁有并行計算能力的GPU(圖形處理器)。在大模型訓練過程中,需要多塊GPU接連不斷運轉,一塊GPU的能耗比CPU(中央處理器)高出10—15倍。如一塊英偉達A100GPU功耗為400瓦。GPT-3訓練用到了1024塊A100芯片,而GPT-4更攀升至25000塊,后續將更新至H100、B200,型號的提升和數量的激增導致能耗顯著增加。到2027年,英偉達將推出150萬臺A100服務器,其中95%被應用于AI行業。每一臺服務器如果內置8塊A100芯片,以1240萬塊A100芯片的耗電量進行估算,耗電量將高達85—134太瓦時,這個已接近瑞典或荷蘭全年總用電量,相當于當前全球用電量的0.5%。
其次,從運行機制上分析。GPU架構在AI計算中雖具備并行處理優勢,非常適合AI算法,可以節省計算時間,但其當前利用率較低(32%—36%),且故障率高,導致訓練周期長,如GPT-4訓練耗時長達90—100天,進而引發長期的能源消耗。相比之下,CPU歷經近80年發展,技術成熟且節能高效;而GPU架構出現不到30年,尚存利用率低與差錯率高的挑戰,這導致了能源消耗的增加。因此,優化GPU架構以提高其效率和穩定性,對于減少能源消耗至關重要。
最后,大語言模型遵從規模效應,隨著參數和數據規模的提高,大模型的智能表現將出現躍升。因此,各大公司都在不斷地擴大模型規模,這給電能消耗帶來了巨大的壓力。如果大模型所用到的算力集中在一個數據中心里,在有限時空范圍內進行訓練,會給局部電網帶來非常大的用電負荷,甚至導致整個電網的崩潰。
AI耗電問題的解決方案
雖然AI的耗電量在社會總用電量中的占比不大,但與家庭用電量相比,已經非常可觀了,而且增速太快,如果不加以控制,將導致巨大能源壓力。因此如何應對人工智能帶來的巨大能耗,是業界一直高度重視的問題。
首先,在技術層面,通過各種方法降低對芯片的功耗需求是業界努力的方向。英偉達、谷歌公司等做了很多的嘗試與努力,通過優化算法模型,如犧牲一點性能以大大減少計算資源和時間,進而帶來能耗效率的大幅提升;用光纖連接芯片,減少原有芯片外部的電力驅動和電光/光電轉換環節,從而減少能耗;研發高效的芯片級散熱技術將散熱效率提升百倍;積極研發新型計算和傳輸架構以提升計算機處理速度并降低能耗;等等。
其次,數據中心的能耗可以通過精心布局加以優化。如針對能耗中的散熱問題,從最初的風冷,到現在的液冷,各家企業都在嘗試各種方法為數據中心散熱:微軟曾嘗試部署海下數據中心,Facebook數據中心選址在北極圈附近,阿里云千島湖數據中心使用深層湖水制冷等,我國很多企業則把數據中心布局在水電資源豐富的西南地區。“東數西算”的原則也是對數據與算力進行合理匹配,將大量的算力資源部署到西部地區,以降低能耗。
再次,在新能源層面,建立多樣化的能源利用體系。集中力量開發太陽能、風能等可再生能源,擴大應用并加強儲能技術研發,確保穩定供電。鼓勵企業探索建設分布式光伏發電、燃氣分布式供能等配套系統,引導新型數據中心向新能源發電側建設,就地消納新能源,推動新型數據中心高效利用清潔能源和可再生能源、優化用能結構,助力信息通信行業實現碳達峰碳中和目標。同時,探索核聚變等前沿技術作為長遠清潔能源。
最后,在政策層面,制定嚴格的節能政策與標準,對AI系統的能效實施有效監管,以激勵企業采用高效低能耗的計算技術與硬件設備;積極推廣綠色數據中心建設,倡導采用高效冷卻、能源回收技術,并鼓勵數據中心采用可再生能源供電;建立健全電力消耗監管機制,實時監控并數據分析AI系統的能耗情況,提高能源管理水平,減少不必要的浪費;加強國際合作與交流,共同應對AI技術帶來的能源挑戰,分享成功經驗、技術與資源,推動全球范圍內節能標準的制定與實施,以實現能源利用的優化與升級,減少對傳統電力的依賴,全面促進人工智能產業的綠色低碳發展。