台北—2022年5月17日—AMD(NASDAQ:AMD)在去年宣布30x25目標,計劃在2025年之前,用於人工智慧(AI)訓練與高效能運算(HPC)應用的處理器能源效率將提升30倍。目前這計畫正順利進行中,透過使用搭載一個AMD第3代EPYC CPU與四個AMD Instinct MI250x GPU的加速運算節點,在2020年的基準水平上將能源效率提升6.79倍。
隨著越來越多裝置成為「智慧裝置」,包括具備網路功能並通常配備攝影機的嵌入式處理器,資料創造量正在以指數級的速度呈現爆炸式增長。AI與HPC正在改變運算領域,以分析如此龐大的資料,從而實現更高品質的分析、自動化服務、增強的安全性以及更多其他優勢。然而當前的挑戰是,如此龐大規模的先進運算所需要消耗的能源與日俱增。
AMD執行副總裁暨技術長Mark Papermaster指出,作為開發高效能處理器以應對全球要求最嚴苛的分析應用的領導者,AMD在產品研發過程中將能源效率列為優先要務。我們著手在架構、封裝、連接性以及軟體進行全方位的功耗優化設計,旨在降低成本、保護自然資源以及減緩對氣候造成衝擊。
AMD將能源效率列為優先要務,在2014年自發性制定了目標,在2020年前將行動處理器的典型能源效率提高25倍。AMD不僅達成了這項目標,甚至達到31.7倍的提升幅度。
去年AMD宣布一項新願景-30x25目標-在2025年之前,加速資料中心運算節點的能源效率將在2020年的基礎上提升30倍註1。採用AMD EPYC™ CPU與AMD Instinct™加速器的節點設計旨在因應AI訓練與HPC應用等領域中全球成長最快的運算需求。這些應用對於氣象預測、基因體學、藥物研發等科學研究,以及訓練執行語音辨識、語言翻譯以及專家推薦系統的AI類神經網路至關重要。透過架構創新,AMD針對加速運算節點的應用優化能源消耗量。
圖一:特定應用的加速運算節點可實現更高的效率。
AMD深知提高資料中心效率可以幫助減少溫室氣體排放並提高環境可持續性。例如,若全球所有AI與HPC伺服器節點都能達到類似的效率提升,預計在2021至2025年期間,對比業界基準趨勢可節省高達510億千瓦小時(kWh)的電力,相當於節省62億美元的電費支出,減少的碳排相當於6億棵成長10年的樹木所吸納的碳排註2。
要在2025年達成提升30倍的目標,意謂著AMD加速運算節點完成單次運算的能源要比2020年降低97%。為了實現這一目標,AMD運算節點能源效率的提升速度必須比2015至2020年期間整個產業的提升速度快2.5倍註3。
一年來的進展現況
時至2022年中,AMD正按進程朝著實現30x25的目標邁進,透過使用搭載一個AMD第3代EPYC CPU與四個AMD Instinct MI250x GPU的加速運算節點,在2020年的基準水平上將能源效率提升6.79倍。此進展報告採用經過運算能源效率研究專家和作者Jonathan Koomey博士驗證的量測方法註4。
圖二:截至2022年之30x25能源效率目標進展。AMD有望實現提升30倍的目標,並超越2015至2020年業界提升的趨勢。
圖三:全球運行AI訓練與HPC工作負載的資料中心節點的能源使用比較預測。資料來源:AMD內部資料。
關於AMD
50多年來,AMD(NASDAQ:AMD)推動創新高效能運算、繪圖及視覺技術。全球數十億的消費者、世界500強企業以及尖端科學研究機構皆仰賴AMD的技術來改善生活、工作及娛樂。AMD員工致力於研發領先的高效能與自行調適產品,不斷突破技術的極限。欲瞭解AMD如何成就今天,啟發未來,請瀏覽AMD網站、部落格、LinkedIn及Twitter。
註1:包含AMD高效能CPU與GPU加速器,用來運行AI訓練與高效能運算作業,組建成4加速器的CPU主機托管組態。目標運算是根據效能跑分,使用標準效能量測程式(HPC: Linpack DGEMM kernel FLOPS,使用4k矩陣。AI訓練:以低精準度訓練的浮點數學運算GEMM矩陣乘法,像是FP16或BF16 FLOPS,使用4k矩陣)再除以代表加速運算節點的額定功耗,包括CPU與記憶體,以及4個GPU加速器。
註2:該情境係根據所有AI與HPC伺服器節點,達成類似AMD提升30倍的提升,在2021至2025年累計省下514億千瓦小時的電力,對比基準為2020年趨勢。每kwh電費為0.12美分x 514億kwh =6200萬美元。二氧化碳排放公噸數以及估計的植樹量,係根據在美國環保署溫室氣體當量計算器輸入資料所算出的省電數據,2021年12月1日。https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator。
註3:根據2015至2020年能源效率提升的業界趨勢,以及2025年資料中心的能源消耗。
註4:計算包括1)使用Koomey Analytics分析現有研究成果與資料,進行2025年基準kWhr用電量預測,包括特定領域的預測,推估2025年部署量與資料中心耗電效率(PUE),包括GPU HPC與機器學習(ML)安裝,以及2) AMD CPU插槽與GPU節點的功耗,包括特定領域的使用量(運行與閒置)比例,然後再乘以PUE,算出實際總耗能,再以此數據來計算每瓦效能。
6.79x =(基準HPC 節點kWhr 的2025年耗電預測x AMD 2022 年每瓦效能的改進,使用DGEMM與一般耗電+ 基準機器學習節點kWhr 的2025年耗電預測*AMD 2022 每瓦效能改進,使用機器學習數學計算與一般耗電數據)/(2020 每瓦效能* 2025年基準預測kWhr 數據)。如欲瞭解有關目標與方法的詳細資訊,敬請參閱https://www.amd.com/en/corporate-responsibility/data-center-sustainability。
AMD在高效能運算與AI訓練的30x25能源效率目標進展順利
避免法律糾紛,轉載本區文稿請先徵得原作者同意!
文章回應
目前尚無回應,成為第一個回應的人吧!
回應本篇文章!
(以下回應不會連結到FaceBook)(言責自負,請勿涉及人身攻擊,以免挨告!)
尚未 登入會員 ,無法回應!