Go List

[AMD] AMD 加速 Exascale 等級運算至新高峰 為史上最快超級電腦 El Capitan 挹注強勁動能
2024-11-25

AMD 加速 Exascale 等級運算至新高峰 為史上最快超級電腦 El Capitan 挹注強勁動能

來源: AMD

  • 搭載 AMD Instinct MI300A APU 的 El Capitan 成為第 2 台超越 Exascale 等級的 AMD 超級電腦,名列 Top500 全球超級電腦排行榜首 ─
  • ─ AMD 持續為高效能運算樹立標竿,在全球十大最快與十大節能超級電腦中分別勇奪五成與四成席位 ─
  • ─ IBM 與 AMD 宣布雙方合作在 IBM Cloud 上部署 AMD Instinct MI300X 加速器即服務方案 ─

台北,2024 年 11 月 19 日 -- AMD(NASDAQ: AMD)在 2024 年超級運算大會(Supercomputing 2024)上展現在高效能運算(HPC)持續領先的地位,連續 6 屆為 Top500 排行榜中全球最快的超級電腦挹注效能。

El Capitan 超級電腦設於美國勞倫斯利佛摩國家實驗室(Lawrence Livermore National Laboratory,LLNL),由 HPE 以 AMD Instinct™ MI300A APU 組建,在最新出爐的 Top500 排行榜中以 High-Performance Linpack(HPL)評測出的 1.742 exaflops 效能榮登全球最快超級電腦王座。另外,El Capitan 以及橡樹嶺國家實驗室(ORNL)的 Frontier 系統在 Green500 排行榜中分別拿下第 18 與 22 名,展現出 AMD EPYC 處理器與 AMD Instinct GPU 的卓越能力,為高效能運算工作負載挹注領先效能與能源效率。

AMD 執行副總裁暨資料中心解決方案事業群總經理 Forrest Norrod 表示,我們非常高興看到 El Capitan 不僅成為第2台突破 exaflop 效能等級的 AMD 超級電腦,更勇奪全球最快超級電腦的桂冠,展現出 AMD Instinct MI300 APU 的優異效能與效率,同時見證 AMD、LLNL 以及 HPE 專注投入的成果。AMD 正憑藉領先業界的效能與功能驅動著運算的未來發展,並將持續定義未來數年 HPC 與人工智慧(AI)的匯流走向。

LLNL 先進模擬與運算計畫總監 Rob Neely 表示,El Capitan 對美國能源部國家核子保安總署的核心任務至關重要,顯著提升了我們執行大型高擬真 3D 模擬的能力,解決任務中所面臨到各種嚴峻的科學難題。

LLNL 利佛摩運算部技術長 Bronis R. de Supinski 表示,我們運用 AMD Instinct MI300A APU 組建出以往無法想像的系統,不僅拓展運算效能的極限,同時維持卓越的能源效率。隨著 AI 在我們研究領域益發盛行,El Capitan 讓我們將 AI 整合至傳統模擬與建模的工作負載,在各領域開拓科學發現的新捷徑。

AMD 為 HPC 與 AI 挹注動能

AMD 運算引擎持續為最關鍵的超級電腦挹注動能,為全球各地企業與國家實驗室的技術運算任務提供卓越效能。

最新 AMD EPYC™ 9005 系列處理器是企業、AI 以及雲端領域的最強大伺服器 CPU註1,在處理 HPC 與 AI 工作負載方面,IPC 效能較上一代產品提升高達 37%註2,以及在處理科學與 HPC 應用方面,獲得洞察的速度比對手產品快出高達 3.9 倍,協助解決全球最艱鉅的難題註3

AMD Instinct 加速器為資料中心提供領先效能,涵蓋 AI 解決方案一直到 Exascale 等級超級電腦等任何規模。AMD Instinct MI300X 與 MI325X 加速器帶來 AI 效能與記憶體功能的領先優勢,而 AMD Instinct MI300A APU 更是將 CPU 與 GPU 核心以及堆疊記憶體整合至單一封裝,為 HPC 與 AI 工作負載創造出更高水平的效率與效能。

此外,AMD EPYC 處理器與 AMD Instinct 加速器亦為眾多全新超級運算與 AI 專案以及部署計畫挹注效能,其中包括:

  • 義大利能源公司 Eni 最近發表 HPC 6 超級電腦,搭載 AMD EPYC CPU 以及 AMD Instinct GPU。HPC 6 不僅是專注運行工業應用全球效能最強大的超級電腦之一,同時為現今全球第 5 快的超級電腦。
  • 德國帕德博恩大學正著手組建與推出搭載最新第 5 代 AMD EPYC CPU 的全新超級電腦。
  • Sigma2 AS 將以搭載第 5 代 AMD EPYC CPU 的 HPE Cray Supercomputing EX 系統取代挪威原先 3 台國有超級電腦的其中 2 台。在安裝完成後,這台超級電腦預計成為挪威最快的系統。
  • IBM 與 AMD 宣布一項合作案,雙方將聯手在 IBM Cloud 上部署 AMD Instinct MI300X 加速器即服務方案。此方案預計在 2025 年上半年上線營運,目標提升生成式 AI 模型的效能與功耗效率,包括為企業客戶提供的高效能運算應用。雙方的合作亦將促成 IBM 的 watsonx AI 與資料平台支援 AMD Instinct MI300X 加速器,以及 Red Hat® Enterprise Linux® 作業系統對 AI 推論的支援。
  • AMD Instinct MI300A APU 亦將為日本量子科學技術研究開發機構(QST)新一代超級電腦系統挹注動能。由 NEC 組建的系統將採用 280 個 AMD Instinct MI300A APU 協助該機構以及日本核融合科學研究所推動 AI 與科學研究工作。

AMD 領航 Exascale 等級時代

作為唯一為多台 Exascale 等級超級電腦挹注動能的企業,AMD 持續為全球眾多 HPC 系統組建計畫挹注效能與能源效率。

El Capitan 是全球最強大超級電腦,同時也是美國能源部國家核子保安總署(NNSA)第一台 Exascale 等級系統,作為 NNSA 三座實驗室 - LLNL、洛斯阿拉莫斯以及桑迪亞國家實驗室的主力運算資源。El Capitan 將用以推動科學發現與國家安全,提供必要的龐大算力,在無需進行測試的情況下,確保美國核威懾力的安全、防禦以及可靠性。此最先進的系統標誌著 HPC 發展的巨大躍進,為 NNSA 的庫存管理計畫實現前所未有的建模與模擬功能,檢驗逐漸老化的核庫存,以及執行防擴散以及反恐等其他關鍵的核安全任務。

LLNL 與 NNSA 其他三大實驗室亦運用 El Capitan 與其附隨系統 Tuolumne 執行 AI 與機器學習輔助的資料分析,進一步推動 LLNL 的 AI 目標,建構快速精準的科學模型,並能針對其預測的不確定性估算出量化數據。El Capitan 將運用 AI 處理高能源密度的問題,包括慣性約束核融合研究,而 Tuolumne 則將用於非機密性的開放科學應用,其中包括氣候建模、生物安全/藥物開發、以及地震建模等。

在 El Capitan 之外,AMD 與 HPE 亦打造首台 Exascale 等級超級電腦 Frontier。Frontier 設立於橡樹嶺國家實驗室,搭載 AMD EPYC CPU 與 AMD Instinct GPU,以 1.35 exaflops 的效能成為全球第 2 快的電腦。Frontier 持續協助研究人員解決各種複雜的科學問題,從氣候建模與生醫研究,一直到大型語言模型訓練,進一步展現其對推動科學發現以及促進 AI 突破發展的重大貢獻。

這些全球領先的系統提供龐大運算力,為各領域的研究挹注莫大貢獻,其中包括材料科學、氣候建模以及 AI 模型開發等。藉由賦予各領域研究人員卓越能力,以及促進 AI 模型的發展,El Capitan 與 Frontier 正塑造科學與技術的未來前景,促成眾多解決方案,在全球各地解決關鍵難題,凸顯 AMD 致力提供各方所需的高效能運算資源,促成下一波的科學發現與創新。

AMD 在 2024 年超級運算大會設有攤位,攤位編號為 2731,歡迎造訪並進一步瞭解 AMD 的 HPC 解決方案,以及和 AMD 專家現場交流。

相關資源

關於 AMD

50 多年來,AMD(NASDAQ:AMD)推動創新高效能運算、繪圖及視覺技術。全球數十億的消費者、世界 500 強企業以及尖端科學研究機構皆仰賴 AMD 的技術來改善生活、工作及娛樂。AMD 員工致力於研發領先的高效能與自行調適產品,不斷突破技術的極限。欲瞭解 AMD 如何成就今天,啟發未來,請瀏覽 AMD 網站部落格LinkedInX

註 1:EPYC-029C:基於執行緒密度、效能、功能、製程技術及內建安全功能的比較,包括自 2024 年 10 月 10 日開始出貨的伺服器。EPYC 9005 系列處理器提供最高的執行緒密度[EPYC-025B],並以 500 多項世界效能紀錄領先業界[EPYC-023F],以企業領域中以 Java® 操作/秒效能的世界紀錄領先 [EPYCWR-20241010-260],在 HPC 領域以浮點運算吞吐量表現領先[EPYCWR-2024-1010-381],在 AI 端到端方面以 TPCx-AI 效能領先[EPYCWR-2024-1010-525],並獲得最高的能源效率得分[EPYCWR-20241010-326]。第 5 代 EPYC 系列更具有比上一代多 50% 的 DDR5 記憶體通道[EPYC-033C],記憶體頻寬提高 70%[EPYC-032C],並支援多 70% 的 PCIe® Gen5 通道,提升 I/O 吞吐量[EPYC-035C],L3 快取/核心最多可達 5 倍[EPYC-043C],加速資料存取,採用先進的 3-4 奈米製程技術,並提供安全記憶體加密、安全加密虛擬化(Secure Memory Encryption,SEV)、SEV 加密狀態、SEV 安全嵌套分頁(SEV-Secure Nested Paging)等安全功能。欲了解更多資訊,請參閱 AMD EPYC 架構白皮書(https://library.amd.com/l/3f4587d147382e2/)。

註 2:9xx5-001:截至 2024 年 9 月 10 日 AMD 內部的測試結果,固定頻率下的幾何平均效能提升(IPC):

- 第 5 代 EPYC 處理器在企業和雲端伺服器工作負載上的 IPC 提升為 1.170 倍(幾何平均),使用 36 項特定工作負載,為 SPECrate®2017_int_base(幾何平均)、SPECrate®2017_fp_base(幾何平均)、伺服器端 Java 多案例最大操作/秒、代表性雲端伺服器工作負載(幾何平均)以及代表性企業伺服器工作負載(幾何平均)等各項測試結果的幾何平均值。「Genoa」配置(全NPS1):EPYC 9654 BIOS TQZ1005D 12c12t(12+1 中 1c1t/CCD),頻率 3GHz,12 條 DDR5-4800(2Rx4 64GB),32Gbps xGMI;「Turin」配置(全 NPS1):EPYC 9V45 BIOS RVOT1000F 12c12t(12+1 中的 1c1t/CCD),頻率 3GHz,12 條 DDR5-6000(2Rx4 64GB),32Gbps Xgmi 使用 Ubuntu® 22.04 版本的 6.8.0-40-generic 核心作業系統,並開啟效能決定性及效能管理器處理所有工作負載。

- 第 5 代 EPYC 處理器在 ML/HPC 伺服器工作負載上的 IPC 提升為 1.369 倍(幾何平均),使用 24 項特定工作負載,為代表性 ML 伺服器工作負載(幾何平均)和代表性 HPC 伺服器工作負載(幾何平均)等各項測試結果的幾何平均值。「Genoa」配置(全 NPS1):EPYC 9654 BIOS TQZ1005D 12c12t(12+1 中的 1c1t/CCD),頻率 3GHz,12 條 DDR5-4800(2Rx4 64GB),32Gbps xGMI;「Turin」配置(全 NPS1):EPYC 9V45 BIOS RVOT1000F 12c12t(12+1 中的 1c1t/CCD),頻率 3GHz,12 條 DDR5-6000(2Rx4 64GB),32Gbps Xgmi 使用 Ubuntu® 22.04 的 6.8.0-40-generic 核心作業系統,並開啟效能決定性及效能管理器處理所有工作負載,除了 LAMMPS、HPCG、NAMD、OpenFOAM、Gromacs 等使用 24.04 版本的 6.8.0-40-generic 核心。SPEC® 和 SPECrate® 是標準效能評估公司(Standard Performance Evaluation Corporation)的註冊商標。請參閱 spec.org 以了解更多資訊。

註 3:9xx5-022:來源:https://www.amd.com/content/dam/amd/en/documents/epyc-technical-docs/performance-briefs/amd-epyc-9005-pb-gromacs.pdf