Success-Case

以新一代高效能運算系統支援日本量子-HPC融合平台

驅動未來量子與超級運算整合的新時代
在高效能運算(High-Performance Computing, HPC)與量子運算(Quantum Computing)逐步融合的時代,世界各國的科研機構正積極探索能突破現有運算疆界的混合平台。日本理化學研究所計算科學研究中心(RIKEN Center for Computational Science, R-CCS)於2025年正式啟動的「量子-HPC混合平台超級電腦」(JHPC-quantum)計畫 ,正是這場技術革命的核心。

在這項由日本經濟產業省(METI)與新能源產業技術綜合開發機構(NEDO)支持的國家級專案中,技鋼科技(Giga Computing Technology)憑藉深厚的伺服器設計與製造實力,擔綱高密度 GPU 節點的設計與生產任務。透過與 NVIDIA以及 ScaleWorX 等夥伴的協作,技鋼科技為這套結合超級電腦 「富岳」(Fugaku)與量子系統的創新平台,提供了高效能、低能耗、可持續的運算基礎。

量子與超級運算的交會點

全球科研領域正邁入一個以異質運算與量子模擬為主導的新紀元。隨著 AI 模型規模與科學模擬複雜度持續攀升,單一型態的運算架構已難以滿足未來研究的需求。日本作為高效能運算的領先國家,其「富岳」超級電腦在全球長期名列前茅,如今更肩負起推動「量子—HPC 融合平台」的使命。

該平台將整合多台超級電腦與量子電腦,包含:
  • 富岳(Fugaku)
  • IBM 超導量子電腦 "ibm_kobe"
  • 離子阱量子電腦「黎明」 "Reimei"

這些系統將透過高速網路與統一的軟體框架相互連結,形成全球首個可實現「量子演算法模擬、整合應用開發與混合運算實驗」的科研基礎設施。其運算中心將設於神戶 RIKEN 計算科學中心 ,並預計於 2025 會計年度內正式啟用。

技鋼科技的角色與挑戰

在這項跨越量子與經典運算邊界的國家級工程中,技鋼科技的核心任務,是設計並製造 135 個運算節點,每節點搭載 NVIDIA 最新一代 Grace Blackwell Superchip「GB200 NVL4」,合計 540 顆 GPU。

這款結合 Grace CPU 與 Blackwell GPU 的超級晶片是 NVIDIA 的旗艦級 AI 運算架構,專為大型語言模型訓練、物理模擬、以及混合量子演算法優化而生。為了最大化效能並確保系統長期穩定,技鋼科技需面對以下三大技術挑戰:

✔️ 高功率密度下的散熱與可靠性

每個 GB200 NVL4 節點的功耗極高,傳統氣冷已無法支撐此等熱密度。技鋼結合多年的液冷開發經驗,導入可支援 >32°C 環境運作的高能源效率「溫水冷卻 (Warm-Water Cooling)」架構,使 GPU 在即高功率密度下仍維持最佳熱效率區間,達成效能與能源效率的平衡。

✔️ 模組化高密度設計與快速交付

為確保整體平台能在計畫時程內完成,伺服器必須具備高度模組化與快速組裝特性。技鋼科技憑藉自研的高密度 GPU 模組與流暢的機構設計 ,將 GPU、CPU、網路模組、與液冷板一體化封裝,大幅縮短組裝與測試時間,實現「設計即生產」的敏捷供應模式。

✔️ 與 NVIDIA 高速網路的深度整合

本運算系統採用 Quantum X-800 InfiniBand 網路交換器,以最佳化的設計整合低延遲訊號路徑,確保多 GPU 節點在跨節點資料交換時保持穩定的同步效能,並透過內建管理韌體支援 NVIDIA NVLink高速互連架構。

創新技術亮點

技鋼科技在本專案中應用了多項自研技術,成為這套量子-HPC混合平台的關鍵基石。

1. 高效液冷結構設計
技鋼科技延續多年資料中心與超算液冷經驗,開發出符合 RIKEN 要求的高可靠度溫水冷卻模組。此設計具備以下特點:
  • 高熱通量冷板:專為 GB200 NVL4 晶片設計,能承受超過 1,000 W 熱負載。
  • 可維護性設計:液冷接頭支援快速拆卸與零洩漏更換,降低維運成本。
  • 能源回收潛力:冷卻水出口溫度可達 45°C,可再利用於建築溫控或熱能回收系統。
這套方案不僅符合 RIKEN 的節能政策,也展現技鋼科技在可持續運算解決方案上的長期投入。
2. 高度整合的機櫃佈局
為滿足高密度安裝與伺服器間的高速連結需求,技鋼科技以資料中心整櫃(rack-level)設計概念為基礎,將NVL4伺服器整合為統一單元的運算叢集,支援靈活的系統擴展與運維。每櫃機架皆整合:
  • 基於GB200 NVL4架構伺服器
  • InfiniBand 交換機
  • 液冷分配模組(CDU)
  • 電源管理與監控系統
此整櫃式架構讓系統可快速安裝於 RIKEN 神戶運算中心,並能無縫連接至富岳與其他量子系統。
3. 卓越的能源效率與可持續性
系統提供超過 FP64 21 PFLOPS及 FP8 5 EFLOPS的世界級運算效能。技鋼科技透過精密的熱管理與電源分配設計,使同級系統的整體能效表現領先業界平均值超過 15% ,同時降低對冷卻基礎設施的依賴。

這也呼應了技鋼科技的核心理念:「Performance. Efficiency. Sustainability. 」- 以卓越效能驅動科學創新,以能源效率延續運算未來。


從設計到實現的全球夥伴鏈

本專案的成功,是多方協作的成果。整體系統由 ScaleWorX 擔任系統整合商,DTS Corporation 負責總體專案規劃與測試流程,NVIDIA 提供 Grace Blackwell Superchip 與 InfiniBand 通訊架構,DDN 負責高速文件系統,而技鋼科技則是計算節點的核心設計與製造。

這種跨領域、跨國合作不僅體現了全球 HPC 生態系的整合趨勢,也再次證明技鋼科技在全球超級電腦市場中,已具備與國際領導品牌並駕齊驅的研發實力與交付能力。

技鋼科技亞太區業務處長余惠群表示「我們很榮幸能與日本最頂尖的科研機構合作。技鋼科技憑藉高效能系統設計與製造的深厚經驗,以及與 NVIDIA 的緊密協作,加速日本在世界級科研領域的持續突破。我們希望透過兼具效能、效率與永續性的設計,成為推動新一代運算革命的重要力量。」

量子與HPC融合的未來價值

這套量子-HPC混合平台不僅是一台超級電腦,更是一個跨越量子與經典運算界線的實驗場。透過 SQC介面-一個JHPC-quantum計畫中研發、專為量子電腦與HPC系統直連、結合了資料交換及工作管理的應用程式介面 (API),該系統將能與富岳、ibm_kobe、黎明共同運作,讓研究人員能在單一平台上進行:

  • 量子演算法模擬
  • 混合 AI/量子機器學習模型訓練
  • 材料科學與分子動力學模擬

這將為能源開發、藥物設計、金融模擬、以及基礎物理研究帶來突破性的進展。

而技鋼科技所設計的 GPU 節點,不僅是這些研究的運算基礎,也代表著一個新時代 HPC 架構的實體化典範——它將經典超算的強度與量子模擬的靈活性,融合於同一系統中,為全球科研界開啟新的運算範式。

以技術與想像力打造未來超算基石

從早期支援頂級品牌伺服器代工,到今日引領液冷與整櫃 AI 運算架構的開發,技鋼科技不斷深化「以系統為中心」的創新能力。此次參與 RIKEN 量子-HPC混合平台的建構,是公司邁向全球科研高端市場的重要里程碑,也再次印證技鋼科技在 HPC、AI Factory 與資料中心基礎設施領域的整合實力。

隨著量子與 HPC 的融合漸趨成熟,技鋼科技將持續以創新、專業與可持續設計,協助全球科研夥伴實現下一代科學發現,並將「想像力轉化為現實的運算力量」。

關鍵成果摘要

項目 技術亮點
運算節點 135 節點,540 GPU(NVIDIA GB200 NVL4)
通訊架構 NVIDIA InfiniBand XDR,3.2 Tbps 頻寬
液冷技術 溫水冷卻系統(Warm-Water Cooling, >40°C)
效能表現 FP64: 21+ PFLOPS / FP8: 5+ EFLOPS
系統整合 與富岳、ibm_kobe、黎明相連
領導單位 日本理化學研究所計算科學研究中心
技鋼角色 GPU 節點設計與製造、整櫃散熱與佈局工程
永續價值 高能效架構、熱能回收潛力、模組化設計
想要掌握最新科技動向?馬上訂閱!
訂閱電子報
想要掌握最新科技動向?馬上訂閱!
訂閱電子報