Banner ImageMobile Banner Image

AMD Instinct™ MI350 系列

將百萬兆級的技術導入主流高效能運算與人工智慧領域

極致效能、成本效率與全開放資源生態

AMD Instinct™ MI350 系列

AMD 於 2025 年 6 月正式推出 AMD Instinct™ MI350 系列 GPU,為資料中心運算帶來重大躍進,專為生成式 AI 與高效能運算工作負載而設計。此系列採用先進的第 4 代 AMD CDNA™ 架構,並以台積電 3 奈米製程打造,提供卓越的效能與能源效率,能以高速完成大型 AI 模型訓練、高速推論以及複雜的 HPC 工作負載,如科學模擬與資料處理。MI350X 與 MI355X GPU 皆配備 288GB HBM3E 記憶體、高達 8TB/s 的頻寬,在 AI 運算效能上較前一代提升最高 4 倍,推論效能更達 35 倍的突破,奠定其在 AI 與 HPC 市場中強大的競爭地位。
Content Image
AMD Instinct

MI355X GPU

MI350X GPU

型號

MI325X GPU

TSMC N3P / TSMC N6

製程技術 (XCD / IOD)

TSMC N5 / TSMC N6
AMD CDNA4

GPU 架構

AMD CDNA3
256

GPU 運算單元

304
16,384

串流處理器

19,456
1,850 億

電晶體數

1,530 億
10.1 PFLOPS9.2 PFLOPS

MXFP4 / MXFP6

N/A
5.0 / 10.1 POPS4.6 / 9.2 POPS

INT8 / INT8 (稀疏性)

2.6 / 5.2 POPS
78.6 TFLOPS72.1 TFLOPS

FP64 (向量)

81.7 TFLOPS
5.0 / 10.1 PFLOPS4.6 / 9.2 PFLOPS

FP8 / OCP-FP8 (稀疏性)

2.6 / 5.2 PFLOPS
2.5 / 5.0 PFLOPS2.3 / 4.6 PFLOPS

BF16 / BF16 (稀疏性)

1.3 / 2.6 PFLOPS
288 GB HBM3E

專用記憶體大小

256 GB HBM3E
8 TB/s

記憶體頻寬

6 TB/s
PCIe Gen5 x16

匯流排類型

PCIe Gen5 x16

被動式 & 液冷

被動式

散熱

被動式 & 液冷
1400W1000W

主機板功耗

1000W

支援最多 8 個分區

虛擬化支援

支援最多 8 個分區

AMD Instinct™ MI300 系列

概覽規格
Content Image

百萬兆次運算時代的加速核心

  • 專為最嚴苛工作負載打造的 AMD Instinct™ MI325X GPU,具備 256GB 記憶體與每秒 6 TB 頻寬,結合卓越效能與高能源效率,並支援矩陣稀疏運算(Matrix Sparsity),以最佳化 AI 訓練與推論效能。

  • 全球首款資料中心級整合加速處理單元(APU),AMD Instinct™ MI300A,突破 CPU 與 GPU 之間的效能瓶頸,消除程式設計負擔並簡化資料管理流程。

  • 由 AMD EPYC™ 處理器與 AMD Instinct™ GPU 與 APU 驅動的全球最快超級電腦 El Capitan 與 Frontier,不僅在 TOP500 榜單名列前茅,同時於 GREEN500 榜上展現傑出的能源效率,充分展現 AMD 在高效能運算與 AI 加速領域的領導地位。

技嘉科技為百萬兆次運算時代推出先進伺服器方案,將 AMD Instinct™ MI325X 與 MI300X GPU 以開放加速模組(OAM)型式安裝於通用基板(UBB),搭載於 GIGABYTE G 系列伺服器中。整合 CPU 與 GPU 的 AMD Instinct™ MI300A APU 則配置於 GIGABYTE G383 系列,支援四組 LGA 插槽設計。此系列系統兼具高運算密度、卓越擴充性與冷卻效率,協助企業與研究機構推進 AI 與 HPC 的創新發展。

以 AMD ROCm™ 7.0 開創新世代極致效能

Content Image
AMD ROCm™ 7.0 軟體堆疊是讓 AMD Instinct™ MI350 系列發揮極致效能的關鍵差異化技術。開發者能在幾乎不需修改程式碼的情況下,進行高效能 AI 與 HPC 應用開發。MI350 系列 GPU 已針對主流框架如 PyTorch、TensorFlow、JAX、ONNX Runtime、Triton、vLLM 進行全面最佳化,並透過自動核心生成與持續驗證,提供零時差的模型支援。
  • 廣泛硬體與平台支援:ROCm 7 完整支援 AMD Instinct™ MI350 系列 GPU(包含 MXFP6/MXFP4 精度格式),同時延伸至特定 AMD Radeon™ GPU 與 Windows 環境,確保從雲端到邊緣運算都能穩定發揮效能。
  • 專為大型 AI 與 LLM 優化:ROCm 7 聚焦於大型 AI 模型與 LLM 部署,內建預先最佳化的 Transformer 架構(OCP-FP8 / MXFP8 / MXFP6 / MXFP4),並整合 vLLM v1、llm-d、SGLang 等分散式推論框架,同時強化「flash attention」與通訊函式庫,以發揮多 GPU 的峰值運算效率。
  • 效能大幅提升:根據測試結果,ROCm 7 預覽版在 AI 推論上比 ROCm 6 最快達 3.5 倍,訓練速度也提升 3 倍。此效能增長來自低精度數據格式與進階核心融合技術(kernel fusion),可最大化 GPU 效能並減少記憶體與 I/O 負載。[1]
  • 提升開發者生產力:全新的 ROCm Enterprise AI Suite 提供簡化的模型微調與部署流程,只需輸入 pip install rocm 即可安裝。套件內含模型量化(quantization)函式庫與整合化開發工具,協助開發者更快速完成 AI 服務部署並提升執行效能。
  • 擴大的生態系與開源合作:ROCm 7 與主流 AI/HPC 框架深度整合,支援 PyTorch、TensorFlow、JAX、ONNX 等工具,並可原生運行超過 200 萬個預訓練模型。開放式架構與社群協作確保平台在穩定性、相容性與未來工作負載的擴充性上保持領先水準。
[1] (MI300-080)AMD 於 2025 年 5 月 15 日進行測試,測量 ROCm 6.x(搭配 vLLM 0.3.3)與 ROCm 7.0 預覽版(搭配 vLLM 0.8.5)在推論效能上的差異。測試環境採用 8 組 AMD Instinct MI300X GPU,運行 Llama 3.1-70B(TP2)、Qwen 72B(TP2)及 Deepseek-R1(FP16)等模型,批次大小介於 1 至 256 、序列長度為 128 至 204 。所述效能提升以三個 LLM 模型的平均每秒字元處理數(Tokens Per Second, TPS)計算。實際結果可能因系統設定與工作負載而異。

選擇搭載 AMD Instinct™ 伺服器

Feature Icon

高密度算力

提供業界領先的高密度算力,8U 機身的氣冷 G893 系列及 4U 機身的液冷 G4L3 系列,擁有高密度算力同時亦提供絕佳穩定性。
Feature Icon

高效能運算

搭載 8 組 GPU 模組基板的伺服器透過優化的散熱設計,確保處理器和 GPU 算力維持峰值效能。
Feature Icon

彈性擴展

提供多組擴充槽,可彈性配置乙太網路或 InfiniBand 網路介面卡,以實現節點之間高速資料傳輸。
Feature Icon

先進散熱

隨著導入直接液冷(DLC)技術,改善系統整體表現,處理器與 GPU 的熱設計功耗(TDP)持續增長也不構成問題,充分發揮尖端運算的最大潛能。
Feature Icon

能源效率

透過即時電源管理、自動風扇速度控制以及冗餘鈦金級電源供應器(PSU)確保最佳的散熱效果和能源效率。亦有液冷方案供選擇。

AMD Instinct 系列應用

AI 推論

高記憶體頻寬、大容量記憶體以及 GPU 間低延遲互連,對實時與大規模推論應用來說非常重要。系統能以批次方式處理龐大資料集,非常適合即時或大規模推論應用。

生成式 AI

採用 8-GPU UBB 架構的伺服器特別適合生成式 AI 工作負載,因 GPU 的平行運算特性能有效加速龐大訓練資料集的處理與深度學習模型,如神經網路的運行,提升自然語言處理與資料擴增等應用的效能。

高效能運算

HPC 應用中的複雜問題求解通常涉及模擬、建模與資料分析,以獲得更深層的洞察。GPU 提供所需的平行運算能力,同時仍需依賴 CPU 進行數學運算中的序列處理,以達到最佳效能。

相關技嘉伺服器

G4L3-ZX1-LAT4

HPC/AI Server - AMD EPYC 9005/9004 - 4U DP AMD Instinct MI355X DLC

G893-ZX1-AAX3

HPC/AI Server - AMD EPYC 9005/9004 - 8U DP AMD Instinct MI350X

G383-R80-AAP1

HPC/AI Server - AMD Instinct MI300A APU - 3U 8-Bay Gen5 NVMe

G893-ZX1-AAX2

HPC/AI Server - AMD EPYC 9005/9004 - 8U DP AMD Instinct MI325X

G893-ZX1-AAX1

HPC/AI Server - AMD EPYC 9005/9004 - 8U DP AMD Instinct MI300X

G4L3-ZX1-LAX2

HPC/AI Server - AMD EPYC 9005/9004 - 4U DP AMD Instinct MI325X DLC

G593-SX1-AAX1

HPC/AI Server - 5th/4th Gen Intel® Xeon® - 5U DP AMD Instinct MI300X 8-GPU

G593-SX1-LAX1

HPC/AI Server - 5th/4th Gen Intel® Xeon® - 5U DP AMD Instinct MI300X 8-GPU DLC
AMD Logo

相關資源

Resource Image

GIGAPOD - AI 資料中心解決方案

Resource Image

技嘉引領AI時代 偕AMD加速人工智慧與LLM運算應用突破

Resource Image

AMD EPYC™ 9005 系列解決方案

Resource Image

瞄準HPC與AI,技嘉推出支援AMD Instinct™ MI300系列伺服器

Resource Image
Topic

AI伺服器與AI PC解決方案,全面加速人工智慧運算