在高效能運算與 AI 應用領域,高效能智慧資料中心(Performance Optimized Datacenter, POD)成為最具競爭力的解決方案之一,結合了強大運算能力、高擴展性與成本效益。GIGABYTE 的 POD 解決方案 「GIGAPOD」不僅是靈活可擴充的硬體架構,更整合基礎設施、平台軟體與端對端架構服務,從概念諮詢到系統驗證,提供一站式完整服務。
GIGABYTE POD Manager (GPM) 是人工智慧資料中心基礎架構不可或缺的管理平台,簡易直覺的介面、納管資料中心基礎設備,協助企業最佳化資源運用、提升營運效率,並且能夠靈活應對AI 與 HPC 工作負載需求,讓資料中心運營更高效、管理更簡單!

主要功能介紹
資料中心基礎設施管理
GPM 內建GIGABYTE伺服器管理軟體 (GIGABYTE Server Management, GSM),其為一個透過遠端進行多重伺服器管理平台。GPM 能夠即時監測伺服器、網路交換器與儲存設備的健康狀況與使用率,讓 IT 團隊能快速回應與排除問題,確保資料中心穩定運行。
快速作業系統部署
透過自動偵測新設備與簡化安裝流程,GPM 讓基礎設施部署變得輕而易舉!其功能包括:
- 預設與可自訂的作業系統安裝模板,實現快速部署。
- 批次部署功能,可一次安裝多台設備,大幅提升運維效率。
工作編程與 AI/HPC 負載管理
GPM 支援 Kubernetes、Hadoop 等叢集應用的管理與部署,提供:
- 彈性資源調度,根據需求滾動式分配運算資源。
- 高擴展性,以適應 AI 與 HPC 的工作負載需求。
即時監控與智能警示
GPM 提供可自訂的監控面板,從硬體設備到應用層級,讓管理者一目了然掌握系統效能:
- 智慧警示機制:可設定警示閾值,透過 Email、Webhook 或整合聊天系統即時通知管理人員。
- 事件管理:記錄、分類並快速處理系統問題,提高維運效率。
- 主動式問題排除:降低突發狀況的影響,確保高可用性,減少系統中斷風險。
開放式運算環境,靈活整合 MLOps 平台
GPM 提供靈活的叢集與工作負載管理,並支援多種軟體平台,讓企業能夠依自身營運需求進行最佳化資源配置。
- 相容GIGABYTE伺服器管理軟體(GSM)和 NVIDIA Base Command™,輕鬆管理叢集運營。
- 支援 NVIDIA AI Enterprise 及MLOps 平台,讓 AI 訓練與推理流程更順暢。
直覺化 UI 與全方位管理工具
GPM 提供完整且使用者友善的管理介面,讓管理員能夠輕鬆監控與管理POD資源,透過視覺化管理工具,大幅簡化日常維運:

監控面板
集中顯示 POD 設備、功耗、伺服器配置、關鍵事件與運作狀態。

設備管理
- 伺服器狀態預覽:整合 BMC 與作業系統的詳細資訊。
- 叢集管理:依據伺服器型號或叢集歸納與管理設備。
- 韌體批次更新:可依伺服器型號與叢集進行批次升級。

視覺化POD管理
提供機櫃布局、設備健康狀態、電力狀態、BMC IP、溫度及伺服器位置等圖像化資訊。

節點佈建
- 網域內自動偵測並納管新設備以便即時啟用
- 可預先定義及客製化作業系統的安裝與組態範本。
- 支援批次部署,能同步在多台設備上安裝或更新作業系統。

工作負載管理
針對 AI 與 HPC 工作負載進行叢集調度與編排。

即時監控與管理
- 提供設備健康狀態、功耗、溫度的即時數據。
- 提供 POD 網路設備總覽,包括健康狀態與連線資訊。
- 記錄並管理由伺服器或第三方系統觸發的事件。
GPM採用直覺式使用者介面設計,結合即時監控與自動化功能,最大化營運效率,也讓資料中心管理變得更輕鬆!無論是日常監控還是多任務處理,GPM 讓企業能高效掌控資料中心的每一項運作,帶來無縫、精準的管理體驗!