WEKA 儲存解決方案 | 解決方案

全面發揮 GPU 叢集效能

WEKA 是一個高效能資料儲存平台，為 AI 與其他高運算密集型工作負載提供快速、統一且可擴展的資料存取。它可確保 GPU 以快速且穩定的方式取得資料，讓 GPU 能夠全效運作，從模型訓練到推理，從 MLOps 到資料池，讓每一項工作流程都更快、更順暢。

為什麼選擇 WEKA 高效能資料平台？

WEKA 提供新一代以微服務為基礎的架構，為大規模 AI 工作負載帶來極致的效率與可靠性。

極速效能：專為 AI/HPC 設計的 POSIX 相容分散式檔案系統，無論小檔案隨機讀寫或大檔案串流，都能維持穩定低延遲
雲端一致：單一平台即可橫跨本地、雲端與混合環境，資料流與權限控管保持一致
簡化流程：同一命名空間 (Single Name Space) 同時支援高效能檔案 I/O 與 S3 相容物件分層，大幅縮短資料準備時間
彈性擴充：節點可線性擴充容量與提升效能，升級過程無需停機、資料搬移
效能與成本兼顧：軟體定義架構，讓硬體價值極大化，降低每 TB 成本與維運複雜度

"此 WEKA NeuralMesh™ 部署提供一致性儲存與多雲彈性，在任何規模下皆能實現高效能與可擴充性。"

核心特色一覽

多協定支援

POSIX (原生), NFS/SMB (協定服務), S3 (相容)

資料分層

熱資料層 (NVMe) ↔ 溫/冷資料層 (物件儲存) 支援自動化分層

資料保護

快照、複寫、配額管理、多租戶隔離

可監控性

與 GPM 及第三方監控系統整合的即時遙測與 API

零拷貝路徑

透過 GPUDirect Storage 加速 GPU 直接存取資料

資料一致性

與即時元數據索引具備高度一致性

與 GIGABYTE 產品的整合

"8 x Gen5 NVMe storage servers"

可擴展的 GIGABYTE × WEKA 架構

此儲存加速方案中，最少只需 8 個儲存節點即可大幅提升效能，並可彈性搭配多種機型，包括 1U、2U (含 2U 4節點高密度設計) 等機種選擇。此架構結合高效能 NVMe 儲存層與可擴充的物件儲存層，透過高頻寬、無損網路 (RoCEv2/InfiniBand) 以及 UfiSpace 開放式網路方案，確保端到端的低延遲與靈活的擴展能力。

"A unified GPM interface that seamlessly integrates WEKA software, giving users clear, instant access to storage health, performance, and capacity insights.'"

統一管理

GIGABYTE POD Manager (GPM) 作為整體環境的管理平台，能無縫整合硬體資源與 WEKA 軟體定義儲存服務。透過自動化部署與韌體更新功能，管理者能一鍵完成大規模叢集的初始建置與快速擴充，縮短部署時程，即時啟動資料中心維運。

核心優勢：

全方位即時監控：視覺化儀表板深度整合節點狀態、容量利用率及 IOPS 效能報告，讓系統健康狀況一目了然。
主動式維運管理：結合智慧示警通知與標準 API，可輕易串接現有管理流程，實現故障預警與快速排除。
高效資源配置：專為高密度運算設計，確保儲存架構在高壓力 AI 工作負載下，依然保有穩定的低延遲表現。

零手動調教

AI 規模化不僅取決於初始部署 (Day 0) 的效能，更在於長期的運維效率與系統穩定性。與傳統平行檔案系統不同，WEKA 的 NeuralMesh™ 專為極簡擴展而生，具備自動最佳化、快速自我修復與線上無停機升級的能力。無論是動態擴展容量、管理多租戶或遷移工作負載，NeuralMesh 都能確保您的 AI 資料管線始終保持巔峰表現。

基礎架構最佳化

支援多協定與零拷貝
無需額外閘道器
每節點配置 2x 400Gb CX-7 網路卡

負載平衡

自動平衡負載與資料分佈
預設寫入優化與自適應快取

多租戶架構

實體資源隔離與全程加密
支援 RBAC 與驗證掛載

彈性擴充

線上調整規模、不中斷
線性資料與元數據擴展
可加入 Tier 2 降低成本

無中斷升級

升級過程服務不中斷
支援全叢集或租戶/App 批次升級

損害復原

提供無損快照與 Snap-to-Object
支援智慧型快速修復及資料重建

部署與交付服務

評估與設計：專業團隊會深入了解您的工作負載與儲存中心現況，評估所需的儲存容量與效能亦會同時評估規畫網路拓樸，確保整體系統能以最高效率運作。
概念驗證／效能驗證：專業團隊會先建立一個小型試驗環境，進行完整的測試與效能基準評估；並將此試驗系統與您現有的工具與流程整合，以確認兼容性與實際運行表現。
正式上線與資料遷移：制定並執行資料遷移計畫，包括將資料分層至適合的儲存層級，以及選擇線上或離線遷移方式。確保系統能順利切換至正式運作環境。
效能調校：透過最佳化系統設定，確保 GPU 能以最快速度取得資料。團隊會調整叢集與客戶端的多項參數，以達成預期的吞吐量與延遲水準。
代管運維：提供持續性的系統管理服務。交付團隊會使用 GPM 監控儀表板，定期回報服務水準，並在軟體生命週期中負責版本升級與維護。