Tech-Guide

CPU vs. GPU:淺談伺服器的兩大運算力

by GIGABYTE
順應科技趨勢,業界持續追求運算力更強大的伺服器,其中的關鍵元素除了大家熟知的中央處理器CPU之外,圖形處理器GPU近年來也受到重視;但您是否知道,什麼是GPU?它與CPU的差別何在?又該如何運用兩種不同類別的處理器,發揮最強大的運算力?技嘉科技是伺服器與尖端科技解決方案的知名品牌,發表本篇《科技指南》,目的是比較CPU與GPU的原理與功能,進一步協助您挑選合適的技嘉伺服器產品,將「GPU運算力」導入您的伺服器機房與資料中心。
談及運算效能,相信大家第一個想到的都是中央處理器,也就是CPU。如同我們在「深究伺服器處理器」的《科技指南》中所提到,CPU的主要功能是接收與詮釋指令,主導伺服器內其他元件的運作,達成用戶指定的目標;這個流程稱作「指令周期」,也就是處理器每天重複進行的工作。「指令周期」編碼越繁雜,伺服器所解決的問題也越困難,例如協助科學家分析來自外太空的都卜勒光譜,為人類尋找可居住的第二顆地球。因此,人們開始思考:難道不能「客製化」處理器設計,使其更擅於解決某些特殊的問題?

了解更多:
《詞彙學習:技嘉小百科,告訴你伺服器是什麼
《科技指南:深究伺服器處理器,伺服器運算效能的核心關鍵
《成功案例:美國洛厄爾天文台用技嘉伺服器,搜索太陽系外的外星生命
中央處理器CPU的定義
首先,來談談CPU的架構與運作方式。CPU就是一塊電腦晶片,由數以億計的電晶體所組成,用來進行運算,也就是前面提及的指令周期。指令周期又可細分為提取、解碼、執行和寫回的四個步驟;依照其所被分配處理的步驟,電晶體組成程式計數器、暫存器和算術邏輯單元(ALU)等元件。由於CPU可能要處理各種不同的指令,因此任何一個元件都不能省略,必須具備很完備的「工具箱」,可以解決任何問題。
圖形處理器GPU的由來與定義
但是,如果使用者很清楚指定,處理器就是要專門處理某一項工作,例如渲染電腦影像,那怎麼辦?於是,人類發明了圖形處理器GPU。顧名思義,GPU主要應用在電腦圖像處理,構造與CPU相似,包含控制單元(control unit)、ALU、快取(cache)等元件。如同CPU一樣,GPU獲取用戶的指令之後,使用內部元件進行運算,再將結果呈現在螢幕上。

差別在於,GPU比CPU的核心數更多,而GPU的核心、控制單元與ALU的設計則較為單純,快取空間也比較小。CPU擅長進行單一指令的序列處理(也就是一次完成一項工作),而GPU受惠於大量的核心數,可採用平行運算模式,將一項工作分成許多不同的步驟,分配給核心同步進行,藉此加快運算速度。簡單來說,雖然CPU理論上能完成任何運算工作,但GPU擅於處理較為簡易的特殊工作,例如渲染您在畫面上所看見的數位影像。

詞彙學習:
花你一分鐘,一次看懂關於核心
技嘉小百科,告訴你平行運算是什麼

聰明的讀者可能已經猜到接下來的發展。人們發現,除了渲染圖像之外,GPU還能助力完成其他工作;所謂的通用圖形處理器GPGPU,就是幫CPU處理較為簡單卻瑣碎的各種運算。在伺服器業界,當人們談及「GPU運算」或「CPU vs. GPU」的議題,口中的「GPU」,其實就是「GPGPU」。
CPU與GPU,兩者之間的差別何在?
高階伺服器要同時採用先進的CPU與GPU,才能躍進高效能運算(HPC)的層級,但您可能感到納悶,為何不能擇一使用?接下來,我們深入解釋CPU與GPU之間的差別,協助您了解兩種處理器在伺服器中扮演的不同角色。《詞彙學習:花你一分鐘,一次看懂關於高效能運算HPC

首先,我們必須說明,沒有CPU,伺服器將無法運作。CPU就像汽車的引擎,其他元件都是配合它運作。CPU的時脈速度較高、延遲較低,快取空間較大,控制單元與ALU的設計也較為複雜,因此,CPU是處理器當中的「通才」,擁有高度的靈活性,能處理邏輯設計非常繁雜的運算指令。
CPU與GPU的構成元件相似,一樣包含控制單元、算術邏輯單元(ALU)、快取及動態隨機存取記憶體(DRAM)。差別在於,GPU的控制單元、ALU及快取設計較為簡易,且數量較多,導致GPU擅於處理大量簡單的工作(例如渲染圖像),而CPU則是什麼都能應付的「通才型」處理器。
難倒「通才」的問題,就是當它被交付大量的瑣碎工作,雖然它能夠處理,卻會浪費太多寶貴時間;大材小用,就像米其林主廚被派去夜市炸雞排,耽擱了高檔餐廳的業務。相較下,GPU的控制單元與ALU設計簡單、快取空間較小,擁有大量核心數及比較高的資料吞吐量,適合快速處理簡單的運算,可說是「專才型」的處理器,專門處理渲染圖像等工作。

比較CPU與GPU之間的差異,我們主要可由以下四個項目來做分辨:

- 核心數:由於CPU的架構較為複雜,因此核心數相對比較少,就連採用精簡指令集架構(RISC)的ARM處理器,頂多也就是幾百顆核心。GPU架構較為單純、簡略,因此它能容納好幾百顆,甚至上千顆核心。

- 元件特色:CPU必須要能夠處理任何指令,因此所搭配的元件非常齊全,比方說,它的快取比較大,能儲存更多資訊,控制單元和ALU也較為複雜。然而,GPU只需要小容量的快取和簡易的控制單元與ALU,就足以應付所負責的簡單、重複性高的工作。

- 運算模式:CPU完成計算的方法,是單一指令的序列處理,也就是一次只能進行一項工作。因此,CPU設計大多講究高速率、低延遲,以最大的效率完成運算工作。相較之下,GPU講究平行運算功能,把複雜工作拆成許多小部分,讓眾多的核心同時著手處理,一樣能夠快速完成工作。

- 擅長工作:讓CPU處理簡易的指令周期,簡直是大材小用,它的架構應當用來處理邏輯設計較為複雜的工作。而GPU存在的目的就是處理簡易指令,以資料吞吐量取勝,因此能在一秒內繪製好幾十張電腦螢幕上看到的畫像。
以上表格比較CPU與GPU之間的差異。透過「異質運算」,不同屬性的運算工作能交由最合適的處理器來進行,藉此提升運算速度,讓您的伺服器解決方案能發揮最強大的運算效能。
除了渲染圖像之外,GPU在需要密集資料運算的領域也嶄露頭角,比如在大數據分析、機器學習、AI人工智慧發展等方面,GPU已成為推動電腦科學向前邁進的重要功臣。若以電腦視覺來做舉例,人工智慧之所以能辨識車牌號碼或是手寫字跡,因為AI模型「拜讀」過大量的圖像資訊,可能是幾百萬張、甚至是上億張圖片,經過反覆的猜測來調整演算法參數,直到AI的「猜」力變得萬無一失。雖然AI訓練也能利用CPU來處理,但效率畢竟不如搭配GPU協同運算來得高,GPU可以透過平行運算處理大量簡易的工作,非常適合人工智慧的訓練與推論工作。也因此,市面上最強大的AI超算平台幾乎都支援強大的GPU加速卡或模組,提升人工智慧開發效率。

了解更多:
拜訪技嘉科技人工智慧專頁,一覽技嘉全系列AI伺服器產品
《詞彙學習:花你一分鐘,一次看懂關於AI人工智慧
《詞彙學習:技嘉小百科,告訴你電腦科學是什麼
CPU與GPU誰比較優秀?各有所長,異質運算是未來趨勢
總結前面所說幾個重點:第一,沒有CPU,GPU也無法運行;第二,理論上,CPU能獨立完成所有工作,但所有事都靠CPU很吃力。因此,真正聰明的管理者,應該同時利用CPU與GPU,將不同工作分配給有不同專長的處理器。一台伺服器搭配合適的中央處理器及圖形處理器,才會有最佳的表現。

您或許聽說過這個專有名詞:「異質運算」。所謂的異質運算,就是支配不同屬性的運算單元,用來協助CPU完成運算,除了剛剛提到的GPU與DPU,還有視覺處理器VPU、特定應用積體電路ASIC、現場可程式化邏輯閘陣列FPGA。也就是說,如果您的伺服器還沒導入異質運算,那麼事實上,您的伺服器還有許多「成長」的空間。

詞彙學習:
常聽別人說異質運算,你知道那是什麼嗎?
花你一分鐘,一次看懂關於現場可程式化邏輯閘陣列FPGA
技嘉科技提供先進伺服器解決方案,為您導入GPU協同運算
本章節中,我們將與讀者分享,如何挑選最合適的伺服器解決方案,讓您的中央處理器和圖形處理器都能大放異彩,解決您的運算問題。

技嘉科技提供各種GPU運算解決方案,其中G系列GPU協同運算伺服器可算是GPU運算的代表,產品特色包括具備高密度的GPU支援能力以及能提升整體運算效能的高速PCIe傳輸設計。以5U規格(1U代表一個機架單位,佔用機架約44公厘的垂直空間)的G591-HS0作為範例,這款伺服器支援高達32張小尺寸low-profile half-length GPU加速卡,藉由Intel® Xeon®可擴充處理器集結整台伺服器的運算力,發揮超級電腦等級的頂尖效能。

詞彙學習:
技嘉小百科,告訴你PCIe是什麼
常聽別人說機架單位(U),你知道那是什麼嗎?

G系列GPU協同運算伺服器,並非技嘉唯一支援異質運算的伺服器產品。其他搭載GPU加速器的技嘉伺服器,包括H系列高密度伺服器、通用型R系列機架式伺服器、適用於邊緣運算的E系列邊緣運算伺服器,及可將企業級運算力直接部署在工作崗位的W系列工作站產品。依照客戶需求,這些產品可搭配不同的CPU與GPU,產生綜效並解決運算問題。《詞彙學習:花你一分鐘,一次看懂關於邊緣運算

另外一種挑選伺服器的方法,就是藉由「倒推法」,從使用情境倒推回來判斷哪款伺服器產品最為適合。技嘉客戶的真實成功案例,能協助您理解不同領域的用戶,如何利用CPU與GPU的強大運算力,進行與數據分析、電腦模擬、機器學習及AI開發相關的工作。
導入GPU運算,有助於CPU效能level up,技嘉科技G系列GPU協同運算伺服器及其他產品,皆可搭載最先進的CPU與GPU,提供領先業界的頂尖運算力,發揮AI人工智慧與大數據技術,應用在天氣預測、能源探勘及科學研究等不同領域。
歐洲核子研究組織:GPU助力分析大量數據,探尋高能物理學的奧秘
歐洲核子研究組織(CERN)是全球規模最大的粒子物理實驗室,所經營的大型強子對撞機(LHC)專門透過粒子對撞實驗來偵測新的次原子粒子,為人類探索微觀物理的奧秘。然而,粒子對撞實驗產生每秒高達40 TB的原始數據串流,這麼大規模的海量資訊如果無法即時處理,必然會影響科學研究的進展。

CERN挑選技嘉G482-Z51,這款伺服器採用AMD EPYC™中央處理器,搭配高達八張PCIe Gen 4.0連接的圖形處理器,快速分析物理實驗產出的大量數據。經由技嘉優化的硬體整合設計,讓CPU與GPU、及GPU與GPU之間的高速訊號傳遞延遲降至最低,讓GPU系統傳遞資料時達到低延遲、高頻寬及高可靠度的絕佳表現。

了解更多:
歐洲核子研究組織運用技嘉伺服器,探尋高能物理學奧秘
淺談大數據分析應用,掌握先機的關鍵鑰匙

另外與數據分析相關的成功案例,是位於法國的地質科學研究公司,專為能源產業提供地球物理數據成像、地震數據解析等服務,提升石油與天然氣勘探的效率。為了提升圖像辨識、影像及數據解析的處理效能,並更精確、更即時地提供探勘資訊,該公司採用技嘉G291-280伺服器,這款伺服器在2U機殼內可裝置高達八張雙插槽的GPU加速卡,增進AMD EPYC™中央處理器的運算速度。技嘉亦提供嶄新的浸沒式液冷技術,將伺服器泡在不導電的冷卻液中散熱,不但能釋放晶片的極致運算力,同時也能減少耗電與碳排放量,協助客戶達到高效能運算與綠色運算的雙贏目標。

了解更多:
技嘉GPU運算伺服器,提升油氣產業的探勘效率
《詞彙學習:花你一分鐘,一次看懂關於浸沒式液冷
日本早稻田大學:利用GPU進行電腦模擬,並為機器學習做好準備
東京早稻田大學有「全球災害防治中心」的美譽,研究團隊利用技嘉伺服器建構運算叢集,藉由電腦模擬來研究因為全球暖化而加劇的天然災害,產出高參考價值的觀測數據,協助政府當局規劃更有效的防災辦法。研究團隊將海量的氣象數據倒入伺服器系統中,產出極為細緻的電腦模型,甚至能模擬災區每一位居民的行蹤與狀況。

了解更多:
暴風解碼,技嘉運算叢集協助早稻田大學研究氣候變遷
《詞彙學習:技嘉小百科,告訴你運算叢集是什麼

早稻田大學採用技嘉G221-Z30W291-Z00工作站產品,G221-Z30搭配AMD EPYC™中央處理器、GPU加速卡及大量的記憶體容量與儲存空間,扮演叢集的控制節點。GPU運算不但提升電腦模擬的精確度,還能透過平行運算同時執行不同模擬,並將產出結果所需的時間大幅縮短75%。技嘉伺服器支援電腦視覺與機器學習的相關應用,研究團隊希望未來能透過神經網路技術的長短期記憶(LSTM)模型,預測海上波浪的情況。

詞彙學習:
常聽別人說節點,你知道那是什麼嗎?
花你一分鐘,一次看懂關於電腦視覺
成功大學:發揮GPU運算力,打敗其他名校勇奪全球AI競賽冠軍
若想了解CPU與GPU如何協助開發人工智慧,我們可以看看成功大學奪下HPC-AI電腦競賽冠軍的故事。技嘉為了培育下一代的AI與HPC人才,達成企業社會責任CSR和環境、社會與企業治理ESG的永續經營目標,2020年提供G482-Z50伺服器給成大團隊,為當年的亞太地區「高速運算暨人工智慧(HPC-AI)學生競賽」做準備。G482-Z50的擴充槽最多可容納十張PCIe Gen 3.0 GPU加速卡,也就是讓雙核心的中央處理器,每一顆核心連接五張加速卡,並透過PCIe連接技術降低傳輸延遲。成大團隊在伺服器內安裝輝達NVIDIA的GPU加速器,練習利用由Google開發的自然語言處理NLP及機器學習訓練技術「BERT」挑戰世界紀錄,比賽當天最終以正確率87.7%的MultiNLI語意資料庫判讀結果,超越其他國際學府的成績,包括美國聖地牙哥加利福尼亞大學(正確率87.2%)、史丹佛大學(正確率87.16%),勇奪超級電腦競賽的世界冠軍。


了解更多:
CSR、ESG實踐案例:技嘉助攻成功大學,勇奪亞太HPC-AI電腦競賽冠軍
拜訪技嘉科技永續發展資訊網,一覽技嘉為地球和社會的付出!
《詞彙學習:技嘉小百科,告訴你自然語言處理NLP是什麼

看完本篇科技指南,希望大家對CPU與GPU的定義與差別有更深入的了解,也希望大家能明白為何要使用異質運算產生綜效,讓兩種處理器推動AI、HPC等尖端科技的進步。若對於伺服器及先進的CPU或GPU產品有任何疑問,技嘉將提供您最適宜的諮詢服務,歡迎您透過marketing@gigacomputing.com電子信箱聯絡技嘉科技業務窗口,我們將協助您挑選適合的伺服器解決方案。

同場加映:
《科技指南系列文章:私有雲的需要與必要,如何評估企業的雲端部署?
《更多成功案例:技嘉藉由單相浸沒式液冷技術,助力日本電信龍頭KDDI開發新世代資料中心
Realtion Tags
大數據
邊緣運算
高效能運算
資料中心
浸沒式冷卻
機器學習
人工智慧
圖形處理器
伺服器
平行運算
運算叢集
異質運算
PCIe
機架單位
通用圖形處理器
電腦視覺
核心
節點
自然語言處理
現場可程式化邏輯閘陣列
資料處理器
電腦科學
資料儲存
WE RECOMMEND
RELATED ARTICLES
如何將人工智慧導入醫療保健業

AI & AIoT

如何將人工智慧導入醫療保健業

從事醫療與健康產業的讀者,請花幾分鐘閱讀本篇文章,了解人工智慧(AI)為這個領域所帶來的嶄新商機,並認識能助您從中受益的AI工具。本篇是技嘉科技「Power of AI」系列文章,目的是介紹不同產業的最新AI趨勢,鼓勵前瞻者把握AI浪潮,找尋自己的機會。
帶您快速跟上人工智慧AI趨勢的十大問答

AI & AIoT

帶您快速跟上人工智慧AI趨勢的十大問答

大家都在談人工智慧(AI),您是否也希望擁有基本的知識,參與這個話題的討論?別擔心,技嘉科技為您準備了介紹AI趨勢的十大問答,讓您能快速理解人工智慧的概念!
什麼是HPC高效能運算? 技嘉科技《科技指南》系列文章

Tech Guide

什麼是HPC高效能運算? 技嘉科技《科技指南》系列文章

隨著伺服器解決方案變得更為普及,常有人提起高效能運算(HPC);內行人把這個字掛在嘴邊,好像只要是伺服器產品,就應該提供HPC功能,HPC可以解決所有運算問題……您可能想要知道,HPC真正的優勢是什麼?您能如何應用? 技嘉科技是高性能伺服器產品的業界領袖,本次發表《科技指南》文章,目的是清楚解釋HPC定義,並透過真實世界HPC成功案例介紹,希望能夠幫您評估,HPC是否符合您的需求?如果需要HPC,技嘉科技能為您提供什麼服務?
如何挑選您的AI伺服器?(上)CPU和GPU

Tech Guide

如何挑選您的AI伺服器?(上)CPU和GPU

生成式人工智慧和其他AI工具盛行的當下,挑選合適的AI伺服器成為各產業的首要任務。技嘉科技最新發表《科技指南》,帶領讀者認識AI伺服器的八個關鍵零組件,本篇從最重要的元件開始,即中央處理器(CPU)和圖形處理器(GPU)。挑選適當的運算晶片,打造量身訂做的人工智慧超算平台,可以讓工作事半功倍,為使用者開創全新的巔峰。
想要掌握最新科技動向?馬上訂閱!
訂閱電子報