游戲市場正在不斷開發(fā)出新的場景需求,游戲開發(fā)團(tuán)隊(duì)在傳統(tǒng)業(yè)務(wù)之外也都在打磨新的工作流,來應(yīng)對高質(zhì)量的游戲制作任務(wù)和短平快的 AI 游戲。這不可避免地涉及到生產(chǎn)力工具 GPU 的升級,而團(tuán)隊(duì)都希望“花小錢,辦大事”,用一套高性價比的方案支撐起多元的應(yīng)用場景和不同的工作流。
但目前 GPU 架構(gòu)正在迭代,AI 工具、VR/AR 工具又以百花齊放的姿態(tài)不斷涌現(xiàn)出來,對于游戲開發(fā)團(tuán)隊(duì)做 GPU 采購(一種中長期的投資)也帶來了挑戰(zhàn)和壓力。我們特地根據(jù)不同的任務(wù)需求,整理了一些 GPU 選型的關(guān)鍵要素和項(xiàng)目測試數(shù)據(jù),給大家做個選型攻略分享。
1、3D圖形類任務(wù)
任務(wù)涉及建模、材質(zhì)、燈光、動畫、特效和渲染等。其中,渲染通常是性能要求最高的部分,我們可以根據(jù)開發(fā)項(xiàng)目中的中大型場景渲染需求,初步框定顯卡選型的范圍。需要注意的是,很多 3D 軟件并不支持多 GPU 渲染,所以單張顯卡的能力非常關(guān)鍵。
【需要特別關(guān)注的顯卡參數(shù)】
顯存容量:
較大的顯存可以支持更復(fù)雜和更大規(guī)模的場景,顯存容量太小則會導(dǎo)致建模操作不暢、渲染錯誤等情況。根據(jù)項(xiàng)目的測試情況來看,顯存 20GB 可以支持中型場景 4K 分辨率的渲染場景,如果是復(fù)雜場景 8K、16K 分辨率情況下,則需要顯存 32GB 以上。
GPU 架構(gòu)、CUDA 核心與 RT 核心:
目前大多數(shù)團(tuán)隊(duì)采用的是 NVIDIA Ampere 架構(gòu)、NVIDIA Ada Lovelace 架構(gòu)的 NVIDIA RTX? GPU。NVIDIA Ada 架構(gòu)相比 NVIDIA Ampere 架構(gòu)是更新一代的架構(gòu),性能更高。CUDA 核心數(shù)會影響并行計(jì)算能力,而 RT 核心則是專用于加速光線追蹤的核心,簡而言之,沒有 RT 核心則不支持光線追蹤。
是否 CUDA 核心數(shù)和 RT 核心數(shù)越多,性能就越高?
這里我們不得不強(qiáng)調(diào),不同的 GPU 架構(gòu),采用的是不同代的核心,新一代的核心性能會比上一代的更強(qiáng)。如果在同一架構(gòu)下,CUDA 核心和 RT 核心數(shù)越多,顯卡性能會更高。但在不同架構(gòu)的顯卡中,就不能這么比較。
因此以目前的技術(shù)發(fā)展來說,建議直接采用 Ada 架構(gòu)的 NVIDIA RTX GPU 來做圖形渲染,這樣更好做后期擴(kuò)展。
圖形 API:
NVIDIA RTX 專業(yè)顯卡與消費(fèi)級顯卡使用的是不同的驅(qū)動程序,NVIDIA RTX 專業(yè)顯卡的企業(yè)版驅(qū)動程序對于OpenGL 的優(yōu)化明顯更好,這對于團(tuán)隊(duì)來說也是必須要考量的因素之一,如果團(tuán)隊(duì)會需要執(zhí)行到復(fù)雜的 3D 模型和高精度 3D 場景的任務(wù)、VR/AR 沉浸式體驗(yàn)場景,對效率與穩(wěn)定性要求高的情況下,專業(yè)顯卡能夠承擔(dān)的任務(wù)顯然會更多。
顯卡選型渲染測試:
有條件的情況下,我們盡量在購買前提前跑一跑項(xiàng)目測試,以匹配項(xiàng)目中可能遇到的一些特殊的需求。之前我們測試了市場上較為常用的 NVIDIA RTX 專業(yè)顯卡在一些中大型場景方面的跑分、渲染表現(xiàn),并且將 Ada 架構(gòu)與Ampere 架構(gòu)相應(yīng)的顯卡作為對比,測試結(jié)果給大家做個參考:
適配于復(fù)雜場景的顯卡對比:
顯卡型號和參數(shù):
*顯卡圖片來源于 NVIDIA
NVIDIA RTX A6000 顯卡作為 NVIDIA RTX 系列 Ampere 架構(gòu)中的“卡皇”,被大家所熟知。目前該型號已停產(chǎn)。過往的測試結(jié)果了解到,NVIDIA RTX 5000 Ada 基于 Ada 架構(gòu)的優(yōu)勢,圖形性能與 AI 性能都超過了 NVIDIA RTX A6000。
測試數(shù)據(jù)-跑分對比:
測試數(shù)據(jù)-渲染能力對比:
適配于中型場景的顯卡對比:
顯卡型號和參數(shù):
*顯卡圖片來源于 NVIDIA
20GB 顯存可以滿足日常中型場景的要求,同時我們測試得出,NVIDIA RTX 4000 Ada 相比 NVIDIA RTX A4500 顯卡,性能上有所提升,同時單插槽卡的優(yōu)勢也非常大,對于我們后期機(jī)器的擴(kuò)容很有幫助,性價比更高。
測試數(shù)據(jù)-跑分對比:
測試數(shù)據(jù)-渲染能力對比:
2、AI 類任務(wù)
任務(wù)通常涉及使用 AIGC 工具輔助生成角色、道具、場景等,同時訓(xùn)練自有模型和開發(fā)數(shù)字人等交互式體驗(yàn),團(tuán)隊(duì)通常傾向于本地化部署模式,模型訓(xùn)練是算力性能要求較高的部分。
AI 任務(wù)測試參考:
擴(kuò)散模型訓(xùn)練與推理:對于 AIGC 生成任務(wù),多數(shù)團(tuán)隊(duì)采用 ComfyUI 來搭建工作流。我們以 Flux 模型訓(xùn)練為例,F(xiàn)lux.1 dev 的 Lora 訓(xùn)練中, 512*512 分辨率,bs為6時,學(xué)習(xí)率0.00005,步數(shù)為3000時,顯存已經(jīng)占用至29-30GB。而在FP16訓(xùn)練中,相同的參數(shù)下,顯存占用約35-38GB。模型推理需要的 GPU 顯存建議以 16GB 起步,否則隨著模型的迭代發(fā)展和 AIGC 需求的增長,可能無法支撐未來較大規(guī)模的任務(wù)。
數(shù)字人開發(fā):數(shù)字人交互體驗(yàn)類所涉及的工具鏈更為復(fù)雜。接入大語言模型做簡單問答是普遍需求,以接入DeepSeek 為例,簡單對話場景的推理可選擇7B、14B模型,建議顯存 30GB 及以上;32B 模型推理則需要約 96GB顯存來保證推理效率。如果涉及3D數(shù)字人制作,我們以使用過的 NVIDIA Omniverse Audio2Face 為例,在保證數(shù)字人運(yùn)行流暢的情況下,需要 24GB 顯存以上的顯卡,才能達(dá)到 FPS 在30幀以上。
顯卡選型攻略:
就單卡來說,更高的顯存意味著可以承載更大規(guī)模的模型,對于 AIGC 任務(wù)來說,在生成速度、分辨率、反應(yīng)速度、生成質(zhì)量上的優(yōu)勢更加明顯。此外,Tensor Core、單精度浮點(diǎn)運(yùn)算性能也可以作為我們綜合考量顯卡 AI 能力的指標(biāo)。
在單卡無法承載任務(wù)、或者需要多卡來加速任務(wù)的時候,我們需要插入多卡進(jìn)行計(jì)算, 這時候卡間通信和功耗問題是不能忽視的。AI 工作站搭載 NVIDIA RTX 專業(yè)顯卡的方案具備P2P能力,通信效率會更高,并且專業(yè)顯卡功耗更低,能適配更多的機(jī)型。
綜合我們之前的測試情況,AI 類任務(wù)建議選擇的專業(yè)顯卡型號如下:
建議根據(jù)單卡能力、多卡運(yùn)行能力、成本和效率、擴(kuò)展性來綜合評估最終的方案。并在購置之前,盡量提前能夠做些測試。
3、總結(jié)建議
開發(fā)任務(wù)的規(guī)模如果涉及到高精度、大規(guī)模AI訓(xùn)練推理的需求,可以通過選擇購置“多面手” 顯卡,譬如 NVIDIA RTX 5000 Ada 來做支撐,用武之地更多,性價比就更高。
而對于中小型的開發(fā)項(xiàng)目,所涉及的精度和 AI 需求都不高,推薦前期采用 NVIDIA RTX 4000 Ada 這種單插槽顯卡,成本可控,穩(wěn)定性高,既能滿足日常的開發(fā)需求,又容易在后期做擴(kuò)展。
篇幅有限,上述測試數(shù)據(jù)具體內(nèi)容及更多咨詢規(guī)劃類問題,均可點(diǎn)擊下方鏈接獲取。
顯卡測試申請及方案咨詢
https://rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQb
*與NVIDIA產(chǎn)品相關(guān)的圖片或視頻(完整或部分)的版權(quán)均歸NVIDIA Corporation所有。
技術(shù)支持
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )