英偉達(dá)A800、H800將被出口管制,國(guó)產(chǎn)GPU能否頂起一片天?

科技云報(bào)道原創(chuàng)。

10月17日晚間消息,美國(guó)商務(wù)部延長(zhǎng)了在2022年10月首次實(shí)行的全面出口管制,將收緊對(duì)尖端人工智能芯片的出口管制。

在新規(guī)下,英偉達(dá)旗下先進(jìn)的GPU、顯卡等將被禁止向中國(guó)市場(chǎng)出售,其中還包含了A800和H800這樣專門為中國(guó)市場(chǎng)定制的芯片。AMD、英特爾等芯片巨頭的高性能芯片也將被限制向中國(guó)出口。

此次美國(guó)出口管制規(guī)則更新后,還擴(kuò)大了芯片制造工具出口限制清單,中國(guó)的兩家國(guó)產(chǎn)GPU制造商——摩爾線程、壁仞科技被列入“實(shí)體清單”。

業(yè)內(nèi)認(rèn)為,此次禁售意味著美方試圖對(duì)我國(guó)算力發(fā)展作進(jìn)一步遏制,同時(shí)也對(duì)模型端發(fā)展有所限制,因此國(guó)產(chǎn)GPU廠商需要加速發(fā)展。

AI時(shí)代漸近,GPU需求的高速增長(zhǎng)幾乎毋庸置疑。在美國(guó)屢次禁售高速GPU的背景下,GPU的國(guó)產(chǎn)化進(jìn)程如何?

英偉達(dá)高性能

GPU供不應(yīng)求

ChatGPT意外掀起的一波AI革命,帶火了AI芯片市場(chǎng)。而英偉達(dá)旗下A100和H100兩款A(yù)I芯片,正是ChatGPT這樣的大語(yǔ)言模型的核心動(dòng)力。

目前在GPU領(lǐng)域,大部分國(guó)內(nèi)企業(yè)仍然只能仰賴英偉達(dá)一家的技術(shù)。由于美國(guó)政府收緊對(duì)華出口管制,以及AI大模型帶來(lái)的龐大算力需求,英偉達(dá)的高性能GPU處理器“一芯難求”。

從去年開始,英偉達(dá)旗下A100、H100、A800、H800等高性能GPU芯片應(yīng)聲漲價(jià),尤其旗艦級(jí)芯片H100,4月中旬在海外電商平臺(tái)就已炒到超4萬(wàn)美元,甚至有賣家標(biāo)價(jià)6.5萬(wàn)美元一片。

同時(shí),英偉達(dá)的中國(guó)特供版A800和H800芯片也遭到了哄搶,整個(gè)市場(chǎng)需大于求,缺貨非常厲害。有業(yè)內(nèi)人士表示,今年這類GPU芯片從原來(lái)的12萬(wàn)人民幣左右,變成了現(xiàn)在是25萬(wàn)甚至30萬(wàn),甚至有高達(dá)50萬(wàn)一片。

即便價(jià)格不斷暴漲,國(guó)內(nèi)大廠也不得不大批量買芯片。

據(jù)媒體報(bào)道稱,百度、字節(jié)跳動(dòng)、騰訊和阿里巴巴向英偉達(dá)下單訂購(gòu)50億美元的芯片。其中,字節(jié)跳動(dòng)今年已向英偉達(dá)訂購(gòu)了超過(guò)10億美元的GPU產(chǎn)品,僅字節(jié)一家公司今年的采購(gòu)量就已經(jīng)接近英偉達(dá)去年在中國(guó)銷售的商用GPU總銷售額。

此次美國(guó)出口管制再次收緊,多家國(guó)內(nèi)廠商表示已提前接到美國(guó)更新出口管制規(guī)定的通知,已提前進(jìn)行囤貨。

據(jù)媒體消息,騰訊、百度等大廠由于“囤貨充足”,受“禁令”影響或有限。也有廠商表示,雖然目前已經(jīng)囤了足夠量,不過(guò)未來(lái)還是有很大壓力。

這種壓力,一方面來(lái)自國(guó)內(nèi)對(duì)于AI算力需求的暴增,另一方面也源于國(guó)產(chǎn)AI芯片的差距。

國(guó)產(chǎn)AI芯片與

英偉達(dá)差距幾何

一個(gè)不可否認(rèn)的事實(shí)是,國(guó)內(nèi)相關(guān)的芯片產(chǎn)品都和英偉達(dá)A100有較大差距。

曾有人坦言,英偉達(dá)與其他芯片廠商的差距,是院士與高中生的差別。就如同黃仁勛所言,英偉達(dá)“一直在奔跑”,想要超越巨人的其它芯片廠商只能奮力狂奔。

據(jù)《電子工程專輯》發(fā)布的《45家國(guó)產(chǎn)AI芯片廠商調(diào)研分析報(bào)告》顯示,在調(diào)研分析了瀚博半導(dǎo)體、燧原科技、平頭哥、華為海思、紫光展銳、寒武紀(jì)、地平線等國(guó)內(nèi)AI芯片廠商后,得出一個(gè)結(jié)論:

“國(guó)產(chǎn)AI芯片公司在高性能和先進(jìn)工藝AI芯片的設(shè)計(jì)方面還面臨諸多挑戰(zhàn),而且在AI芯片價(jià)值鏈的EDA和IP環(huán)節(jié)上還有不小的差距?!?/p>

目前,國(guó)內(nèi)AI芯片廠商格局可大致分為三個(gè)梯隊(duì):

一梯隊(duì),有成熟產(chǎn)品、批量出貨的企業(yè),包括寒武紀(jì)、華為昇騰、百度昆侖芯、燧原科技等;

二梯隊(duì),以AI芯片起家的壁仞科技、天數(shù)智心、摩爾線程、沐曦等;

三梯隊(duì),如海光、景嘉微等。

那么,這些國(guó)產(chǎn)AI芯片和英偉達(dá)芯片相比,處于什么樣的水平?綜合業(yè)界測(cè)評(píng)和實(shí)際部署的情況,以下是部分國(guó)產(chǎn)AI芯片的現(xiàn)狀:

華為昇騰910與英偉達(dá)的差距

2018年,華為推出了昇騰系列(HUAWEI Ascend) 芯片,主要產(chǎn)品有昇騰310與昇騰910。

目前昇騰910是業(yè)界算力最強(qiáng)的AI處理器,芯片基于自研華為達(dá)芬奇架構(gòu)3D Cube技術(shù),實(shí)現(xiàn)業(yè)界極佳AI性能與能效。測(cè)試數(shù)據(jù)顯示,昇騰910算力是英偉達(dá)V100的兩倍,略超 “A100 80GB PCIe”版本。

受到2019年開始的制裁影響,原計(jì)劃在2021年推出用于訓(xùn)練場(chǎng)景的昇騰920研發(fā)進(jìn)度向后延宕,發(fā)展進(jìn)度受到巨大影響。

目前,華為昇騰只能用于華為自身生態(tài)中的大模型業(yè)務(wù),比如昇騰不能做GPT-3,因?yàn)闀N騰910不支持32位浮點(diǎn),而目前大模型訓(xùn)練幾乎都要使用32位的浮點(diǎn),所以華為昇騰芯片只能利用華為開發(fā)的框架(如MindSpore),在加上優(yōu)化好的大模型,比如盤古CV。

由于任何公開模型都必須經(jīng)過(guò)華為的深度優(yōu)化才能在華為的平臺(tái)上運(yùn)行,所以可以理解為華為昇騰只能運(yùn)行自己閉環(huán)的大模型產(chǎn)品。

百度昆侖2代與英偉達(dá)的差距

百度已有兩款產(chǎn)品,都在百度云服務(wù)器上部署:

一是,2018年下半年發(fā)布昆侖芯一代產(chǎn)品,基于三星14nm,可以做訓(xùn)練和推理,因此主要用于推理。

二是,2021年發(fā)布昆侖芯二代產(chǎn)品,搭載GDDR6高性顯存,支持256TOPS(INT8)算力,和V100差距縮小,可以做訓(xùn)練和推理。

第三代昆侖芯產(chǎn)品,預(yù)計(jì)明年上半年發(fā)布。

寒武紀(jì)思元590與英偉達(dá)的差距

寒武紀(jì)主要還是ASIC架構(gòu),劣勢(shì)是通用性會(huì)比較差,優(yōu)勢(shì)是某些特定應(yīng)用場(chǎng)景下,算力可以做到比GPU更高。

百度內(nèi)部的測(cè)試結(jié)果顯示,寒武紀(jì)最好的產(chǎn)品思元590,性能接近A100 90%的性能;思元590基本支持主流的模型,綜合性能接近A100 80%的水平。

目前,百度文心一言在訓(xùn)練端主要使用英偉達(dá)產(chǎn)品V100和A100,在推理端主要使用英偉達(dá)A100和百度昆侖芯2代,小規(guī)模部署了寒武紀(jì)思元590。

但實(shí)際上線中并沒(méi)有使用思元590,主要原因在于其性能指標(biāo)不如A100,而且架構(gòu)不太兼容、難度大。

壁仞科技與英偉達(dá)的差距

壁仞科技去年發(fā)布的產(chǎn)品規(guī)格很高,但主要還是停留在紙面數(shù)據(jù),實(shí)測(cè)數(shù)據(jù)、實(shí)際性能方面業(yè)界和第三方評(píng)測(cè)機(jī)構(gòu)評(píng)價(jià)沒(méi)有那么高,它本身的性能是不及A100的。

在軟件層面也還有很多工作要做,目前它只是做了一個(gè)軟件的雛形,從使用維度來(lái)講離成熟的生態(tài)軟件、規(guī)?;某鲐?、客戶端的個(gè)適配還有很?的路要走。

現(xiàn)在它也面臨著制裁問(wèn)題、實(shí)體清單問(wèn)題,對(duì)于這樣的初創(chuàng)企業(yè)是生存層面的問(wèn)題。

像天數(shù)智芯、摩爾線程、沐曦也都陸續(xù)有產(chǎn)品推出,但技術(shù)能力不及壁仞,只是停留在推理層面,不像第一梯隊(duì)的企業(yè)有更成熟的產(chǎn)品經(jīng)驗(yàn)。

景嘉微JM9與英偉達(dá)的差距

景嘉微最好的JM9系列,可以滿足目標(biāo)識(shí)別等部分人工智能領(lǐng)域的需求,但不能滿足AI計(jì)算、ChatGPT等領(lǐng)域的應(yīng)用需求。大概達(dá)到英偉達(dá)GTX 1050的水平,只能算入門級(jí)GPU。

海光DCU Z100與英偉達(dá)的差距

海光是做X86CPU起家的,GPU的技術(shù)能力還有待市場(chǎng)的認(rèn)可和檢驗(yàn)。

目前,海光訓(xùn)練產(chǎn)品的算力規(guī)模不足以支持做數(shù)據(jù)中心。海光DCU Z100訓(xùn)練算力較小,不到100TFLOPS,只適合一些推理場(chǎng)景,不足以支持大模型的訓(xùn)練,因此沒(méi)有能力去替代英偉達(dá)的產(chǎn)品。

從產(chǎn)品層面來(lái)講,海光離傳統(tǒng)做AI芯片的企業(yè)還是有較大的技術(shù)差距。

總體而言,國(guó)內(nèi)已經(jīng)批量生產(chǎn)的AI芯片,大多都是A100的上一代。目前能運(yùn)行大模型訓(xùn)練的,還是英偉達(dá)的A100、A800、H100、H800效率最高。

這意味著,想要達(dá)到同樣的算力,需要企業(yè)購(gòu)置更多的國(guó)產(chǎn)AI芯片。對(duì)企業(yè)而言,就意味著更多的成本支出。

國(guó)產(chǎn)GPU芯片

自研任重道遠(yuǎn)

需要承認(rèn)的是,國(guó)產(chǎn)AI芯片產(chǎn)品走向高端還有較遠(yuǎn)的距離。

除了技術(shù)上的差距,國(guó)產(chǎn)GPU在生態(tài)建立方面仍不如英偉達(dá)完善,這也使得很多國(guó)內(nèi)廠商不敢輕易改用國(guó)產(chǎn)芯片。

據(jù)一家國(guó)產(chǎn)GPU廠商銷售人員透露,目前國(guó)內(nèi)第一批大模型廠商使用的基本都是英偉達(dá)A100、A800的芯片,因?yàn)橛ミ_(dá)構(gòu)建了完善的CUDA生態(tài)。

“如果你用慣了這個(gè)生態(tài),”該銷售人員說(shuō),“貿(mào)然換一個(gè)生態(tài),意味著你的學(xué)習(xí)成本、試錯(cuò)成本、調(diào)試成本都會(huì)增加,自然沒(méi)人會(huì)想要換了”。

眾所周知,芯片需要適配硬件系統(tǒng)、工具鏈、編譯器等多個(gè)層級(jí),需要很強(qiáng)的適配性,否則會(huì)出現(xiàn)這款芯片在某個(gè)場(chǎng)景能跑出90%的算力,在另一場(chǎng)景只能跑出80%效能的情景。

早在2006年,英偉達(dá)就推出了計(jì)算平臺(tái)CUDA,這是一個(gè)并行計(jì)算軟件引擎,CUDA框架里集成了很多調(diào)用GPU算力所需的代碼,工程師可以直接使用這些代碼,無(wú)須一一編寫。開發(fā)者可使用CUDA更高效地進(jìn)行AI訓(xùn)練和推理,更好的發(fā)揮GPU算力。

時(shí)至今日,CUDA已成為全球AI基礎(chǔ)設(shè)施,主流的AI框架、庫(kù)、工具都以CUDA為基礎(chǔ)進(jìn)行開發(fā)。

雖然英偉達(dá)GPU價(jià)格貴,但實(shí)際用起來(lái)反而是最便宜的。這對(duì)有意抓住大模型機(jī)會(huì)的企業(yè)來(lái)說(shuō),錢往往不是問(wèn)題,時(shí)間才是更寶貴的資源,大家都必須盡快獲得足夠多的先進(jìn)算力來(lái)確保先發(fā)優(yōu)勢(shì)。

因此,對(duì)于國(guó)產(chǎn)芯片供應(yīng)商來(lái)講,哪怕能通過(guò)堆芯片的方式能堆出一個(gè)算力相當(dāng)?shù)漠a(chǎn)品,但軟件適配與兼容讓客戶接受更難。

此外,從服務(wù)器運(yùn)營(yíng)的角度,它的主板開銷、電費(fèi)、運(yùn)營(yíng)費(fèi),以及需要考慮的功耗、散熱等問(wèn)題,都會(huì)大大增加數(shù)據(jù)中心的運(yùn)營(yíng)成本。

由此可見(jiàn),國(guó)產(chǎn)GPU在與英偉達(dá)的競(jìng)爭(zhēng)中阻力重重,想實(shí)現(xiàn)突圍并不容易。

但值得注意的是,此次美國(guó)限制出口政策的收緊,又一次為國(guó)內(nèi)廠商敲響了警鐘。

盡管國(guó)產(chǎn)芯片在性能和軟件生態(tài)上比不過(guò)英偉達(dá)、AMD等行業(yè)巨頭,但在復(fù)雜的國(guó)際貿(mào)易關(guān)系及地緣政治因素等驅(qū)動(dòng)下,“國(guó)產(chǎn)替代”成為國(guó)內(nèi)半導(dǎo)體行業(yè)發(fā)展的主旋律。

從安全性以及自主可控的角度來(lái)說(shuō),這也為國(guó)內(nèi)AI芯片企業(yè)提供了新的機(jī)遇窗口。

一位業(yè)內(nèi)人士分析稱,在當(dāng)前“缺芯”的形勢(shì)下,國(guó)內(nèi)大模型廠商可以在不是特別商業(yè)化的場(chǎng)景多給國(guó)產(chǎn)芯片機(jī)會(huì),支持國(guó)產(chǎn)芯片廠商技術(shù)迭代,共同營(yíng)造生態(tài),共同成長(zhǎng)。

不僅如此,目前全國(guó)各地的智能算力中心建設(shè)穩(wěn)步推進(jìn),AI芯片的需求快速增長(zhǎng),國(guó)產(chǎn)化替代的需求也隨之提升。

中國(guó)巨大的AI市場(chǎng)體量和快速迭代的發(fā)展進(jìn)程,為眾多國(guó)產(chǎn)AI芯片廠商提供了豐富的試驗(yàn)基地和應(yīng)用設(shè)計(jì)機(jī)會(huì)。接下來(lái)的3-5年,將是國(guó)產(chǎn)AI芯片廠商加速AI應(yīng)用落地和大規(guī)模部署的快速發(fā)展時(shí)期。

“AI算力國(guó)產(chǎn)化”的市場(chǎng)大門,或許正在打開。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-10-23
英偉達(dá)A800、H800將被出口管制,國(guó)產(chǎn)GPU能否頂起一片天?
科技云報(bào)道原創(chuàng)。10月17日晚間消息,美國(guó)商務(wù)部延長(zhǎng)了在2022年10月首次實(shí)行的全面出口管制,將收緊對(duì)尖端人工智能芯片的出口管制。在新規(guī)下...

長(zhǎng)按掃碼 閱讀全文