作者:Arm物聯(lián)網(wǎng)事部業(yè)務(wù)拓展副總裁 馬健
當(dāng)下,我們正處在激動(dòng)人心的人工智能(AI)技術(shù)變革初期階段。隨著自然語(yǔ)言、多模態(tài)大模型以及生成式AI技術(shù)的加速演進(jìn),AI正以前所未有的速度重塑各行各業(yè)。根據(jù)IDC的預(yù)測(cè),全球數(shù)據(jù)量將從2024年的159.2ZB增長(zhǎng)到2028年的超過(guò)384.6ZB,年復(fù)合增長(zhǎng)率達(dá)24.4%。其中,到2028年,預(yù)計(jì)37%的數(shù)據(jù)將會(huì)在云端直接產(chǎn)生,而其余數(shù)據(jù)會(huì)從邊緣端和終端直接產(chǎn)生。
面對(duì)邊緣數(shù)據(jù)的激增,高效的數(shù)據(jù)處理、低延遲傳輸以及智能、安全的存儲(chǔ)正成為行業(yè)關(guān)注的重點(diǎn)。未來(lái)的計(jì)算架構(gòu)不僅要提供更強(qiáng)的算力,還必須更緊密地與存儲(chǔ)系統(tǒng)結(jié)合,以確保AI模型能夠高效運(yùn)行,同時(shí)優(yōu)化數(shù)據(jù)管理和訪問(wèn)方式。
從目前的AI技術(shù)發(fā)展方向來(lái)看,一方面,大模型正向通用人工智能(AGI)演進(jìn),探索多模態(tài)、物理AI等新方向,并持續(xù)挑戰(zhàn)算力的新極限。另一方面,為推進(jìn)大模型全面部署的進(jìn)程,行業(yè)開(kāi)始邁向深度優(yōu)化和垂直領(lǐng)域定制化,使大模型能走入千行百業(yè),適應(yīng)移動(dòng)端、邊緣計(jì)算、云端部署等不同場(chǎng)景。
DeepSeek的推出對(duì)全球AI市場(chǎng)產(chǎn)生了深遠(yuǎn)影響:作為一種開(kāi)放的創(chuàng)新技術(shù),它不僅展示了AI在訓(xùn)練與推理過(guò)程中的優(yōu)化潛力,還極大提高了大規(guī)模部署的效率,充分證明了模型能夠在更低成本、更高效能的環(huán)境中穩(wěn)定運(yùn)行。這一成就對(duì)于推動(dòng)AI在企業(yè)級(jí)應(yīng)用和邊緣計(jì)算領(lǐng)域的大規(guī)模應(yīng)用具有重要意義。
Arm計(jì)算平臺(tái):持續(xù)促進(jìn)從云到端的AI優(yōu)化部署
在AI發(fā)展的初期階段,數(shù)據(jù)中心作為模型訓(xùn)練和初期推理的核心場(chǎng)所,正面臨著前所未有的挑戰(zhàn)。傳統(tǒng)的標(biāo)準(zhǔn)通用芯片在處理計(jì)算密集型的AI工作負(fù)載時(shí)顯得力不從心,無(wú)法滿足AI時(shí)代對(duì)于高性能、低功耗以及靈活擴(kuò)展性的迫切需求。在此背景下,Arm計(jì)算平臺(tái)憑借其先進(jìn)的技術(shù)優(yōu)勢(shì),為新一代AI云基礎(chǔ)設(shè)施的發(fā)展開(kāi)辟了新的范式。從Arm Neoverse計(jì)算子系統(tǒng)(CSS)、Arm Total Design生態(tài)項(xiàng)目到芯粒系統(tǒng)架構(gòu)(CSA),Arm進(jìn)行了從技術(shù)到生態(tài)的整體化布局,不僅為AI數(shù)據(jù)中心的工作負(fù)載提供了高效、靈活且可擴(kuò)展的解決方案,還幫助合作伙伴專注于產(chǎn)品差異化,為產(chǎn)品上市進(jìn)程提速。
AI推理是AI釋放價(jià)值的關(guān)鍵,它正迅速?gòu)脑贫送卣怪吝吘壎?,覆蓋世界的每一個(gè)角落。在邊緣AI領(lǐng)域,Arm憑借其技術(shù)與生態(tài)的獨(dú)特優(yōu)勢(shì),不斷創(chuàng)新,確保智能物聯(lián)網(wǎng)與消費(fèi)電子生態(tài)系統(tǒng)能在恰當(dāng)?shù)臅r(shí)機(jī)、于最適合的地點(diǎn)執(zhí)行最優(yōu)工作負(fù)載。
為了滿足邊緣AI日益攀升的AI工作負(fù)載需求,Arm近期發(fā)布了以全新Armv9超高能效CPU Cortex-A320以及對(duì)Transformer網(wǎng)絡(luò)具有原生支持的Ethos-U85 AI加速器為核心的邊緣AI計(jì)算平臺(tái)。該平臺(tái)實(shí)現(xiàn)了CPU與AI加速器的深度集成。相比去年以Cortex-M85搭配Ethos-U85的平臺(tái)提升了八倍的機(jī)器學(xué)習(xí)(ML)計(jì)算性能,帶來(lái)了顯著的AI計(jì)算能力突破,可賦能邊緣AI設(shè)備輕松運(yùn)行超過(guò)10億參數(shù)的大模型。
圖:Arm邊緣AI計(jì)算平臺(tái)支持運(yùn)行超10億參數(shù)的端側(cè)AI模型
其中,全新發(fā)布的超高能效Cortex-A320不僅可以為Ethos-U85提供更高的內(nèi)存容量與帶寬,讓大模型在Ethos-U85上的執(zhí)行如虎添翼,還支持更大的可尋址內(nèi)存空間,并能夠更靈活地管理多層次內(nèi)存訪問(wèn)延遲。Cortex-A320與Ethos-U85的組合,是運(yùn)行大模型及應(yīng)對(duì)邊緣AI任務(wù)所帶來(lái)的內(nèi)存容量及帶寬挑戰(zhàn)的理想選擇。
此外,Cortex-A320還充分利用了Armv9增強(qiáng)的AI計(jì)算特性以及包括Secure EL2、指針驗(yàn)證/分支目標(biāo)識(shí)別(PACBTI)以及內(nèi)存標(biāo)記擴(kuò)展(MTE)等在內(nèi)的安全特性。此前,這些特性已經(jīng)在其他市場(chǎng)得到廣泛應(yīng)用,而Arm現(xiàn)在將其引入了物聯(lián)網(wǎng)與邊緣AI計(jì)算領(lǐng)域,在提供出色且靈活A(yù)I性能的同時(shí),實(shí)現(xiàn)對(duì)軟件負(fù)載更好的隔離與軟件內(nèi)存異常的防護(hù),提高整體系統(tǒng)安全性。
AI時(shí)代的存儲(chǔ)發(fā)展:存儲(chǔ)、計(jì)算和安全能力的全面升級(jí)
隨著AI計(jì)算需求的持續(xù)增長(zhǎng),云邊端在對(duì)計(jì)算能力提出更高要求的同時(shí),也對(duì)存儲(chǔ)系統(tǒng)的性能、密度、實(shí)時(shí)性和功耗等方面提出了更嚴(yán)苛的要求。在傳統(tǒng)模式下,計(jì)算架構(gòu)往往將存儲(chǔ)和計(jì)算相對(duì)分離,存儲(chǔ)設(shè)備僅僅承擔(dān)數(shù)據(jù)存放的角色,數(shù)據(jù)需要在存儲(chǔ)與計(jì)算節(jié)點(diǎn)之間頻繁搬移,導(dǎo)致“存儲(chǔ)-計(jì)算”之間的瓶頸。然而在AI時(shí)代,為滿足數(shù)據(jù)實(shí)時(shí)分析、智能管理及高效訪問(wèn)等需求,將存儲(chǔ)置于離計(jì)算單元更近的地方,或讓存儲(chǔ)本身具備計(jì)算能力,變得尤為關(guān)鍵。這樣能夠確保AI任務(wù)在最合適的位置得到高效執(zhí)行。
從云到端的AI計(jì)算,對(duì)存儲(chǔ)吞吐量、延遲、能耗、安全以及諸如Open Channel等提升主機(jī)可管理性(host manageability)的需求都不盡相同。存儲(chǔ)控制器以及運(yùn)行在存儲(chǔ)控制器中Arm CPU上的固件在支持差異化AI存儲(chǔ)需求中起到了極其重要的作用。
圖:Arm豐富的IP平臺(tái)解決方案為AI存儲(chǔ)提供領(lǐng)先的性能及能效
事實(shí)上,作為數(shù)據(jù)存儲(chǔ)與網(wǎng)絡(luò)控制的基石,Arm一直在為全球存儲(chǔ)控制器和設(shè)備提供高性能、低功耗、安全可靠的解決方案,其中包括:
·Arm Cortex-R系列實(shí)時(shí)處理器擁有最快的中斷延時(shí)和實(shí)時(shí)反應(yīng)速度,被廣泛應(yīng)用于諸多存儲(chǔ)設(shè)備;
·Arm Cortex-M系列嵌入式處理器是后端閃存和媒體控制的熱門選擇,并支持自定義指令,客戶可以針對(duì)獨(dú)特NAND介質(zhì)的深度優(yōu)化來(lái)創(chuàng)造差異;
·Arm Cortex-A系列應(yīng)用處理器以高吞吐量流水線設(shè)計(jì)、支持最高處理性能,同時(shí)擁有ML、數(shù)據(jù)處理軟件和豐富操作系統(tǒng)的堅(jiān)實(shí)生態(tài)支持;
·Arm Ethos-U AI加速器支持每秒2048MACs的Transformer原生加速,可以助力存儲(chǔ)控制器本身變得更智能;
·此外,還有為數(shù)據(jù)中心量身定制的Neoverse。我們已開(kāi)始看到CXL(Compute Express Link)方面的創(chuàng)新設(shè)計(jì)采用Arm Coherent Mesh Network (CMN)與Neoverse組合實(shí)現(xiàn)可“組成式”內(nèi)存擴(kuò)展,并融入近存儲(chǔ)計(jì)算的理念,減少數(shù)據(jù)搬運(yùn)。
生態(tài)攜手,構(gòu)建AI計(jì)算與存儲(chǔ)未來(lái)
在專注提供領(lǐng)先的技術(shù)和產(chǎn)品的同時(shí),Arm還致力于和生態(tài)系統(tǒng)合作伙伴攜手共進(jìn),共同推動(dòng)存儲(chǔ)產(chǎn)業(yè)的發(fā)展?;贏rm架構(gòu)的平臺(tái)正被行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)廣泛采用,以優(yōu)化其存儲(chǔ)解決方案。例如,Solidigm公司最新發(fā)布的122TB PCIe SSD Solidigm™ D5-P5336顯著提升了AI數(shù)據(jù)中心的能效、存儲(chǔ)密度和性能,其存儲(chǔ)控制器采用Arm Cortex-R CPU,有效提升了讀寫的實(shí)時(shí)性和延時(shí)確定性;慧榮科技(Silicon Motion)面向AI PC的SM2508主控芯片采用了Arm Cortex-R8與Cortex-M0,在能效和數(shù)據(jù)吞吐上實(shí)現(xiàn)了突破,其SM2264XT-AT是業(yè)界首款車用PCIe Gen4主控芯片,通過(guò)增強(qiáng)的虛擬化來(lái)支持混合關(guān)鍵性工作負(fù)載對(duì)數(shù)據(jù)的訪問(wèn),并可節(jié)省30%的能耗;江波龍基于Arm Cortex-R CPU打造的XP2300、ORCA 4836以及UNCIA 3836固態(tài)硬盤,憑借其大容量與高性能的優(yōu)勢(shì),廣泛應(yīng)用于AI PC、服務(wù)器、云計(jì)算、分布式存儲(chǔ)及邊緣計(jì)算等多個(gè)應(yīng)用場(chǎng)景,滿足AI技術(shù)的本地化部署需求。
此外,在本土存儲(chǔ)市場(chǎng),大普微、聯(lián)蕓科技、憶芯科技、特納飛、得一微電子、英韌科技等領(lǐng)先的存儲(chǔ)企業(yè),也都廣泛采用Arm技術(shù)打造SSD主控芯片與設(shè)備方案。
迄今為止,基于Arm架構(gòu)和平臺(tái)所應(yīng)用的存儲(chǔ)設(shè)備已近200億臺(tái),其中包括云和企業(yè)級(jí)SSD、車載SSD、消費(fèi)級(jí)SSD、硬盤驅(qū)動(dòng)器和嵌入式閃存設(shè)備。目前,由Arm技術(shù)賦能的存儲(chǔ)設(shè)備持續(xù)保持在每日大約300萬(wàn)臺(tái)的出貨量。
憑借前沿的技術(shù)實(shí)力、豐富的生態(tài)布局、深厚的存儲(chǔ)行業(yè)積累,Arm正繼續(xù)引領(lǐng)技術(shù)創(chuàng)新,賦能AI時(shí)代的計(jì)算與存儲(chǔ)發(fā)展。Arm也將繼續(xù)與合作伙伴攜手,通過(guò)安全、高效的Arm計(jì)算平臺(tái),構(gòu)建AI時(shí)代計(jì)算與存儲(chǔ)的新未來(lái)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )