最近,我刷到一張圖,看完腦瓜子嗡嗡的。
它,小小一顆,冷靜內(nèi)斂,卻有力量!
這是一顆被稱為DPU的數(shù)據(jù)處理芯片,數(shù)智時(shí)代的核心芯片之一,速度飚到400Gbps,國(guó)內(nèi)領(lǐng)先,堪稱芯片界的超跑!
最終,還是被“國(guó)家隊(duì)”搞出來了!
這顆芯片的相關(guān)消息,是從剛剛落幕的「2024中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì)上」爆出來的!100%真實(shí)!
我忍不住好奇起來:除了這顆芯片外,以中國(guó)移動(dòng)為代表的“國(guó)家隊(duì)”,這些年在五大核心技術(shù)上(芯片、計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、數(shù)據(jù)庫),有哪些突破?在業(yè)界處于什么水平?
這五大技術(shù)可以看作是IT領(lǐng)域的基石,每一樣拿出來都能“卡脖子”。
于是,我再次回看這屆大會(huì),發(fā)現(xiàn)了不少“線索”。
原來,近幾年,在公眾視線之外,中國(guó)移動(dòng)靠著一股自主創(chuàng)新研發(fā)的狠勁,悶頭把這五座高峰,輪番爬了一遍。
今天我們就來扒一扒,到底有哪些突破?↓
一、芯片的突破
DPU是數(shù)智化時(shí)代的核心芯片之一,必須拿下!
未來數(shù)據(jù)中心的標(biāo)配是【CPU+GPU+DPU】,CPU負(fù)責(zé)通用計(jì)算,GPU負(fù)責(zé)AI加速計(jì)算,DPU則專注于數(shù)據(jù)處理。
DPU如同數(shù)據(jù)中心里的“快遞員”。
不僅跑得飛快(擁有高速數(shù)據(jù)處理能力),還特別擅長(zhǎng)打包(數(shù)據(jù)壓縮)、加密(確保安全)、分類(數(shù)據(jù)篩選)以及高效配送(數(shù)據(jù)傳輸)。
于是,中國(guó)移動(dòng)聯(lián)合產(chǎn)業(yè)鏈共同打造出一款中國(guó)芯:大云磐石DPU。
這款芯片到底啥水平?
帶寬達(dá)到 400Gbps,論性能,算是王炸級(jí)別!
“磐石”不止有DPU,還有服務(wù)器,中國(guó)移動(dòng)一鼓作氣推出了「大云磐石服務(wù)器」,其中就搭載了這顆DPU!
有人說,大云磐石服務(wù)器就像是“海王”,一機(jī)多芯,能搭載四種不同品牌的CPU。
“變芯”麻煩嗎?嘿嘿,相當(dāng)簡(jiǎn)單!
只需通過更換計(jì)算板即可平滑完成平臺(tái)切換,磐石服務(wù)器內(nèi)部構(gòu)件都極為標(biāo)準(zhǔn)化和模塊化,方便國(guó)產(chǎn)化替換、零部件能復(fù)用,成本可控。
最終,多芯異構(gòu)下的磐石服務(wù)器,就成了數(shù)據(jù)中心中最狠的那個(gè)“角兒”了!
扛起各種狠活、大活兒,不在話下!
二、算力架構(gòu)的突破
先看一條炸裂新聞↓
NEWS:
4 月 28 日消息,中國(guó)移動(dòng)宣布全球運(yùn)營(yíng)商最大單體智算中心 ——中國(guó)移動(dòng)智算中心(呼和浩特)目前已投產(chǎn)使用。
該中心入選“2023年度央企十大超級(jí)工程”,支持萬張 AI加速卡互聯(lián)并行訓(xùn)練,部署約 2 萬張 AI 加速卡,AI 芯片國(guó)產(chǎn)化率超 85%,智能算力規(guī)模高達(dá) 6.7EFLOPS。
萬卡集群,如何調(diào)度?如何激發(fā)其最強(qiáng)戰(zhàn)斗力?
移動(dòng)云自研了超大規(guī)模高性能的異構(gòu)計(jì)算架構(gòu)——大云COCA2.0,能夠操控不同處理器(CPU、GPU、NPU),為不同計(jì)算任務(wù)匹配最佳算力資源。
大云COCA2.0是異構(gòu)計(jì)算架構(gòu),包含三大核心模塊(DPU、GPU、HPN),同時(shí)支持多種指令集的CPU(X86、ARM等)。
由此,移動(dòng)云完整的計(jì)算能力體系展現(xiàn)出來:底層是國(guó)產(chǎn)化磐石算網(wǎng)原生硬件,中間是自研的大云COCA異構(gòu)計(jì)算架構(gòu),上層是自主可控的新一代云計(jì)算產(chǎn)品。
底座堅(jiān)如“磐石”,大云COCA軟硬協(xié)同,云產(chǎn)品托起百業(yè)千行。
三、存儲(chǔ)的突破
在存儲(chǔ)這塊兒,移動(dòng)云發(fā)布了大云天權(quán)存儲(chǔ)2.0創(chuàng)新技術(shù)和企業(yè)級(jí)數(shù)據(jù)湖存儲(chǔ)產(chǎn)品。
「大云天權(quán)存儲(chǔ)2.0」包含一系列存儲(chǔ)創(chuàng)新技術(shù),其中,移動(dòng)云存儲(chǔ)團(tuán)隊(duì)自主研發(fā)的新一代全閃存儲(chǔ)引擎,成為構(gòu)建移動(dòng)云先進(jìn)存力的基石。
這塊“基石”,面向多協(xié)議、百萬級(jí)IO、EB級(jí)規(guī)模設(shè)計(jì),統(tǒng)一存儲(chǔ)架構(gòu),全面支撐起移動(dòng)云上各項(xiàng)存儲(chǔ)產(chǎn)品和服務(wù)。
為了飆到極致性能,“天權(quán)2.0”采用了端到端RDMA和全用戶態(tài)技術(shù)棧,消除額外開銷,單路時(shí)延低至150μs,端到端吞吐突破4GB/s。
面對(duì)當(dāng)前AI大模型對(duì)高性能文件存儲(chǔ)的需求,移動(dòng)云依托自研「天權(quán)存儲(chǔ)2.0」的創(chuàng)新能力,讓文件存儲(chǔ)的能力再次飛躍,支持百GB/s帶寬吞吐,大模型訓(xùn)練快照秒級(jí)加載。
同時(shí),通過自研數(shù)據(jù)鏈接(Bucket-link)技術(shù),實(shí)現(xiàn)對(duì)象存儲(chǔ)和文件存儲(chǔ)間的數(shù)據(jù)高效流轉(zhuǎn)。
這種能力不僅提升了大模型訓(xùn)推場(chǎng)景的文件流轉(zhuǎn)效率,對(duì)于數(shù)據(jù)備份、數(shù)據(jù)遷移、跨區(qū)域數(shù)據(jù)共享等場(chǎng)景,也有巨大提升。
移動(dòng)云文件存儲(chǔ)系列在智算實(shí)戰(zhàn)中,海量小文件OPS可達(dá)數(shù)十萬級(jí)。
同時(shí)通過客戶端緩存能力,多輪epoch訓(xùn)練數(shù)據(jù)加載性能提升5倍,成為大模型訓(xùn)練、推理的首選存儲(chǔ)類型。
此外,移動(dòng)云還發(fā)布了企業(yè)級(jí)數(shù)據(jù)湖存儲(chǔ)產(chǎn)品。
該產(chǎn)品基于存算分離架構(gòu),內(nèi)置數(shù)據(jù)加速引擎,通過緩存加速來支持各種計(jì)算任務(wù),提升數(shù)據(jù)湖存儲(chǔ)的性能,從而幫助企業(yè)更高效的進(jìn)行數(shù)據(jù)分析和處理,釋放數(shù)據(jù)價(jià)值。
四、網(wǎng)絡(luò)的突破
中國(guó)移動(dòng)在網(wǎng)絡(luò)領(lǐng)域的突破,主打“算網(wǎng)一體化”,承載“通智邊端”多樣化算力,覆蓋入算、算內(nèi)、算間多場(chǎng)景連接,滿足高可靠、低時(shí)延、大帶寬需求。
首先看全棧信創(chuàng)云網(wǎng)絡(luò)架構(gòu),其核心是移動(dòng)云新一代SDN。
作為整張?jiān)凭W(wǎng)絡(luò)的大腦,實(shí)現(xiàn)了業(yè)務(wù)面、參數(shù)面一體化管控,智算、通算一體化納管,萬卡集群多租戶隔離,公有云、私有云、專屬云、智算云架構(gòu)歸一。
同時(shí),SDN全部組件已完成國(guó)產(chǎn)化適配,支持國(guó)產(chǎn)網(wǎng)絡(luò)芯片可編程,支持開放白盒,保障供應(yīng)鏈安全。
移動(dòng)云構(gòu)建了彈性開放的NFV平臺(tái),支持功能豐富的云原生網(wǎng)元,單實(shí)例百G吞吐,秒級(jí)擴(kuò)縮容。
并且開放標(biāo)準(zhǔn)接口,支持第三方網(wǎng)元接入(FW、WAF等),功能更豐富。
在這其中,為了提高虛擬網(wǎng)絡(luò)轉(zhuǎn)發(fā)性能,基于磐石服務(wù)器+磐石DPU,移動(dòng)云研發(fā)了遵循COCA架構(gòu)高性能網(wǎng)關(guān)(vRouter),單設(shè)備吞吐>600Gbps,芯片轉(zhuǎn)發(fā)時(shí)延<3μs。
面向智算集群對(duì)高性能、低延遲網(wǎng)絡(luò)的需求,移動(dòng)云推出了磐石智算交換機(jī),這是運(yùn)營(yíng)商領(lǐng)域首款51.2T高性能交換機(jī),支持大規(guī)模萬卡集群組網(wǎng)。
不僅如此,為進(jìn)一步優(yōu)化智算網(wǎng)絡(luò)、降低GPU空載等待時(shí)間,移動(dòng)云還研發(fā)了端網(wǎng)一體全自適應(yīng)路由協(xié)議,并主導(dǎo)IETF國(guó)際標(biāo)準(zhǔn)協(xié)議FARE(即全自適應(yīng)路由以太網(wǎng))。
交換機(jī)側(cè)和智能網(wǎng)卡側(cè)協(xié)同,采用“包噴灑”技術(shù)+亂序重排,實(shí)現(xiàn)逐包(per-packet)全局負(fù)載均衡,全面提升鏈路利用率。
最后,面向算網(wǎng)融合、多云協(xié)同場(chǎng)景,移動(dòng)云又拿出了業(yè)界首個(gè)異構(gòu)多算力互聯(lián)產(chǎn)品,為用戶提供靈活入算、算力互聯(lián)、按需彈性、差異化的網(wǎng)絡(luò)服務(wù)。
五、數(shù)據(jù)庫的突破
移動(dòng)云自研了新一代云原生數(shù)據(jù)庫,包含三種產(chǎn)品形態(tài):集中式、分布式、分析型。
集中式云原生數(shù)據(jù)庫,好比“中央金庫”,采用四元解耦架構(gòu),突破單機(jī)瓶頸,支持存算一體和存算分離雙形態(tài)。
分布式云原生數(shù)據(jù)庫,就像各地“分行”,實(shí)現(xiàn)應(yīng)用無限擴(kuò)展,全局事務(wù)強(qiáng)一致,金融級(jí)保障客戶服務(wù)在線。
而分析型云原生數(shù)據(jù)庫,像給客戶請(qǐng)了個(gè)“精算師”。支持?jǐn)?shù)據(jù)實(shí)時(shí)分析,使用0-ETL一鍵入倉,打造企業(yè)級(jí)數(shù)倉。
一圈扒下來,越扒越驚喜。
沒想到,中國(guó)移動(dòng)悄悄地爬過了一山又一山,五座高峰全部登頂!
登頂之后的中國(guó)移動(dòng),毫不懈怠,繼續(xù)堅(jiān)持自主創(chuàng)新的發(fā)展戰(zhàn)略,為各行各業(yè)的數(shù)字化轉(zhuǎn)型提供強(qiáng)有力的技術(shù)支撐。
寫這篇文章時(shí)恰值517世界電信日,而今年電信日的主題為“數(shù)字創(chuàng)新促進(jìn)可持續(xù)發(fā)展”。
這就好像是為中國(guó)移動(dòng)量身定制的攀登背書,技術(shù)創(chuàng)新,自研為王,攻堅(jiān)克難,志在巔峰…
突然間,畫面感很強(qiáng)!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )