8月12日消息,2024開放計算中國峰會上,開放算力模組(OCM)規(guī)范正式啟動立項,首批成員包括中國電子技術(shù)標準化研究院、浪潮信息、Intel、AMD、百度、小紅書、聯(lián)想、超聚變等,旨在打造國內(nèi)首個服務(wù)器計算模組設(shè)計規(guī)范,構(gòu)建CPU統(tǒng)一算力底座。
開放計算模組規(guī)范(OCM) 規(guī)范的正式啟動,旨在建立基于處理器的標準化算力模組單元,通過統(tǒng)一不同處理器算力單元對外高速互連、管理協(xié)議、供電接口等,實現(xiàn)不同架構(gòu)處理器芯片兼容,構(gòu)建CPU的統(tǒng)一的算力底座,以解決CPU生態(tài)挑戰(zhàn)問題,方便客戶根據(jù)人工智能、云計算、大數(shù)據(jù)等多樣化應(yīng)用場景,靈活、快速匹配最適合的算力平臺,推動算力產(chǎn)業(yè)高質(zhì)量快速發(fā)展。
為何要構(gòu)建“OCM”規(guī)范?
在談及“OCM”規(guī)范發(fā)起的初衷時,浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥表示,現(xiàn)在,無論是手機、電腦、邊緣設(shè)備、CPU服務(wù)器、加速服務(wù)器都具有了AI計算的能力,也都在承載著多樣化的AI應(yīng)用。AI算力已經(jīng)深入到千行百業(yè),滲透進每一個計算設(shè)備里,面向人工智能的算力范式不斷革新。通用算力也要具有AI計算的能力,可以說“未來一切計算皆AI”。
在智算時代背景下,CPU算力單元應(yīng)用越來越豐富,除了大數(shù)據(jù)、關(guān)鍵計算、科學計算外,也要承擔AI應(yīng)用的重要任務(wù),這是CPU算力單元的重大機遇。
與此同時,隨著應(yīng)用范式的多樣化,CPU呈現(xiàn)了多元化發(fā)展方向。目前x86、ARM、RISC-V等不同架構(gòu)的CPU處理器百花齊放,僅在中國,目前就有10多種CPU處理器,不同CPU協(xié)議標準不統(tǒng)一,系統(tǒng)功耗、總線速率、電流密度不斷提升,導(dǎo)致硬件開發(fā)、固件適配、部件測試資源等時間激增,給算力系統(tǒng)設(shè)計帶來巨大挑戰(zhàn)。
趙帥強調(diào):“需要構(gòu)建一個CPU的統(tǒng)一算力底座,解決CPU計算的效率問題?!?/p>
“OCM”規(guī)范的思路就是把原來一個緊耦合式的服務(wù)器架構(gòu)拆散,以CPU和內(nèi)存作為最小的算力單元,標準化高速和低速的互連接口。這樣,未來不同的算力平臺,只更換計算的模組,就可以實現(xiàn)從芯片到算力快速的落地應(yīng)用。
通過這種標準化的算力模組,讓算力可以快速抵達用戶,讓用戶可以快速地利用最先進的算力。
“OCM”規(guī)范的價值和意義
浪潮信息服務(wù)器產(chǎn)品部產(chǎn)品規(guī)劃經(jīng)理羅劍認為,隨著OCM規(guī)范的啟動,對算力上游廠商、終端用戶、系統(tǒng)集成商都大有裨益。
對于上游廠商來說,這個規(guī)范可以讓他們在做處理器的同時,把這個算力模塊做出來,新的平臺可以快速地在系統(tǒng)上面去做集成。
對于終端用戶來說,這種標準化可以實現(xiàn)對多元算力的統(tǒng)一管理、統(tǒng)一運維,管理復(fù)雜性極大降低了。
對于系統(tǒng)集成商來說,算力標準化后,就可以在不同的系統(tǒng)里應(yīng)用統(tǒng)一的算力模塊,類似于硬盤一樣,一個系統(tǒng)里面可以支持多家的硬盤,一樣的道理,未來一個系統(tǒng)里面就可以支持多元算力平臺。
事實上,這不是浪潮信息首次參與發(fā)起相關(guān)行業(yè)規(guī)范。此前,浪潮信息就參與和支持了針對超大規(guī)模深度學習訓(xùn)練的AI加速卡的“開放加速規(guī)范OAM”。
“OAM”構(gòu)建了一個統(tǒng)一的加速芯片底座,解決了單個服務(wù)器內(nèi)多元AI加速卡形態(tài)和接口不統(tǒng)一,高速互連效率低,研發(fā)周期長等問題,促進了加速算力單元接口的統(tǒng)一和生態(tài)的完善。
目前開放計算規(guī)范OAM已成為全球最多高端AI加速芯片遵循的統(tǒng)一設(shè)計標準,全球20多家芯片企業(yè)支持開放加速規(guī)范,為AI芯片企業(yè)節(jié)省研發(fā)時間6個月以上,為整體產(chǎn)業(yè)研發(fā)投入節(jié)省數(shù)十億元,極大地降低了AI算力產(chǎn)業(yè)創(chuàng)新的難度,加速高質(zhì)量AI算力普惠發(fā)展。
浪潮信息最新一代基于OAM規(guī)范的AI服務(wù)器NF5698G7支持多種基于OAM規(guī)范的開放加速芯片,并為用戶構(gòu)建了一個千卡液冷集群,支持超千億參數(shù)量的AI大模型訓(xùn)練。
目前,OAM規(guī)范還在持續(xù)迭代,未來基于OAM2.0規(guī)范的AI加速卡將支持1024張加速卡的卡間互聯(lián),突破大模型互聯(lián)瓶頸。
談到剛剛啟動的OCM規(guī)范,趙帥表示:“開放計算對于智算時代有非常重要的意義和價值,要用開放應(yīng)對多元算力的挑戰(zhàn)。OCM是國內(nèi)首個服務(wù)器模組設(shè)計規(guī)范,希望更多的行業(yè)伙伴以及更多的用戶參與進來,真正讓多元的統(tǒng)一算力模組盡快地走進每一個用戶的機房當中?!?br>
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )