華為攜手科大訊飛:國(guó)產(chǎn)算力突破瓶頸,專家并行集群推理引領(lǐng)未來智能浪潮
隨著科技的飛速發(fā)展,人工智能(AI)已成為推動(dòng)全球產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力。華為與科大訊飛研究院的聯(lián)合突破,無疑在國(guó)產(chǎn)算力領(lǐng)域樹立了一座新的里程碑。這一聯(lián)合團(tuán)隊(duì)在MoE模型的大規(guī)??绻?jié)點(diǎn)專家并行集群推理方面取得了重大進(jìn)展,為未來智能浪潮引領(lǐng)了新的方向。
首先,聯(lián)合團(tuán)隊(duì)通過軟硬件的深度協(xié)同創(chuàng)新,挖掘了硬件的潛力。在算子融合方面,他們通過異構(gòu)計(jì)算單元并行流水,將多個(gè)小算子融合重構(gòu)為原子級(jí)計(jì)算單元,消除了小算子下發(fā)的開銷。這一創(chuàng)新性的舉措,使得在昇騰集群上的驗(yàn)證和部署得以完成,并實(shí)現(xiàn)了性能的顯著提升。
在混合并行策略和通信計(jì)算并行優(yōu)化方面,團(tuán)隊(duì)構(gòu)建了TP(張量并行)+EP(專家并行)混合范式。他們創(chuàng)新地采用機(jī)內(nèi)TP并行,發(fā)揮機(jī)內(nèi)高速互聯(lián)優(yōu)勢(shì),降低跨機(jī)通信損耗;同時(shí),他們還創(chuàng)新MoE專家分層調(diào)度,64卡均衡分配專家計(jì)算節(jié)點(diǎn),定制AllToAll通信協(xié)議,專家數(shù)據(jù)交換效率提升40%。這一創(chuàng)新性的分層優(yōu)化策略,進(jìn)一步降低了跨機(jī)和機(jī)內(nèi)流量,提升了整體集群的吞吐能力。
此外,團(tuán)隊(duì)還研發(fā)了路由專家負(fù)載均衡算法,實(shí)現(xiàn)了卡間負(fù)載差異小于10%,進(jìn)一步提升了集群的整體性能。分布式架構(gòu)的創(chuàng)新與算法協(xié)同優(yōu)化,使得他們?cè)趪?guó)產(chǎn)算力上實(shí)現(xiàn)了顯著的性能提升。單卡靜態(tài)內(nèi)存占用縮減至雙機(jī)部署的1/4,效率提升75%,專家計(jì)算密度增加4倍,推理吞吐提升3.2倍,端到端時(shí)延降低50%。這些顯著成果的實(shí)現(xiàn),無疑為國(guó)產(chǎn)算力的發(fā)展開辟了新的道路。
值得一提的是,科大訊飛深度推理大模型星火X1也完成了升級(jí)。在模型參數(shù)量比業(yè)界同行少一個(gè)數(shù)量級(jí)的情況下,星火X1的數(shù)學(xué)能力全面對(duì)標(biāo)DeepSeek R1和OpenAI o1,在中文數(shù)學(xué)各項(xiàng)任務(wù)中“均實(shí)現(xiàn)領(lǐng)先”。這無疑證明了星火X1在深度推理模型方面的強(qiáng)大實(shí)力。
華為與科大訊飛的聯(lián)合突破,不僅在技術(shù)層面取得了重大進(jìn)展,更是在未來智能浪潮中引領(lǐng)了新的方向。專家并行集群推理的應(yīng)用前景廣闊,預(yù)期訓(xùn)練時(shí)推理效率將提升200%?;谠摲桨傅耐评硪嬉矊?shí)現(xiàn)了DeepSeek V3和R1的高效推理,無疑將為人工智能的發(fā)展注入新的活力。
總的來說,華為與科大訊飛的聯(lián)合突破,打破了國(guó)產(chǎn)算力的瓶頸,引領(lǐng)了專家并行集群推理的新潮流。這一創(chuàng)新的解決方案也將應(yīng)用于訊飛星火深度推理模型的訓(xùn)練加速,無疑將為未來的智能浪潮注入新的動(dòng)力。未來,我們有理由期待更多的科技創(chuàng)新和突破,推動(dòng)人工智能的進(jìn)一步發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )