性能領先、開源普惠、國產(chǎn)易獲取的三重勢能,造就了年初DeepSeek的技術平權狂熱,掀起AI普惠浪潮。
然而,當很多人想在端側部署DeepSeek模型時,卻遭遇了挑戰(zhàn):部署滿血版大模型需數(shù)萬元硬件投入,退而求其次選擇蒸餾版14B版本,又會出現(xiàn)性能斷崖式下跌與響應延遲。
就在AI用戶陷入“高成本部署”與“低質量妥協(xié)”的兩難困境時,端側AI的破局時刻,悄悄被360打開了。
近期,360智腦團隊發(fā)布了最強14B推理模型:Light-R1-14B-DS,是業(yè)界首次在14B模型上復現(xiàn)強化學習效果。數(shù)學能力上,表現(xiàn)超過
DeepSeek-R1-Distill-Llama-70B和DeepSeek-R1-Distill-Qwen-32B。
盡管只訓練了MATH數(shù)據(jù),但在GPQA科學常識評測中,7B/14B雙版本均超越對標產(chǎn)品,展現(xiàn)出“小參數(shù)大智慧”的泛化能力。
此外,配合360的全面開源策略(模型/數(shù)據(jù)/代碼/技術報告全開放),這場端側AI平權運動,意味著14B模型能在手機端流暢運行,意味著企業(yè)無需天價算力即可部署專業(yè)級AI。
AI端側民主化的風暴眼,正在醞釀之中。
我們第一時間研讀了360放出的技術報告,發(fā)現(xiàn)端側AI的技術拐點已經(jīng)出現(xiàn)。360開源的Light-R1-14B-DS創(chuàng)造了三項行業(yè)紀錄:
一是能力復現(xiàn)。Light-R1-14B-DS首次在數(shù)學能力上,用14B 模型復現(xiàn)了強化學習效果,通過多階段課程學習SFT和強化學習,Light-R1-14B-DS的表現(xiàn)超過
DeepSeek-R1-Distill-Llama-70B和DeepSeek-R1-Distill-Qwen-32B,是目前最優(yōu)的14B模型,這驗證了RL強化學習策略的有效性,RL對端側模型訓練的收益很大,仍有進一步挖掘潛力。
(Light-R1 訓練流程)
二是效率革命。Light-R1-14B-DS 經(jīng)過長思維鏈強化學習后訓練,在AIME 24和25上分別取得了74.0和60.2的成績,數(shù)學部分表現(xiàn)超越DeepSeek的70B(72.6分)和32B(54.9分)蒸餾模型,取得了非常顯著的提升,這標志著推理能耗進一步降低。另一版本的Light-R1-7B-DS,無需量化即可端側部署。此次探索,在低成本復現(xiàn) DeepSeek-R1方面邁出了重要一步。
三是泛化能力增強。Light-R1-14B-DS在科學常識評測GPQA上漲,打破了模型“災難性遺忘”的魔咒,具有較好的泛化性,開辟模型優(yōu)化新路徑。
最強14B端側推理模型,撕開了DeepSeek 70B的性能封鎖線,端側AI迎來了規(guī)?;占暗墓拯c。不過,在AI與大眾之間,還差一個開源。
如果僅有技術突破,但沒有開源機制,那么端側推理模型再好,也無法被大眾輕松獲得、低成本用起來。
此次,360采取了全棧式的開源策略——模型權重、22萬條數(shù)學數(shù)據(jù)集、RL訓練代碼、技術報告等,都悉數(shù)公開。這種開源深度,遠遠超過了常規(guī)模型權重開放。
也就是說,中小團隊僅需極少算力,就能從數(shù)據(jù)清洗到強化學習全鏈路復現(xiàn),完成端側AI的后訓練與部署。
端側AI的民主化,高度依賴于科技企業(yè)的開源策略,為什么說360此次開放端側推理模型很重要?
對企業(yè)來說,傳統(tǒng)端側AI部署,會面臨閉源模型高昂的授權費用(如OpenAI API調(diào)用成本)與硬件適配的邊際成本(需定制化芯片或服務器),成本難以承受。此前openai也發(fā)布過蒸餾版o1-mini,但高昂的訂閱費依然讓大量開發(fā)者望而卻步。此外,閉源模型存在不可解釋性風險,醫(yī)療、法律等行業(yè)因合規(guī)要求無法接受“輸入-輸出”不透明的AI決策。因此,Light-R1-14B-DS這樣低成本、全開源的國產(chǎn)端側推理模型,有望打消企業(yè)對AI的顧慮,輕松邁入智能化。
對個人來講,云端模型需要上傳數(shù)據(jù),這會引發(fā)隱私泄露的顧慮。而在端側離線運行大模型,又對算力/內(nèi)存有更高的要求,傳統(tǒng)端側AI需要旗艦級設備,買不起旗艦機,就用不到好AI,這形成了一種AI時代的“設備歧視”。
360開源最強14B端側模型,讓端側AI能力不再是少數(shù)機型的特權,也可以下沉到普惠機型上,為大眾所用。而用戶規(guī)模的擴大,也會推動AI應用及大模型產(chǎn)品的增長。
由此看到,360開源策略所帶來的技術民主化,可以激活AI的長尾需求,加速AI普惠的到來。
終端設備,是用好AI的載體。推理模型下沉到端側,應用空間也十分廣闊,打開了端側AI的無限想象空間。
預測一下,目前這兩個最強端側14B/7B推理模型,可能會首先落地在商業(yè)價值高的場景,然后一步步滲透進各行業(yè)。
首當其沖的,就是消費電子領域。智能手機、手表、平板、PC、眼鏡等終端設備,近兩年都在加速AI化。
但此前AI化有兩種方案:一是純端側,保證本地隱私安全,但內(nèi)存要求高,功耗大;另一種是端云結合,部分任務上云處理。Light-R1-7B-DS無需量化即可部署于終端設備(如手機、IoT設備),標志著消費級硬件也能運行復雜AI任務。對比傳統(tǒng)需要32B以上參數(shù)的端側模型,其7B規(guī)模大幅降低內(nèi)存占用和能耗。為AI終端帶來了更大的創(chuàng)新空間,比如在手機本地運行復雜數(shù)學輔導、法律文書解析等任務,解決隱私和延遲痛點。
360的技術突破與全棧開源,可以為消費電子領域的AI探索帶來非常有益的借鑒。
下一個就是重點行業(yè)、垂直領域。金融、政務、醫(yī)療、法律等數(shù)字化基礎較好的行業(yè),積極擁抱AI,又希望在本地化運行專業(yè)級AI,避免敏感數(shù)據(jù)上傳云端,這就需要專有模型+后訓練,最強端側14B/7B推理模型可以大幅降低端側專有模型的訓練、推理等硬件門檻,加速行業(yè)智能化探索。
更進一步,傳統(tǒng)行業(yè)壁壘也將被端側普惠AI撕開。比如智慧城市治理,通過部署端側AI的邊緣智能計算,可以極大減少智能化的建設和升級運維成本;農(nóng)業(yè)智能化,搭載14B模型的農(nóng)業(yè)無人機,路線自動避障、精準識別地面等能力,都會隨著推理能力的增強而大幅提升。
通過端側AI的普惠路線圖,來進行推演,不難看到,360的技術突破與開源策略,一定會吸引大量行業(yè)開發(fā)者或個人開發(fā)者前來試用,與豐富的場景相結合,催生大量智能化的長尾應用。
也就是說,通過開源輕量級推理模型,360有望規(guī)避AI六小強在千億參數(shù)級的競爭?;陂_源開放的技術公信力,構建開發(fā)者生態(tài)護城河。從這個角度看,360掀起的端側AI颶風,也將卷出一個大模型競爭的新格局。
端側推理模型的平權時刻已到,萬億級邊緣智能市場正蓄勢待發(fā)、乘風遠航。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。
- vivo Y300 Pro+發(fā)布:第三代驍龍7s+7300mAh藍海電池,售價1799元起
- vivo Y300 Pro+發(fā)布 ,續(xù)航滅霸 +倍強大,好用實用耐用的國民手機
- 國內(nèi)默默無聞,海外狂賣1億臺,傳音豪擲6.57億建全球總部
- 銷量持續(xù)下滑、高管相繼出走!榮耀手機怎么了?
- 國產(chǎn)芯片崛起,份額達兩位數(shù),與高通和聯(lián)發(fā)科三足鼎立
- 卷瘋了?高壓鍋廠連夜改行,昔日36萬“富豪快樂艙”如今跌至3萬
- 同情三星被印度罰款?三星比中國手機賺得多太多了!
- 三座云服務大山壓頂!百度智能云被困在“石縫”里!
- 電商新勢力(TPD),為什么能穿越周期火了一輪又一輪?
- 谷歌逐漸封閉安卓,想做另一個蘋果,不與中國手機分享利益了
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。