過年期間沉迷休息,心懷愧疚地無視了讀者催我們寫DeepSeek的要求。后來我發(fā)現(xiàn),這催更不僅適用于科技博主,比如在一個跟AI毫無關(guān)系的搞笑博主評論區(qū)里,我看見有網(wǎng)友說,“你怎么還不講DeepSeek?他血洗美國股市,干碎了美國人的幻想。那些歐美科技公司全都坐不住了”。
接下來這種“熱情”愈演愈烈。什么“科技巨頭全報廢了”“AGI馬上實現(xiàn)”“普通人再不學(xué)DeepSeek就晚了”,種種言論層出不窮。甚至還有DeepSeek受到境外大規(guī)模網(wǎng)絡(luò)攻擊,各大科技公司頂尖高手聯(lián)手隱跡江湖的中國紅客出手相救的爽文劇情。
輿論場到這里愈發(fā)離譜了起來。談到DeepSeek,我們好像會自動陷入某種彌散性的狂熱情緒。其中當然有DeepSeek足夠出色的原因,有近幾年AI大熱的加持,但很難否認的是,其中也有地緣因素的推動。很多人迫切需要一個“歪果仁怕了、服了”的故事,在科技領(lǐng)域尤其如此。
為了迎合這種情緒,媒體與公眾人物傾向于推波助瀾。比如將對DeepSeek的討論,推到哲學(xué)、國運、歷史走向的高度。而這些討論又會在流量的折射與層層斷章取義之下被無盡放大,很快讓一款AI模型承受了它本不該承受的地位、責任與期待。這就是所謂的“推上神壇”。
但神壇之上風(fēng)景并不好。因為以往經(jīng)驗提醒我們,往往下一步就是“傷仲永”“泡沫破裂”等輿論反噬。對于初露鋒芒的DeepSeek與研發(fā)團隊來說,這種走向應(yīng)該是弊大于利的。
因此我們想要討論一下,目前階段可以基于哪些共識來客觀討論DeepSeek?;蛘哒f,不妨試著拆掉輿論神壇,還原一個更真實也更樸素的DeepSeek。
不妨先釋放一個“爆論”。那就是跟社交媒體發(fā)散的觀點截然不同,DeepSeek其實并沒有完成從0到1的核心技術(shù)突破。
DeepSeek大火之后,其研發(fā)團隊與科技產(chǎn)業(yè)相關(guān)人士都在討論中國AI不能只是跟隨,必須完成從0到1。這個觀點絕對正確,但目前的DeepSeek可能還不能成為這個觀點的作證。
所謂核心技術(shù)突破,應(yīng)該是主要技術(shù)路徑的變化,或者達成效果的巨大升級。而DeepSeek目前最讓人經(jīng)驗的技術(shù)能力,一個是R1模型帶火的思維鏈推理過程,另一個是其聯(lián)網(wǎng)檢索的RAG效果表現(xiàn)出色。
但這兩條技術(shù)路徑都不是DeepSeek開創(chuàng)的。思維鏈的興起一般認為是OpenAI發(fā)布的o1模型。去年9月o1模型公布后,全球主流大模型紛紛跟進了思維鏈、推理大模型等能力。各家名稱不同,但整體技術(shù)路線是非常一致的。DeepSeek確實把思維鏈的過程更完整、詳細展示了出來,但其實也很容易看到其中大模型幻覺還很嚴重。
而在聯(lián)網(wǎng)檢索方面,其他廠商也早有布局,也就是所謂的RAG檢索-增強-生成機制。這項技術(shù)最開始是為了解決大模型不具備實時信息的問題,并且?guī)椭C正大模型幻覺。早在2023年,百度發(fā)布文心一言時,RAG就已經(jīng)是其核心能力的組成部分。
但要注意的是,沒有從0到1的創(chuàng)新,不等于沒有創(chuàng)新。DeepSeek在模型能力的優(yōu)化上做了大量開拓性工作,比如通過GRPO算法讓模型更加高效?;蛟S可以說,DeepSeek集成了業(yè)界主流的,被驗證過的技術(shù)路線。在其基礎(chǔ)上完成了模型優(yōu)化、能力加強與用戶體驗升級。
我們總是渴望從0到1,總是期待石破天驚。但客觀來看,第一步和第一萬步,邁出的距離是一樣的。
那么,DeepSeek真正引發(fā)全球關(guān)注的價值在哪里?在短短一個春節(jié)的發(fā)酵之后,可能很多人都忘記了它最早出圈的原因是通過軟件和架構(gòu)創(chuàng)新,用非常低的算力成本完成了DeepSeek-V3模型的訓(xùn)練。
DeepSeek-V3是我們今天用到的R1模型的基礎(chǔ)模型。在研發(fā)團隊發(fā)表的論文中,可以看到其僅僅使用了550萬美元的算力訓(xùn)練成本就完成了6710億參數(shù)大模型的訓(xùn)練。即使這項統(tǒng)計僅僅局限于基礎(chǔ)模型訓(xùn)練的算力成本這一項,沒有包含后續(xù)應(yīng)用模型的強化學(xué)習(xí)、模型推理,以及人才成本、綜合成本等項目,但也是毫無疑問顛覆了大模型訓(xùn)練的主流成本模型。
而最終DeepSeek實現(xiàn)的效果,也基本達到了o1為代表的主流大模型水平。雖然在模型效果上很難說有全面的超越,但其確實以軟件算法的革新實現(xiàn)了硬件成本的下降。讓低成本模型的效果不差于高成本,讓開源模型的效果追趕閉源模型。
而DeepSeek“降低AI算力成本”的突破,又恰好發(fā)生在全球主流AI玩家囤積高端GPU,以此筑造產(chǎn)業(yè)護城河,以及美國對中國禁售高端AI芯片,希望以此打壓中國AI的關(guān)鍵節(jié)點上。于是也就有了DeepSeek實現(xiàn)AI民主化,甚至助力打破地緣科技壟斷的意味,從而產(chǎn)生了一款中國AI大模型讓整個美國股市遭遇震蕩的戲劇性一幕。
DeepSeek實現(xiàn)的訓(xùn)練效率提升與訓(xùn)練成本下降,在特殊的產(chǎn)業(yè)環(huán)境與國際環(huán)境下造成了連鎖反應(yīng)。但問題是很多平時不關(guān)注AI的朋友,可能并不知道AI大模型算力越大效果越好的Scaling Laws,也不知道算力壟斷和禁售的背景信息,只知道短視頻上說DeepSeek橫空出世,歪果仁都慌了、怕了。這種缺乏前因后果的聯(lián)想,給DeepSeek憑空造出了一座不應(yīng)屬于它的神壇。
推而廣之,我們很多人都喜歡那些天才式的、戲劇化的創(chuàng)新。但在現(xiàn)實中,往往只有通過工程化能力,不斷調(diào)優(yōu),降本,提效,技術(shù)創(chuàng)新才有應(yīng)用和普及的可能。
比如我們都知道愛迪生發(fā)明了電燈,但容易忽略大規(guī)模電網(wǎng)實現(xiàn)了電力成本的極大下降。如果每家都要自己發(fā)電,那世界將一片漆黑。
“我們把成本打下來了?!?/p>
這句有點荒誕、俗套,略帶反諷意味的話,其實才是中國產(chǎn)業(yè)化能力的縮影。
我們也不妨大大方方承認,包括DeepSeek在內(nèi)的中國AI,在未來很長一段時間里最擅長的就是把成本給狠狠打下來。
DeepSeek爆火之后,很多人都說這是技術(shù)的巨大勝利。預(yù)言AI的崛起會讓人文學(xué)科和人文工作喪失價值。甚至“DeepSeek來了,學(xué)文科還有意義嗎?”登上了熱搜。
但如果我們多使用DeepSeek,仔細分析它與其他模型的區(qū)別,會發(fā)現(xiàn)一個相反的觀點:DeepSeek恰好證明了文科與人文能力,在AI時代有多么的重要。
我們隨機問一些人,對DeepSeek的使用體驗是怎樣的。他們應(yīng)該會說跟DeepSeek對話感覺更有人味。
但這種人味,在很大程度上并不是理解、推理等AI技術(shù)層面的“人味”,而是模型在對話過程中展露出來了大量的幽默感、網(wǎng)感,以及更加符合年輕群體的對話習(xí)慣。還有就是DeepSeek具有相對更精妙的修辭能力,優(yōu)美的文筆,還有不錯的綜合人文素養(yǎng)。
這些能力,讓DeepSeek更貼近年輕用戶的對話習(xí)慣和審美需求,并且能夠給出更有話題度和傳播度的回答。但問題是,這些能力其實都與技術(shù)的關(guān)系不大,而是很大程度上與訓(xùn)練語料的選取等人文能力緊密相關(guān)。
比如說,你讓DeepSeek寫首詩,它能夠?qū)懗鑫乃嚽嗄隉釔鄣恼Z調(diào)與修辭。但其他主流國內(nèi)大模型,也能寫得平仄工整、辭藻華麗,但一眼看去就是酷似打油詩的“老干體”。
再比如,讓DeepSeek預(yù)測一些未來趨勢之類的問題,它的回答會特別類似網(wǎng)絡(luò)科幻小說。雖然經(jīng)不起推敲,但就是能讓年輕人有種非常厲害,特別燃的感覺。
這些優(yōu)點的來源不是技術(shù),而是在于研發(fā)團隊的年輕化、高審美,并且重視模型訓(xùn)練過程中的人文要素。反觀很多主流大模型,由于最終聽取匯報的領(lǐng)導(dǎo)層普遍是大于45歲,缺乏人文學(xué)科背景的中年男士,最終導(dǎo)致大模型對話也是班味十足,打起官腔來一套又一套。與其說年輕人在支持DeepSeek,不如說年輕人在支持自己的話語權(quán)和審美權(quán)。
順便一提,DeepSeek的另一個人文優(yōu)勢,是它目前還有些“百無禁忌”。然而監(jiān)管的鐵拳雖遲但到,大家不必對AI的犀利和大膽有任何幻想。
DeepSeek以一種很巧妙的方式,實現(xiàn)了用戶對話體驗更好,傳播效果更優(yōu)秀。這些在技術(shù)層面之外,或許能夠引起AI公司對產(chǎn)品體驗的反思,以及對人文能力的重視。
如果我們狂吹DeepSeek的技術(shù),導(dǎo)致對其人文體驗的忽略,那其實也挺可惜的。
綜合以上這些側(cè)面,我們可以拼湊出一個比較完整,且不帶神圣光暈效果的DeepSeek:
它是一次綜合的突破。這種突破由技術(shù)創(chuàng)新,人文素養(yǎng)、開源和低成本策略等要素所構(gòu)成,并且在特殊的產(chǎn)業(yè)周期與國際環(huán)境背景下被發(fā)酵。
DeepSeek不是石破天驚的技術(shù)革命,但它足夠成熟,足夠有新意。這也在某種程度上解釋了,為什么歐美的AI大佬與專家,對其比較一致的觀點是“令人印象深刻”。
DeepSeek沒有一步登天,我們也不必幻想一步登天。
它就是前進了一大步,而我們也足可為邁出了這一步而自信和驕傲。
我也十分反對中國只有DeepSeek的言論。事實上,中國有清晰的AI產(chǎn)業(yè)格局,有堅實的自主化AI軟硬件體系,有數(shù)十萬AI開發(fā)者,有非常積極的AI政策導(dǎo)向。這些都是更多DeepSeek的土壤。有這些因素在,我十分篤定地認為會有更多DeepSeek出現(xiàn)在這里。直到AI工業(yè)革命的開啟,直到AGI的曙光。
何不把DeepSeek帶下神壇?理性從容地看待它,用好它,用好中國AI事業(yè)的一切造物,才是AI在中國真正成熟的表現(xiàn)。
王陽明說,山高萬仞,只登一步。DeepSeek這一步有它的意義,邁出這一步后,也不妨停下來聽聽山風(fēng),淺斟低唱一番。但也要清醒地知道,我們還在山間。
休息好了,高興夠了,也只有一件事要做。那就是邁出下一步。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 叮咚買菜首次全年盈利!苦日子終于熬出頭了?
- 哪吒導(dǎo)演餃子與DeepSeek創(chuàng)始人梁文鋒,他們?yōu)楹文苣嬉u人生?
- 從鸚鵡學(xué)舌到靈魂對話,AI的「人話革命」
- 接入手機后,DeepSeek難“轉(zhuǎn)正”
- 大廠加碼,小廠離席:DeepSeek驅(qū)動的MaaS之變
- 突然“換帥”求變!良品鋪子真急了?
- Manus爆紅背后,超8萬家AI企業(yè)倒閉,流量神話還是資本鐮刀?
- “小紅書電商退貨率最高?但…我還得做下去!”
- 技術(shù)破壁+硬核突圍,曙光存儲登頂SPC-1測試
- AI界奧斯卡頒獎:Deepseek 10天沖榜眼,國產(chǎn)視頻雙星吊打Sora
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。