美媒:一些中國(guó)大模型已經(jīng)追平甚至超越美國(guó)產(chǎn)品

極客網(wǎng)·極客觀察12月18日 CNBC報(bào)道稱(chēng),中國(guó)想在AI領(lǐng)域成為統(tǒng)治者,這種嘗試可能已經(jīng)獲得回報(bào)。一些美國(guó)AI業(yè)內(nèi)人士和科技分析人士認(rèn)為,中國(guó)AI模型已經(jīng)相當(dāng)流行,從性能角度看,中國(guó)的一些模型與美國(guó)產(chǎn)品齊頭并進(jìn),甚至超越。

由于無(wú)法采購(gòu)美國(guó)先進(jìn)AI芯片,中國(guó)只能尋找其它辦法增強(qiáng)AI模型性能,比如依賴開(kāi)源技術(shù),開(kāi)發(fā)自主軟件和芯片。

OpenAI ChatGPT是基于閉源模型開(kāi)發(fā)的,但中國(guó)的許多企業(yè)選擇了開(kāi)源LLM。查看Hugging Face平臺(tái),下載最多的LLM有許多來(lái)自中國(guó)企業(yè),其中阿里巴巴Qwen(通義千問(wèn))熱度最高,深度求索的DeepSeek也備受推崇。

阿里Qwen、DeepSeek等中國(guó)大模型受追捧

Hugging Face機(jī)器學(xué)習(xí)工程師Tiezhen Wang告訴CNBC:“從評(píng)測(cè)基準(zhǔn)看,Qwen的性能極為出色,這是它快速流行的主要原因。”還有,Qwen的授權(quán)模式比較友好,企業(yè)使用時(shí)法律評(píng)估沒(méi)有那么復(fù)雜。

阿里巴巴給Qwen分了級(jí),有的參數(shù)很多,更強(qiáng)大,但算力要求高,運(yùn)行成本也高,如果是參數(shù)少的小模型,運(yùn)行成本更低。

Tiezhen Wang說(shuō):“不管你選擇什么規(guī)模的模型,Qwen都可能是現(xiàn)今性能最棒的模型之一?!?/p>

DeepSeek也成為耀眼明星,它不久前剛剛推出DeepSeek-R1模型。上個(gè)月DeepSeek發(fā)布消息稱(chēng),R1模型可以與OpenAI o1模型競(jìng)爭(zhēng)。

中國(guó)企業(yè)宣稱(chēng),它們的模型可以與Meta Llama開(kāi)源模型競(jìng)爭(zhēng),也與OpenAI等閉源模型一樣好。

Lux Capital合伙人Grace Isford說(shuō):“2023年,我觀察到中國(guó)對(duì)開(kāi)源AI的貢獻(xiàn)不斷增加,中國(guó)模型的性能很強(qiáng),成本低,吞吐量高。”

不只是中國(guó)企業(yè)支持開(kāi)源LLM,Meta和歐洲創(chuàng)業(yè)公司Mistral也有開(kāi)源版AI模型。隨著中美科技競(jìng)爭(zhēng)加劇,開(kāi)源模型還有一個(gè)優(yōu)勢(shì):中國(guó)企業(yè)可以將自己的模型推向全球。

全球咨詢公司DGA Group的合伙人Paul Triolo說(shuō):“中國(guó)企業(yè)當(dāng)然希望自己的模型能在中國(guó)之外使用,所以中國(guó)企業(yè)看重開(kāi)源模型,希望借開(kāi)源成為AI領(lǐng)域的全球性玩家。”

中國(guó)企業(yè)認(rèn)為L(zhǎng)LM會(huì)是未來(lái)科技生態(tài)系統(tǒng)的核心

雖然全球都在熱炒AI模型,但是到底應(yīng)該在模型之上開(kāi)發(fā)什么應(yīng)用?未來(lái)誰(shuí)會(huì)主導(dǎo)全球互聯(lián)網(wǎng)版圖?現(xiàn)在還充滿爭(zhēng)論。

Grace Isford說(shuō):“如果你認(rèn)為前沿基本AI模型是必需,那就應(yīng)該思考這些模型的用途,比如用于前沿科學(xué)、工程技術(shù)?!?/p>

樂(lè)觀者將AI模型比作操作系統(tǒng),它和Windows、Android、iOS一樣重要,有可能會(huì)主導(dǎo)市場(chǎng),就像科技企業(yè)主導(dǎo)手機(jī)和PC一樣。

英國(guó)倫敦大學(xué)國(guó)王學(xué)院學(xué)者Xin Sun認(rèn)為:“中國(guó)企業(yè)認(rèn)為L(zhǎng)LM會(huì)是未來(lái)科技生態(tài)系統(tǒng)的核心?!?/p>

Xin Sun還說(shuō):“未來(lái)的商業(yè)模型有賴于開(kāi)發(fā)者加入生態(tài)系統(tǒng),要基于LLM開(kāi)發(fā)新的應(yīng)用,要通過(guò)各種手段吸引用戶、數(shù)據(jù)并獲得利潤(rùn),遠(yuǎn)不只是引導(dǎo)用戶使用云服務(wù)那么簡(jiǎn)單?!?/p>

中國(guó)構(gòu)建獨(dú)立于英偉達(dá)高性能AI芯片之外的基礎(chǔ)設(shè)施

訓(xùn)練AI模型需要海量數(shù)據(jù),運(yùn)行時(shí)需要強(qiáng)大算力。英偉達(dá)已經(jīng)成為AI芯片的壟斷者,許多頭部AI企業(yè)也用英偉達(dá)芯片訓(xùn)練模型,但中國(guó)是個(gè)例外。

雖然美國(guó)百般阻撓,禁止英偉達(dá)高端AI芯片流入中國(guó),但中國(guó)企業(yè)仍然不斷推出先進(jìn)AI模型。

Paul Triolo說(shuō):“目前大多中國(guó)科技平臺(tái)都擁有充足的算力,完全可以繼續(xù)優(yōu)化模型。首先,中國(guó)企業(yè)囤積了大量英偉達(dá)GPU;其次,中國(guó)有自己的GPU,它們來(lái)自華為等企業(yè)?!?/p>

實(shí)際上,中國(guó)科技企業(yè)正在開(kāi)發(fā)英偉達(dá)芯片的替代品,華為是領(lǐng)導(dǎo)者,百度、阿里巴巴也在投資半導(dǎo)體設(shè)計(jì)。

Paul Triolo認(rèn)為:“在未來(lái)的日子里,中國(guó)與美國(guó)先進(jìn)硬件的差距還會(huì)拉大,特別是明年,因?yàn)槊髂暧ミ_(dá)將會(huì)推出Blackwell系統(tǒng),美國(guó)會(huì)嚴(yán)格禁止Blackwell流向中國(guó)。”

Grace Isford認(rèn)為,中國(guó)一直在向本國(guó)AI基礎(chǔ)設(shè)施進(jìn)行投資,它獨(dú)立于英偉達(dá)高性能AI芯片之外?!安还苊绹?guó)有沒(méi)有禁止英偉達(dá)AI芯片在中國(guó)銷(xiāo)售,中國(guó)都會(huì)繼續(xù)投資,繼續(xù)打造自己的基礎(chǔ)設(shè)施,繼續(xù)開(kāi)發(fā)、訓(xùn)練AI模型。”(小刀)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-12-18
美媒:一些中國(guó)大模型已經(jīng)追平甚至超越美國(guó)產(chǎn)品
阿里Qwen、DeepSeek等中國(guó)大模型受追捧

長(zhǎng)按掃碼 閱讀全文