中國AI低調兩連發(fā)引熱議,阿里千問與DeepSeek攜手上架魔搭社區(qū)

極客網·人工智能 3月26日,中國AI又給全球開源社區(qū)帶來了新驚喜——阿里通義千問與DeepSeek,均于昨日低調開源了兩款新模型:阿里發(fā)布了更適合本地部署的高性能「多模態(tài)模型」Qwen2.5-VL-32B,DeepSeek則將此前熱門的「基座模型」V3更新到0324版本,并官宣在魔搭社區(qū)上架開源。截至目前,魔搭社區(qū)模型總數已超4萬個,已成為中國最大的AI開源社區(qū)。

 1.jpg

千問Qwen-VL是全球AI開源社區(qū)最受歡迎的多模態(tài)模型之一,此前,通義千問Qwen2.5-VL已開源3B、7B及72B等3個尺寸,昨日又推出更適合本地部署的32B版本。Qwen2.5-VL-32B模型在MMMU、MathVista、 MM-MT-Bench 等基準測試中的性能表現突出,超越了更大規(guī)模的 Qwen2-VL-72B 和 GPT-4o-0513,并且優(yōu)于近期火熱的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT等模型。在開發(fā)者關注的知名Hacker News網站上,Qwen2.5-VL-32B的熱度爆表,是當天評論最多的新聞。

 2.jpg

 3.jpg

DeepSeek-V3是全球最受關注的基座大模型之一,也于昨夜官宣完成小版本升級。據DeepSeek透露,新版 V3-0324 模型借鑒 R1 模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現水平,在數學、代碼類相關評測集上取得了超過 GPT-4.5 的得分成績,并在前端開發(fā)、中文寫作、中文搜索等能力上均有提升。V3-0324 模型在HuggingFace開源后不久,即斬獲趨勢榜榜首。同時,在昨日官方推文中,DeepSeek首次官宣在魔搭社區(qū)開源,更好服務于中國開發(fā)者和企業(yè)。

 4.jpg

據了解,阿里云聯(lián)合CCF開源發(fā)展委員會共同牽頭組建的魔搭社區(qū)(Model Scope),已發(fā)展成為中國最大的AI開源社區(qū)。秉承“模型即服務”(MaaS,Model as a Service)理念,魔搭為AI開發(fā)者提供模型體驗、下載、調優(yōu)、訓練、推理、部署等一站式服務,“找大模型上魔搭”成為開發(fā)者心照不宣的默契。截至目前,阿里通義千問、DeepSeek、階躍星辰、MiniMax、月之暗面、百川智能、零一萬物、智譜AI等知名大模型公司均官方在魔搭開源最新模型,魔搭社區(qū)模型總量超過 4萬個,涵蓋LLM、對話、語音、文生圖、圖生視頻、AI作曲等多個領域,魔搭已經服務超過1000萬開發(fā)者。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2025-03-26
中國AI低調兩連發(fā)引熱議,阿里千問與DeepSeek攜手上架魔搭社區(qū)
3月26日,中國AI又給全球開源社區(qū)帶來了新驚喜——阿里通義千問與DeepSeek,均于昨日低調開源了兩款新模型:阿里發(fā)布了更適合本地部署的高性能「多模態(tài)模型」Qwen2.5-VL-32B,DeepSeek則將此前熱門的「基座模型」V3更新到0324版本,并官宣在魔搭社區(qū)上架開源。

長按掃碼 閱讀全文