據(jù)報(bào)道,阿里(BABA.US)生成基座模型萬(wàn)相2.1(Wan)宣布開(kāi)源,在評(píng)測(cè)集中,超越Sora、Luma等模型,位列榜首。
開(kāi)源最強(qiáng)視頻大模型亮相
獲悉,萬(wàn)相2.1共有兩個(gè)參數(shù)規(guī)模,140億參數(shù)模型適用于對(duì)生成效果要求更高的專業(yè)人士,13億參數(shù)模型生成速度較快且能兼容所有消費(fèi)級(jí)GPU,兩個(gè)模型的全部推理代碼和權(quán)重已全部開(kāi)源。
在視頻生成方面,萬(wàn)相2.1通過(guò)自研的高效VAE和DiT架構(gòu)增強(qiáng)了時(shí)空上下文建模能力,支持無(wú)限長(zhǎng)1080P視頻的高效編解碼,首次實(shí)現(xiàn)了中文文字視頻生成功能,同時(shí)支持文生視頻、圖生視頻、視頻編輯、文生圖和視頻生音頻等多項(xiàng)任務(wù)。
據(jù)此前介紹,萬(wàn)相2.1支持中英文視頻,可以一鍵生成藝術(shù)字,還提供多種視頻特效選項(xiàng),以增強(qiáng)視覺(jué)表現(xiàn)力,例如過(guò)渡、粒子效果、模擬等。
分析人士稱,隨著萬(wàn)相2.1模型開(kāi)源,標(biāo)志著阿里云實(shí)現(xiàn)了全模態(tài)、全尺寸的開(kāi)源。這意味著更多的開(kāi)發(fā)者,將能夠低成本獲取并使用該模型底層代碼,進(jìn)而用以開(kāi)展與自身業(yè)務(wù)相關(guān)的各類視頻生成應(yīng)用。
開(kāi)啟全模態(tài)開(kāi)源新時(shí)代
自2025年以來(lái),開(kāi)源趨勢(shì)逐漸成為全球大模型領(lǐng)域的標(biāo)配。國(guó)內(nèi)方面,進(jìn)入2月,多家企業(yè)紛紛推出了各自的開(kāi)源模型,包括字節(jié)跳動(dòng)的豆包以及百度的文心一言等,共同掀起了新一輪的開(kāi)源熱潮。
國(guó)際方面,隨著萬(wàn)相2.1完全開(kāi)源,OpenAI、谷歌等競(jìng)品也將直面商業(yè)化的挑戰(zhàn):更好的模型已經(jīng)開(kāi)源了,AI生成視頻的定價(jià)也將面臨挑戰(zhàn)。谷歌Veo 2模型近期披露定價(jià),每生成1秒視頻需要付費(fèi)0.5美元,相當(dāng)于生成一個(gè)小時(shí)的視頻需要花費(fèi)1800美元。
微美全息開(kāi)源多模態(tài)應(yīng)用場(chǎng)景拓展
公開(kāi)資料顯示,微美全息(WIMI.US)在AI視頻生成領(lǐng)域有顯著布局,涵蓋大語(yǔ)言、多模態(tài)等領(lǐng)域,面對(duì)開(kāi)源視頻生成大模型賽道,從大語(yǔ)言模型到視覺(jué)生成模型,從基礎(chǔ)模型到多樣化的衍生模型,實(shí)現(xiàn)了全模態(tài)、全尺寸的開(kāi)源,微美全息AI開(kāi)源生態(tài)的發(fā)展正不斷被注入強(qiáng)大的動(dòng)力。
事實(shí)上,近些年來(lái),微美全息專注于多模態(tài)AIGC(生成式AI)研發(fā),技術(shù)核心在于結(jié)合大規(guī)模預(yù)訓(xùn)練與多模態(tài)算法優(yōu)化,提升生成內(nèi)容的連貫性和物理合理性。同時(shí)在行業(yè)生態(tài)上,微美全息已逐步實(shí)現(xiàn)文本生成視頻、圖像生成視頻等能力,支持劇情創(chuàng)作、短視頻生成等場(chǎng)景,未來(lái)可能通過(guò)API或行業(yè)解決方案,加速AI快速生成視頻能力技術(shù)迭代。
結(jié)語(yǔ)
未來(lái),AI模型將進(jìn)入一個(gè)分水嶺,機(jī)構(gòu)普遍認(rèn)為,阿里此舉將加速AI視頻技術(shù)商業(yè)化落地,并推動(dòng)算力、云計(jì)算、內(nèi)容創(chuàng)作等全產(chǎn)業(yè)鏈升級(jí)。所以說(shuō),AI下半場(chǎng),不是簡(jiǎn)單的技術(shù)競(jìng)賽,而是一場(chǎng)關(guān)于資源、效率和成本的綜合博弈,這一新的革命正在加速中。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )