2023年初AI大模型火爆全球,當(dāng)時(shí)就有人說,這項(xiàng)技術(shù)走向大眾的最佳方式就是手機(jī)。
不管消費(fèi)者怎么想這句話,苦于銷量連年下降的手機(jī)廠商們肯定是把它聽進(jìn)去了。
于是,從2023年下半年開始,所有手機(jī)新品都在標(biāo)榜AI能力,都宣稱自己是AI手機(jī)。這場盛宴持續(xù)上演到今天,即使是相對(duì)保守的蘋果也發(fā)布了“Apple Intelligence”,而那些原本被認(rèn)為已經(jīng)被擠壓到缺少生存空間的二線手機(jī)品牌,也頑強(qiáng)地依靠“All in AI”留在了牌桌上。
一時(shí)間,AI在手機(jī)市場是鑼鼓喧天,紅旗招展,人山人?!粚?duì),人山人??赡苓€不一定。
對(duì)于用戶來說,面對(duì)鋪天蓋地的AI手機(jī),華美無比的發(fā)布會(huì)PPT,可能有點(diǎn)小迷惑:AI到底能給我?guī)硎裁??這么多AI手機(jī)之間有什么不同?我設(shè)想的AI是科幻電影里那種,手機(jī)能給我嗎?
事實(shí)上,從2017年深度學(xué)習(xí)火熱起來之后,手機(jī)與AI的結(jié)合一直都在持續(xù)。幾年來,我們經(jīng)歷了端側(cè)AI算力、AI攝影、端側(cè)大模型,到系統(tǒng)級(jí)AI能力的變遷。假如手機(jī)是一片果園,AI這棵果樹在里面已經(jīng)長了很多年。
那么,到2024年,AI手機(jī)無限風(fēng)光之時(shí),這顆果子它保熟了嗎?
讓我們穿越紛繁復(fù)雜的概念,看看AI手機(jī)究竟帶來了什么。
提起AI手機(jī),我們總會(huì)有一種很空洞的感覺,甚至不知道廠商和專家到底在激動(dòng)個(gè)什么。
這種虛妄感來源于業(yè)界并不存在對(duì)AI手機(jī)的標(biāo)準(zhǔn)化認(rèn)定。于是每個(gè)廠商,甚至每個(gè)人都可以對(duì)其進(jìn)行獨(dú)立闡釋。這些闡釋有共識(shí),有差異,還有大量似是而非與文字游戲。這些聲音交織在一起,就變成了一種概念游戲。
因此,想要了解AI手機(jī),首先要避免被概念游戲干擾。就像要摘果子,首先要把枝葉撥開。如何實(shí)現(xiàn)這種免打擾呢?一個(gè)簡單的方法,叫作“AI手機(jī),我有三不看”。
首先,廠商的“AI大帽子”不用看。
不久之前,AI手機(jī)領(lǐng)域姍姍來遲地發(fā)布了此前承諾的Apple Intelligence。但這個(gè)“蘋果智能”卻沒有激起多大的市場水花。原因在于,蘋果智能更像是眾多AI功能的升級(jí)打包,而非某種新能力、新思路。
這種給眾多AI小功能起個(gè)大名字的玩法,在今天的手機(jī)界比較普遍。用戶以為得到了新東西,其實(shí)不過是新瓶裝舊酒,散裝改零售。類似的說法,經(jīng)常還包括某某智能、某某GPT、某某原生,大差不差都是一個(gè)意思。甚至很多時(shí)候這根本不是一個(gè)研發(fā)系統(tǒng)主導(dǎo)的項(xiàng)目,而是市場部歸攏收集一下各個(gè)部門都有哪些AI能力,最后編個(gè)名字給寫進(jìn)PPT里而已。
其次,是缺乏標(biāo)準(zhǔn)的技術(shù)名詞不用看。
任何技術(shù)在受到重視之后,都會(huì)經(jīng)歷一個(gè)造詞階段。這些新造的詞有些會(huì)最終留下來,變成約定俗成、相對(duì)標(biāo)準(zhǔn)化的說法。但絕大部分都會(huì)悄然流逝在歷史記憶里。在AI手機(jī)領(lǐng)域,我們經(jīng)常會(huì)看見大量類似的新詞。它們或多或少都有所指,但作為普通消費(fèi)者大可不必去探尋每個(gè)詞的來龍去脈,也不用被它們迷惑了判斷。
諸如智能框架、意圖識(shí)別、主動(dòng)服務(wù)、全局智能等高大上的AI手機(jī)詞匯,在今天都沒有統(tǒng)一標(biāo)準(zhǔn),愛好者可以研究研究,大多數(shù)消費(fèi)者不妨敬而遠(yuǎn)之。
再次,大模型參數(shù)以及其他AI參數(shù)不用看。
從2018年預(yù)訓(xùn)練大模型開始出現(xiàn),就產(chǎn)生了一種頭部廠商說效果,其他廠商拼參數(shù)的現(xiàn)象。在核心能力上很難構(gòu)建差異化的廠商,往往會(huì)宣傳自己模型參數(shù)更大,跑分效果更好。這一點(diǎn)來到AI手機(jī)階段,就變成了宣傳端側(cè)大模型的參數(shù)大、數(shù)量多。但AI模型不是CPU等硬件,參數(shù)高并不意味著性能好。模型效果還取決于壓縮方案、調(diào)優(yōu)效果等一系列條件,所以不必將廠商宣傳的模型參數(shù)等同于產(chǎn)品價(jià)值。
蒸餾掉這些之后還能留下的東西,才是AI在手機(jī)里結(jié)出的果。
很多人都在說,AI沒有應(yīng)用可怎么辦。但問題是,ChatGPT本身就是一種應(yīng)用。在應(yīng)用端再誕生更強(qiáng)的超級(jí)應(yīng)用固然前景美好,但大模型本身的應(yīng)用價(jià)值本身就有跟手機(jī)結(jié)合的空間。
AI手機(jī)的第一步,就是要把類ChatGPT的大模型能力帶到手機(jī)的第一方功能里。比如iOS18.1,重點(diǎn)引入的AI功能,就包括AI寫作、郵件推薦與回復(fù)、消息摘要等。換個(gè)角度想想,我們會(huì)發(fā)現(xiàn)這些都是ChatGPT就能做到的事。
這種思路并沒有什么不好,而且也必須由手機(jī)廠商第一方來主導(dǎo)。因?yàn)槿缃裰悄苁謾C(jī)提供的第一方功能非常多,而其中又有大量可以加入語義理解、內(nèi)容生成等大模型能力的地方。因此,大語言模型與手機(jī)第一方功能的點(diǎn)對(duì)點(diǎn)結(jié)合,是AI在手機(jī)里結(jié)出最多的果。
對(duì)于類似功能的選擇,建議是根據(jù)自身需求來挑選實(shí)用的功能,或者功能群組。比如去年11月,OPPO就發(fā)布了一鍵生成AI通話摘要。這個(gè)功能可以在通話結(jié)束后,智能識(shí)別通話內(nèi)容并生成重點(diǎn)信息摘要。再比如Find X8 Pro可以長按電源鍵呼出問屏功能,AI根據(jù)屏幕顯示來回答文章內(nèi)容、圖片信息等。小米在澎湃OS 2當(dāng)中,也推出了一系列諸如AI寫作、AI識(shí)音、AI妙畫的智能功能。
但對(duì)于手機(jī)廠商來說,大模型功能的加入顯然只是敲門磚。這種單點(diǎn)升級(jí)并不能滿足廠商對(duì)AI的野心。
于是,智能體來了。
AI Agent又被稱為智能體,被廣泛認(rèn)可是真正體現(xiàn)了AI思維的新應(yīng)用形態(tài)。智能體可以跨越不同的軟件工作流程,來實(shí)現(xiàn)目標(biāo)主導(dǎo)的自主判斷。這種運(yùn)行邏輯放在手機(jī)里有兩方面的好處。
對(duì)于用戶來說,智能體可以被視作獨(dú)立于點(diǎn)滑交互的新交互形式。用戶可以命令智能體來完成指令,并且其理解能力、生成能力與應(yīng)用范疇都遠(yuǎn)大于此前的語音助手,更加貼近用戶對(duì)個(gè)人助理的基本想象。
對(duì)于手機(jī)廠商來說,智能體不僅是一個(gè)全新賣點(diǎn),還可以繞過APP的藩籬,讓第一方的應(yīng)用權(quán)限更大,體驗(yàn)更加重要。把智能體做起來,有概率讓用戶習(xí)慣、第三方應(yīng)用服務(wù)都與廠商綁定更加緊密。
在這樣的驅(qū)動(dòng)力下,幾個(gè)月以來手機(jī)廠商紛紛在智能體陣地上秣馬厲兵,誓有一種在2025年展開智能體決戰(zhàn)的架勢。而從AI手機(jī)的發(fā)展線上看,手機(jī)+AI Agent是一個(gè)脫離了ChatGPT基本應(yīng)用框架,同時(shí)蘋果為代表的歐美終端廠商沒有跟進(jìn)的領(lǐng)域。中國AI手機(jī)的未來成就,或許就系在智能體的機(jī)遇上。
在智能體方面,目前最為用力地就是榮耀。不久之前的榮耀Magic7發(fā)布會(huì)上,榮耀CEO趙明用YOYO智能體自動(dòng)下單了2000杯咖啡,一下讓智能體手機(jī)的概念大為出圈。目前,榮耀主推的智能體體驗(yàn)包括“一句話關(guān)閉自動(dòng)續(xù)費(fèi)”“一句話點(diǎn)咖啡”“一句話發(fā)送文件”“一句話關(guān)閉應(yīng)用權(quán)限”等。在手機(jī)行業(yè)里相對(duì)完整且具體地展現(xiàn)了智能體價(jià)值。
在2024 vivo開發(fā)者大會(huì)上,vivo也亮出了自己的智能體方案Phone GPT,其不僅具有對(duì)屏幕界面的識(shí)別和操作功能,還可以接管音頻,通過電話實(shí)現(xiàn)預(yù)訂餐廳等功能。把智能體延伸到音頻領(lǐng)域,也成為接下來一個(gè)值得關(guān)注的方向。
在OPPO這邊,則有可以連續(xù)多輪自然對(duì)話,并可以跨應(yīng)用操作的OPPO AI。除了提供識(shí)物、導(dǎo)航、問答等AI能力外,OPPO AI還可以與影像能力、AIGC能力結(jié)合,幫助用戶完成圖片識(shí)別、圖片處理、排版潤色等功能。
在華為這里,HarmonyOS NEXT版本具有搭載了盤古大模型的鴻蒙智能助手小藝。其感知和推理能力較此前版本有極大提升,可以實(shí)現(xiàn)23類主要場景的交互。
這些嘗試,都可以看作是向手機(jī)+AI Agent方向的前進(jìn),只是各個(gè)廠商的具體技術(shù)實(shí)現(xiàn)方式、能力側(cè)重以及宣傳話術(shù)不同。
對(duì)于消費(fèi)者來說,如果你是深度手機(jī)用戶,今天可能已經(jīng)到了嘗鮮智能體的時(shí)機(jī),但如果并沒有被傳統(tǒng)交互方式困擾等問題,或許還可以讓智能體手機(jī)再成熟一些。
至少AI Agent這顆果子,目前看來有著碩大無朋的潛力。
AI大模型與手機(jī)的結(jié)合方案有很多,但個(gè)人認(rèn)為,二者的最佳結(jié)合點(diǎn)其實(shí)是很明確的,那就是無障礙能力。
AI大模型的核心功能之一,就是在圖像、音頻、文字幾種不同的媒介間進(jìn)行轉(zhuǎn)換,而這恰好也是視障、聽障人群最為需要的。因此,當(dāng)有人認(rèn)為AI大模型與手機(jī)結(jié)合并不必要時(shí),我會(huì)說看看無障礙能力的長足進(jìn)展就能知道,AI手機(jī)必有未來。
通過與很多聽障、視障朋友的交流,以及對(duì)相關(guān)機(jī)構(gòu)的采訪,發(fā)現(xiàn)大家都希望實(shí)名表揚(yáng)華為和vivo。早些年普遍認(rèn)為蘋果的無障礙能力很好,但現(xiàn)在已經(jīng)是華為和vivo在引領(lǐng)端側(cè)無障礙能力的發(fā)展,尤其是AI時(shí)代的無障礙升級(jí)。
比如說,vivo通過AI技術(shù)為聽障、視障人群和老年人提供了一系列幫助。去年,vivo的“手語翻譯官”軟件獲得了CCL2024手語數(shù)字人翻譯質(zhì)量評(píng)測第一名。今年,vivo還升級(jí)了“手語學(xué)習(xí)”功能,推動(dòng)手語的教育普及。
鴻蒙系統(tǒng)的發(fā)展,每一步都伴隨著對(duì)端側(cè)無障礙事業(yè)的大力投入。比如HarmonyOS 4就推出了助聽器直連功能。在華為開發(fā)者大會(huì)2023期間,推出了能幫助視障人群識(shí)別具體場景與物品的小藝看世界。而在今年,HarmonyOS NEXT則在業(yè)界率先推出了小藝聲音修復(fù)功能,它利用AI技術(shù)對(duì)語言障礙者的聲音進(jìn)行實(shí)時(shí)分析、修復(fù)和優(yōu)化,不僅能夠發(fā)出可懂音,還能盡可能保留用戶音色。這個(gè)功能專為四級(jí)和三級(jí)言語障礙人群設(shè)計(jì),可以實(shí)現(xiàn)無需文本輸入的聲音修復(fù),極大拓展了端側(cè)無障礙能力的邊界。
對(duì)于很多用戶來說,手機(jī)里的AI能力或許是錦上添花,但對(duì)于有障礙群體來說,AI手機(jī)或許就是改變生活乃至生命的鑰匙。
僅為此,AI也必須在手機(jī)中存在,壯大,盛放。
回顧一下手機(jī)廠商推進(jìn)的AI能力,會(huì)發(fā)現(xiàn)其實(shí)每一步都還有很青澀的地方。如果我們?cè)敢獬姓J(rèn)二者結(jié)合的復(fù)雜性,那么AI手機(jī)的果子可能還真不太保熟。
如果手機(jī)只提供AI能力,那么廠商會(huì)面臨與應(yīng)用開發(fā)者的直接競爭。而應(yīng)用開發(fā)者包括互聯(lián)網(wǎng)巨頭與專業(yè)的AI廠商,手機(jī)廠商的技術(shù)能力與用戶號(hào)召力可能并不具有說服力。
于是,手機(jī)廠商希望押注智能體這樣的突破性體驗(yàn),但目前階段這類體驗(yàn)還有待打磨和升級(jí)。很多時(shí)候,用戶給智能體下達(dá)的指令需要反復(fù)確認(rèn),效率還不如直接點(diǎn)滑,而AI接管音頻等能力則不確定性更大。面對(duì)經(jīng)常出錯(cuò)的,且應(yīng)用范圍不廣的智能體,用戶的耐心與信任或許會(huì)快速枯竭。
更為重要的是,這類前沿能力還不足以影響消費(fèi)者的核心決策。AI手機(jī)大概率會(huì)導(dǎo)致手機(jī)市場短期向好,但還沒到能夠逆轉(zhuǎn)持續(xù)走低趨勢的程度。
再向上一層則比較務(wù)虛。意圖識(shí)別、主動(dòng)服務(wù)、服務(wù)找人等口號(hào),眾多手機(jī)廠商都喊了很多年。但真實(shí)情況是,最先進(jìn)的大模型也無法預(yù)測人的想法。消費(fèi)者對(duì)AI手機(jī)的期待是科幻電影里全能的個(gè)人助理。廠商為了促銷,也會(huì)在話術(shù)中將AI手機(jī)進(jìn)行包裝和夸大,但最終在可見的范圍內(nèi),手機(jī)行業(yè)只能一次次與消費(fèi)者的預(yù)期違背。
頂著這些壓力,AI手機(jī)還在趕路的途中。從技術(shù)體驗(yàn)的角度,它確實(shí)還不足以帶來顛覆,但從產(chǎn)業(yè)發(fā)展的角度,AI大模型與手機(jī)結(jié)合是一個(gè)絕佳的戰(zhàn)略機(jī)遇。海外大模型進(jìn)不來,谷歌另辟蹊徑,蘋果龜速發(fā)展。AI之于中國手機(jī),多少有了點(diǎn)天命在身的意味。
這是一個(gè)前所未有的局面,即使果子還沒熟透。對(duì)于大多數(shù)消費(fèi)者,也不妨像《鄉(xiāng)村愛情》里謝永強(qiáng)經(jīng)常說的那樣——“我得去果園看看”。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 一半是產(chǎn)品,一半是服務(wù),華為品牌帶給消費(fèi)者的有贊嘆更有溫暖
- 在人群里,看見「鯤鵬開發(fā)者」
- 游戲體驗(yàn)天花板,一加 Ace 5 系列售價(jià) 2299 元起
- 為創(chuàng)意和管理提效,新廣告投放(3.0)驅(qū)動(dòng)消費(fèi)品商家高效增長
- 榮耀Magic7系列全面升級(jí)大王影像,首發(fā)AI超級(jí)長焦拍遠(yuǎn)更清晰
- 2024過去了,留下十個(gè)科技記憶
- 年貨節(jié)如何大爆單?別錯(cuò)過巨量千川這三波紅利
- 美國無人機(jī)禁令升級(jí)?當(dāng)?shù)乜茖W(xué)家率先“喊疼”:我們離不開大疆
- iQOO Neo10 Pro:性能特長之外,亦有全能實(shí)力
- 自動(dòng)駕駛第一股的轉(zhuǎn)型迷途:圖森未來賭上了AIGC
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。