給學(xué)習(xí)視頻加上字幕需要多久?1小時?很可能30秒就夠了。
想把視頻字幕導(dǎo)出文字,還要一幀一幀記?一句話就行了。
你能想象這些操作依靠什么完成的嗎?大多數(shù)人可能想不到,以往一些需要專業(yè)編輯軟件耗時耗力才能實現(xiàn)的操作,今后在百度網(wǎng)盤里可以一鍵搞定了。不止如此,未來,通過百度網(wǎng)盤“云一朵”助理,找圖、摘要、翻譯,都能成為一句話的事。
維特斯根坦說,我語言的邊界就是我世界的邊界。如今,AI正在拓寬世界的邊界——借助人類的自然語言。
未來的個人智能助理
科幻電影《Her》中,描述了這樣一個場景:一位擁有迷人聲線的虛擬AI,接管了人們大部分的工作和娛樂,不僅解放了雙手,甚至連雙腳也解放了,真正實現(xiàn)了常態(tài)化居家辦公。
過去幾十年,科幻電影對AI的描述大多離不開一個詞匯——效率。其背后掩藏的是現(xiàn)實世界對未來生活的終極愿景:生產(chǎn)力工具解放人類。
幾乎可以確定,每一部科幻片虛擬出來的AI都是在替人類工作,《西部世界》里的服務(wù)機器人、《星際穿越》里的塔斯,比比皆是。它映射出現(xiàn)實世界對AI的想象,總是要圍繞它最基礎(chǔ)的功能——效率躍遷。
從蒸汽機到內(nèi)燃機,從數(shù)據(jù)化到信息化,科技催生社會進步總是圍繞效率躍遷,而效率的躍遷背后,隱藏著的往往是時代下人們龐大且沒被滿足的需求。
chatGPT引發(fā)的這一輪AI浪潮,之所以能在短時間內(nèi)就席卷全球,技術(shù)創(chuàng)新是一方面,更底層的原因其實是社會對生產(chǎn)力工具進化的極度渴望。
正如文初我們展示的那樣,生產(chǎn)力工具如今在AI的加持下已經(jīng)開始表現(xiàn)的更科幻,而未來百度網(wǎng)盤結(jié)合大模型的升級,也將滿足社會對生產(chǎn)力工具的很大渴望。
1 更復(fù)雜的文件理解
以往我們需要一份專業(yè)報告的總結(jié),只能一頁一頁看,如果是外文報告可能還要用到翻譯工具,再或者還需要轉(zhuǎn)換文檔格式,上述操作需要我們在瀏覽器、閱讀器、word等多個軟件來回穿梭,不僅會頭暈眼花,可能還會忙中出錯。
好消息是,以后這些繁雜的工作可以在百度網(wǎng)盤一鍵完成了。
基于文心大模型,百度網(wǎng)盤將要實現(xiàn)的一個大功能,即文檔從「閱讀」到「理解」。你可以讓它給你寫一個文檔總結(jié),無論外文還是中文,幫助你快速從雜亂的信息中梳理知識。
你也可以挑選某一段讓它給你翻譯,又快又好。
甚至就連格式轉(zhuǎn)換也能一句話搞定。
簡而言之,通過這個例子,我們可以感受到一些變化,過去存儲在網(wǎng)盤的文件就只是一個文件,而今天百度網(wǎng)盤能夠幫助用戶理解其中的知識。
2 更快的圖片&文檔搜索
升級后的百度網(wǎng)盤,帶來了更快的圖片和文件搜索。
相較于傳統(tǒng)的翻閱式查找,在新的百度網(wǎng)盤中可以一句話找到想要的照片或文件。比如“幫我找一下最近拍的美食照片”或者更復(fù)雜的“去年公司的團建聚餐照片”就可以了。
借助大模型的能力,百度網(wǎng)盤能夠理解和分析更復(fù)雜的語義,并借助圖像識別技術(shù)快速找到目標(biāo)文件。
而且,這項技術(shù)還不止步于圖片和文件,視頻查找也是可以的。
比如在百度網(wǎng)盤里的視頻資料,上次學(xué)過的知識點想要復(fù)習(xí)一下,但又記不得是幾分幾秒?沒關(guān)系,可以直接提問某個知識點,百度網(wǎng)盤就會基于視頻內(nèi)容提供相關(guān)的解答并給出視頻對應(yīng)內(nèi)容的位置,也可以直接定位跳轉(zhuǎn)到對應(yīng)位置。
目前,百度網(wǎng)盤云一朵正在內(nèi)測中,打開百度網(wǎng)盤PC客戶端(最新版)或網(wǎng)頁版,即刻預(yù)約體驗。
我們之前說過,某種技術(shù)的出現(xiàn),背后往往是當(dāng)時人類需求的集中爆發(fā)。內(nèi)燃機的發(fā)明,讓我們能去到更遠的地方,促進了貿(mào)易和文化的交流;而數(shù)據(jù)化、信息化相當(dāng)于是輪子和發(fā)動機,讓知識跑的更遠。
而當(dāng)數(shù)據(jù)膨脹到一定程度后,知識堆疊的冗余就讓獲取知識變得困難。真正想找到有價值的信息卻如大海撈針,這一問題在數(shù)字信息時代變得越來越嚴(yán)重。生產(chǎn)力工具的進化,其目標(biāo)就是讓知識獲取變得更容易。
如何解決這個新時代的新問題,這是我們看到在AI時代可能帶來的變化。就好像在輪子和發(fā)動機的基礎(chǔ)上加入一個導(dǎo)航儀,讓所有的內(nèi)容和數(shù)據(jù)為我所用,這就從信息化到知識化。
炸裂的B端智能化
這一次的AI浪潮不止惠及個人,也包含廣大的B端企業(yè)用戶,畢竟企業(yè)擁有更集中也更迫切的生產(chǎn)力需求。
chatGPT發(fā)布之后,諸如廣告行業(yè)已有多家公司宣布將裁撤一部分基礎(chǔ)的文案崗位,轉(zhuǎn)向AIGC;一些畫師也在使用Midjourney這類的軟件為其工作。
跳轉(zhuǎn)到網(wǎng)盤市場的企業(yè)用戶,實際上存在兩類剛需,一類是數(shù)據(jù)存儲和傳輸,一類是基于存儲和傳輸?shù)谋镜匾绘I化生成。
對于第一類,比較典型的就是很多企業(yè)會將文件、合同、發(fā)票、素材等放到網(wǎng)盤里,以作備份或者傳輸用。那么這一類需求的痛點就是,花在海量文件查找和歸類的時間,即辛苦又沒有價值。
基于文心大模型,未來,百度網(wǎng)盤升級后將在企業(yè)版中加入更智能的圖片分類功能,定制了多達57個更契合辦公用途的分類,例如企業(yè)票證、商務(wù)合同、設(shè)計素材等,實現(xiàn)更好的管理和更快的查詢。
同個人版一樣,百度網(wǎng)盤企業(yè)版也將基于文心大模型,帶來企業(yè)知識官。通過對話式交互幫助企業(yè)版用戶對文件內(nèi)容進行總結(jié)、提煉、問答和進一步加工。
例如可以讓它頭腦風(fēng)暴想10個小清新的飲品名稱、根據(jù)提綱完成一篇報告,或者潤色一下文字讓文章看起來更高級,百度網(wǎng)盤都能搞定。
針對第二類需求,升級后的百度網(wǎng)盤某種意義上真正幫助特定行業(yè)實現(xiàn)了效率躍遷。
比如攝影行業(yè),從客戶追蹤到售后服務(wù)一套流程下來,平均服務(wù)一個客戶需要15個員工花費35天。
百度網(wǎng)盤推出的即拍即選服務(wù),為攝影行業(yè)實現(xiàn)了效率的極大改進。
拍完即上傳,并且借助一鍵AI修圖、自動套版、生成網(wǎng)盤鏈接等本地操作,將傳統(tǒng)攝影機構(gòu)一張照片涉及拍照、初修、調(diào)色、導(dǎo)卡選片等13個環(huán)節(jié),平均參與人員15人,縮減到整個環(huán)節(jié)從5天到15分鐘,單客服務(wù)成本降低75%,效率提升超過30倍。
同樣,在電商行業(yè),百度網(wǎng)盤的智能多模態(tài)加工不僅針對?像精修,還能通過AI為圖?更換所需要的背景,通過智能扣圖然后匹配相應(yīng)的場景制作新的商品圖。
類似這樣針對特定行業(yè)的AI技術(shù),其實不止百度一家在做,Adobe、Midjourney甚至還有專門的AI模特公司,但本質(zhì)上它們還是傳統(tǒng)的軟件,也就是原有鏈條的一個部分。
而百度網(wǎng)盤未來支持AI模特、營銷海報制作,就是在一鍵本地生成的基礎(chǔ)上減少鍵條,讓生產(chǎn)力得到最大化的提升。
再比如生命科學(xué)行業(yè),例如基因公司要將測序文件交付給醫(yī)院、學(xué)校或科研機構(gòu),數(shù)據(jù)往往高達幾百GB甚至1TB,百度網(wǎng)盤提供的文件交付解決方案支持TB級別的數(shù)據(jù)傳輸,能夠幫助客戶將超大文件既便捷又安全的完成交付。
網(wǎng)盤,技術(shù)推動信息化到知識化
過去十年,網(wǎng)盤行業(yè)經(jīng)歷了兩個階段。其一是數(shù)據(jù)化,人們習(xí)慣將本地文件上傳到云端,實現(xiàn)本地資源的釋放和分享;其二是信息化,沉淀在網(wǎng)盤的海量數(shù)據(jù),催生了個人、企業(yè)乃至行業(yè)高效利用數(shù)據(jù)的新需求。
比如用戶在需要它們的時候可以隨時調(diào)用,這個階段網(wǎng)盤的價值在于提供一個目錄或者索引,可以快捷高效的找到文件。
而未來十年,隨著信息化越來越高,用戶需求也會隨之轉(zhuǎn)向。
一方面,知識化是一個大方向的趨勢,AI將有用的信息梳理成知識,無論是即時的還是過往的,用戶都可以輕松快捷的找到它并知識化它。
什么是知識化?
信息化的特點是淺層理解與離散化,而知識是信息的集合,是從相關(guān)信息中過濾、提煉及加工而得到的有用資料。知識基于推理和分析,還可能產(chǎn)生新的知識。
而百度網(wǎng)盤的知識化,可以將其理解為提供了一種對信息的理解、記憶、推理和連接的能力。它的作用類似汞,能從金砂中提煉出黃金。
三年前,百度網(wǎng)盤曾對行業(yè)未來作出判斷。認(rèn)為網(wǎng)盤能力將活躍于包括手機、音箱、電視在內(nèi)的智能終端,用戶可以“隨時隨地上傳數(shù)據(jù)到云端,或在終端呈現(xiàn)內(nèi)容”。同時,用戶會更愿意直接在網(wǎng)盤操作和處理數(shù)據(jù),而不是將其下載到本地。
今天百度網(wǎng)盤知識化的越級,對應(yīng)的正是三年前的這個預(yù)判。
基于這些,未來百度網(wǎng)盤就能依托知識化構(gòu)建網(wǎng)盤第二大腦,成為每個人都擁有的個人數(shù)字助理。
而這背后,都離不開百度長久以來對技術(shù)的長久投入和創(chuàng)新。
比如文字理解,百度網(wǎng)盤采用圖像預(yù)訓(xùn)練大模型技術(shù),能夠利用更多的上下文信息,并通過自監(jiān)督的思路提高效率和準(zhǔn)確率。
再比如圖像理解,依托文心大模型,百度網(wǎng)盤將模型規(guī)??s小,成本下降的同時效率上去了。依托文心大模型,百度網(wǎng)盤的的解決方案百度網(wǎng)盤的的解決方案,在16個場景中有10個領(lǐng)域處于領(lǐng)先地位,并已廣泛應(yīng)用于網(wǎng)盤的照片故事和圖片視頻搜索中,支持復(fù)雜語義和多模態(tài)的搜索能力。
還有人像美化,除了提供基本的人像美化效果與競品一致外,在保持效果的前提下,百度網(wǎng)盤將部分核心模型大小壓縮到百KB,推理耗時降低到百毫秒。
最后是音視頻理解。百度網(wǎng)盤的自動語音識別(ASR)涵蓋了中、英、韓等多個國家的語言,識別和翻譯準(zhǔn)確率也處于行業(yè)領(lǐng)先地位。
尾聲
讓我們回到開頭的例子:《西部世界》和《星際穿越》都是科幻電影,但它們對于AI的立意卻是截然相反:前者刻畫了AI覺醒,而后者則是描述了AI為人類貢獻。
今天我們能體驗到的AI,包括百度網(wǎng)盤、chatGPT、Midjourney等等,它們現(xiàn)存的形態(tài)亦或者未來的進化方向,基本都是一類的,智能協(xié)同、彼此優(yōu)勢互補,實現(xiàn)更高效、更準(zhǔn)確的工作成果。
百度網(wǎng)盤結(jié)合AI實現(xiàn)過目不忘和出口成章,是拓寬了我們語言的邊界,但它背后是人類不斷通過創(chuàng)造工具來增強自我的進化過程。
同時,人不是AI,人有語言與知識,也有體驗與感知。這是屬于我們更大的世界。
如果把語言和知識比做“讀萬卷書”,也許AI能比人做的更好。
但是體驗與感知是“行萬里路”,這里不是單純的指去旅游,而是用心去生活,去體會,去感悟,這是AI所無法替代的。
最后和大家分享一句話:AI是工具,人生是體驗。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 華為研發(fā)中心入駐上海青浦致小鎮(zhèn)房租大漲,帶動周邊租房市場熱潮
- 華為員工涌入蘇滬兩地,房東狂歡:租金幾近翻倍,跨省租房成新常態(tài)
- 制造業(yè)巨頭空客計劃裁員2500人,應(yīng)對航天業(yè)務(wù)虧損與供應(yīng)鏈挑戰(zhàn)
- 科技創(chuàng)新引領(lǐng)產(chǎn)業(yè)發(fā)展:江陰市與清華大學(xué)攜手推進重大科技項目
- 美國或再升級出口管制:考慮限制AI芯片對中東出口
- 劉強東章澤天報案:京東發(fā)言人證實夫婦倆遭有組織造謠,警方已介入
- 東方甄選擬15億出售教育業(yè)務(wù)
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設(shè)立5億元AI創(chuàng)投基金
- 聯(lián)想發(fā)布 ThinkStation P8工作站
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。