人工智能“頂流”齊聚WAIC 2024,他們都做了什么?

科技云報道原創(chuàng)。

一個由智能驅(qū)動的未來世界長啥樣?

從完成跨??绯呛骄€的“空中的士”、全無人駕駛汽車、實現(xiàn)奔跑功能的全尺寸通用人形機器人到百度文心一言、訊飛星火、阿里通義千問、華為盤古、商湯日日新等大模型,從智能制造引領(lǐng)的“燈塔工廠”到融入生活、人人可體驗的智能應(yīng)用,一個千帆競渡、百舸爭流的智能時代正緩緩向我們伸出觸手,引領(lǐng)我們走向無限可能的未來。

7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(以下簡稱“WAIC 2024”)在上海啟幕。

作為世界級AI科技盛會,本屆大會以一場開幕式和三場全體會議——全球治理、產(chǎn)業(yè)發(fā)展、科學(xué)前沿為引領(lǐng),全面覆蓋AI倫理治理、大模型、數(shù)據(jù)、算力、具身智能、AI for Science、智慧工業(yè)、自動駕駛、投融資、教育與人才共十大重點話題,匯聚超過1000位全球領(lǐng)軍人物,包括圖靈獎、馬爾獎、菲爾茲獎得主,科研機構(gòu)、知名學(xué)者,世界500強企業(yè)代表等專家和行業(yè)人士,為人工智能技術(shù)的創(chuàng)新與發(fā)展注入新的活力。

當(dāng)人工智能從“淺水區(qū)”邁向“深水區(qū)”,相關(guān)的研究理論出現(xiàn)分化與爭議,研發(fā)投入與盈利能力之間的矛盾日益凸顯,政、產(chǎn)、學(xué)、研各界正沿著不同的路徑探索人工智能時代的未來。本屆大會,螞蟻集團、超云、智譜AI等國內(nèi)AI領(lǐng)域“頂流”廠商業(yè)界全面展示了前沿技術(shù)研究和最新應(yīng)用成果。

產(chǎn)業(yè)為根應(yīng)用為錨人工智能觸手可及

大會開幕當(dāng)天,WAIC2024公布八大“鎮(zhèn)館之寶”,包括螞蟻集團基于百靈大模型的“AI智能助理”、阿里云通義靈碼、智譜AI基座大模型、聯(lián)想集團筆記本YOGA Book 9i AI元啟、商湯Vimi可控人物視頻生成大模型 、特斯拉賽博越野旅行車 、智能飛行器展區(qū)展出的三家電動垂直起降航空器(eVTOL)創(chuàng)新產(chǎn)品。作為本屆世界人工智能大會的展覽最高榮譽,“鎮(zhèn)館之寶”旨在獎勵并展示全球人工智能領(lǐng)域的最新技術(shù)成果、發(fā)展趨勢及商業(yè)潛力。

在產(chǎn)業(yè)發(fā)展主論壇上,螞蟻集團董事長兼CEO井賢棟表示,專業(yè)智能體能夠破解通用大模型在嚴謹產(chǎn)業(yè)應(yīng)用的關(guān)鍵難題,螞蟻集團正在攜手產(chǎn)業(yè)合作伙伴構(gòu)建專業(yè)智能體生態(tài),加速產(chǎn)業(yè)應(yīng)用,推動服務(wù)升級。“在人工智能時代,我們也在探索,讓AI像掃碼支付一樣便利每個人的生活,讓AI技術(shù)發(fā)展的紅利惠及更多人?!?/p>

通過科技的力量,降低人工智能應(yīng)用門檻,實現(xiàn)人工智能技術(shù)普惠化,是螞蟻集團一直以來的希望。作為國內(nèi)較早布局AI大模型的廠商,螞蟻自研的百靈大模型2023年已通過備案,并以此為內(nèi)核打造了“三個管家”,分別是AI生活管家、AI金融管家和AI醫(yī)療健康管家。這三個管家對應(yīng)的生活、金融和醫(yī)療等場景,都需要嚴謹專業(yè)優(yōu)質(zhì)的服務(wù)。

當(dāng)前,通用大模型落地嚴謹產(chǎn)業(yè)面臨著三個“能力短板”:領(lǐng)域知識相對缺乏、復(fù)雜決策難以勝任、對話交互不等于有效協(xié)同。井賢棟介紹,為了破解這些難題,螞蟻選擇了構(gòu)建專業(yè)智能體生態(tài)的路徑,“從我們的實踐來看,專業(yè)智能體是大模型落地嚴謹產(chǎn)業(yè)的有效路徑?!?/p>

由于垂直領(lǐng)域、高質(zhì)量的數(shù)據(jù)往往以多種模態(tài)存在,對隱私保護和資產(chǎn)價值保護的要求高,很難直接“喂給”通用大模型。為此,螞蟻依托知識圖譜、密態(tài)計算等技術(shù),構(gòu)建了大規(guī)模專業(yè)知識引擎,可以將垂直領(lǐng)域不同類型的數(shù)據(jù),抽象成不涉及隱私信息的領(lǐng)域知識,成為大模型的“專業(yè)教材”,供大模型訓(xùn)練學(xué)習(xí),也能讓大模型在推理中隨時“查閱”。這些“專業(yè)教材〞,是螞蟻提升大模型的領(lǐng)域?qū)I(yè)性、打造專業(yè)智能體的核心能力。

其次,針對大模型復(fù)雜推理的能力短板,螞蟻提出了FoE專家級決策框架(Framework of Experts),讓智能體借鑒人類專家的思考方式,構(gòu)建專業(yè)的推理和決策能力。嚴謹產(chǎn)業(yè)中存在大量的專業(yè)決策框架及公認的行業(yè)最佳實踐,大模型要達到專業(yè)水準,必須謙虛地向?qū)<覍W(xué)習(xí)。

作為生活服務(wù)的“數(shù)字接口”,AI智能助理成為專業(yè)智能體生態(tài)的平臺入口。用戶通過與智能助理的對話,就能一鍵連接生活、金融、醫(yī)療等垂直行業(yè)的AI智能體,獲得更專業(yè)豐富的服務(wù)。

以投資研究智能體支小助為例,學(xué)習(xí)金融專家的分析推理框架后,在接到不同的投研任務(wù)時,它會動態(tài)學(xué)習(xí)專家的思考方式,模仿專家的思路進行分析和生成,可以實現(xiàn)媲美人類專家的金融分析能力,目前支小助已經(jīng)為超百家金融機構(gòu)提供服務(wù),其服務(wù)水平已經(jīng)趨近于真人行業(yè)專家,為用戶在金融投資方面提供專業(yè)化決策。

在醫(yī)療健康領(lǐng)域,螞蟻和浙江衛(wèi)健委聯(lián)合推出數(shù)字健康管家“安診兒”,背后就是一個連接著多家醫(yī)院、多個醫(yī)療機構(gòu)的智能體生態(tài)。安診兒的服務(wù)貫穿診前、診中、診后,覆蓋掛號、咨詢、用藥、健康科普等26個環(huán)節(jié),用戶通過語音就可以喚醒的專業(yè)智能體,能為患者就醫(yī)提供諸如導(dǎo)診掛號、問診陪護、醫(yī)療報告查詢、健康管理等專業(yè)服務(wù),對老年人、異地就醫(yī)群體尤其友好。今年,安診兒將升級為2.0版本,真正帶來全流程的就醫(yī)智能體網(wǎng)絡(luò)。

在“隱私計算:助力大模型與數(shù)據(jù)可信融合發(fā)展”分論壇上,螞蟻集團聯(lián)合中國電信集團有限公司、中國信息通信研究院華東分院、浙江大學(xué)區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室等國內(nèi)外行業(yè)專家、學(xué)者,從技術(shù)前沿、標準體系、實踐成果等維度,共話下一代隱私計算技術(shù)創(chuàng)新和應(yīng)用。

大模型的發(fā)展不僅為密態(tài)計算帶來了更大的市場空間,同時也在促進密態(tài)計算技術(shù)的不斷演進。在論壇上,螞蟻集團全新發(fā)布“隱語Cloud”大模型密態(tài)計算服務(wù)。該服務(wù)依托于螞蟻全??尚烹[私計算技術(shù),不僅提供了密態(tài)推理、密態(tài)微調(diào)等一站式服務(wù),實現(xiàn)多重數(shù)據(jù)防御,全面適用于多種場景,從用戶查詢的隱私到訓(xùn)練數(shù)據(jù)的安全,再到模型IP的保護,使用戶可以低成本、高效率地獲得密算服務(wù)。

作為本屆WAIC的重磅發(fā)布,螞蟻集團首發(fā)了國內(nèi)首個大模型安全一體化解決方案“蟻天鑒 2.0”。蟻天鑒是業(yè)內(nèi)首個實現(xiàn)產(chǎn)業(yè)級應(yīng)用的大模型安全評測與防御一體化解決方案,可保障大模型的生產(chǎn)和使用更加安全、可控、可靠。

相比1.0版本,蟻天鑒 2.0新增了兩項評測能力,一個是“大模型X-ray”,可針對大模型的內(nèi)在神經(jīng)元進行X光掃描來做探查和判斷,讓研究人員了解大模型內(nèi)部在發(fā)生什么、定位可能引發(fā)風(fēng)險的神經(jīng)元、并進行編輯修正,在模型內(nèi)部治理幻覺,實現(xiàn)從源頭識別和抑制風(fēng)險。第二是“大模型基礎(chǔ)設(shè)施評測”。從攻擊者視角出發(fā),深入掃描模型算法組件及模型軟件系統(tǒng),可及時準確發(fā)現(xiàn)大模型供應(yīng)鏈及運行環(huán)境安全問題,保障云到端的應(yīng)用安全可控。

面對新技術(shù)的濫用場景,蟻天鑒還推出了“AI鑒真”解決方案,支持多模態(tài)內(nèi)容真實性和深度偽造檢測,可快速精準鑒別圖像、視頻、音頻、文本內(nèi)容的真?zhèn)?,有效?yīng)對AI換臉、聲音模擬、證件偽造等各類深度偽造風(fēng)險場景,圖像識別準確率99.9%達到行業(yè)最高優(yōu)秀級別。

在大會展區(qū)的螞蟻集團“AI鑒真中心”,展出了包括多模態(tài)AI鑒真、“諜影重重”深度偽造(Deepfake)互動,為普通人揭開“聲音模擬、AI換臉”的真相,讓公眾進一步了解到反深偽技術(shù)的發(fā)展,守護人們的安全。

該互動模擬了蟻天鑒AIGC檢測和證照深度合成檢測兩大能力,對抗聲音模擬、證件偽造等AI濫用風(fēng)險場景的過程?!肮舳恕蹦M了常見偽造手法,涵蓋證照、視頻等多樣化素材可供選擇,可對“防御端”檢測模型進行攻擊。該產(chǎn)品依托生成模型構(gòu)建TB級樣本,實時攻防對抗,快速精準鑒別圖像、視頻、音頻、文本內(nèi)容的真?zhèn)尾⑿纬蓹z測報告,從而幫助用戶識別和評估相關(guān)素材是否被篡改或深度生成,防御AI技術(shù)的潛在濫用。同時,螞蟻集團特設(shè)“諜影重重之 Deepfake 互動展”,用戶上傳一張照片就可以生成仿真視頻。通過場景化的體驗,讓觀眾對人工智能安全有著更為直觀的了解和認識。

算力為基大模型為擎,硬核技術(shù)異彩紛呈

在本屆WAIC期間,智譜AI展示了最新的人工智能技術(shù)應(yīng)用成果。自新一代基座大模型GLM-4問世以來,已經(jīng)有超過30萬個智能體活躍在清言的智能體中心內(nèi),其中包括了諸如思維導(dǎo)圖、文檔助手、日程安排等許多出色的生產(chǎn)力工具。這些智能體基于GLM模型自身強大的能力以及開發(fā)者的想象力,能夠越來越高效和精準地幫助用戶解決問題。

清言智能體不僅擁有1億字龐大的知識庫,支持文字、表格、音頻等多種文件格式和URL導(dǎo)入,還能遞歸抓取信息,更配備了思維導(dǎo)圖、流程圖、高德地圖、新浪微博、飛書日歷、什么值得買、微信公眾號等眾多實用工具,與工作生活無縫對接,讓AI從數(shù)字世界走向現(xiàn)實。

清言智能體大幅降低了人工智能工具的應(yīng)用門檻,只需一鍵點擊,便可輕松實現(xiàn)開箱即用,為用戶工作生活帶來更多便捷與創(chuàng)新。無論是有經(jīng)驗的開發(fā)者,還是不會編程的新手,都能通過簡單的自然語言,讓創(chuàng)建一個具備人設(shè)、能自主搜索、圖文轉(zhuǎn)化、運行代碼、使用工具的智能體,不再是一個需要數(shù)周乃至數(shù)月的開發(fā)過程,而是在幾分鐘內(nèi)就能實現(xiàn)簡單AI實踐。

人工智能技術(shù)的普及和應(yīng)用,推動了算力需求的快速增長。傳統(tǒng)的通用算力及信創(chuàng)算力已逐漸轉(zhuǎn)向通用AI算力和自主AI算力,以適應(yīng)更加復(fù)雜多樣的應(yīng)用場景。同時,算力空間的重構(gòu)也呈現(xiàn)出新趨勢,從分散的機房向樞紐節(jié)點的大規(guī)模投建轉(zhuǎn)變,推動了AI推理業(yè)務(wù)從中心向邊緣的拓展。

超云在AI算力基礎(chǔ)設(shè)施方面的算力產(chǎn)品家族和一體化AI解決方案悉數(shù)亮相,為人工智能技術(shù)的廣泛應(yīng)用提供了有力支撐。

5月,超云發(fā)布“AI IN ALL”發(fā)展戰(zhàn)略,其并非僅僅是硬件的簡單堆砌,而是對研發(fā)設(shè)計、專業(yè)定制、多元生態(tài)、融合集成、供應(yīng)能力以及整體解決方案能力的全面挑戰(zhàn)與考驗。此戰(zhàn)略的核心在于構(gòu)建一個全方位、一體化的AI解決方案體系,通過生態(tài)系統(tǒng)的深度融合與多方資源的協(xié)同合作,加速企業(yè)數(shù)字化轉(zhuǎn)型與智能化升級的步伐。

憑借在多元算力、智能管理、高效算能、堅實安全底座等方面的優(yōu)勢,超云打造了涵蓋智算、信創(chuàng)、云系統(tǒng)、云計算在內(nèi)的全棧算力產(chǎn)品家族,通過融合AI技術(shù),實現(xiàn)了算力、存儲、云和融合管理的無縫銜接,在提升系統(tǒng)便捷性、穩(wěn)定性和運維效率的同時,顯著降低了管理和運維成本。

回顧近年,超云在AI算力基礎(chǔ)設(shè)施領(lǐng)域持續(xù)創(chuàng)新,為行業(yè)帶來了多項突破,其更加注重打造訓(xùn)練和推理服務(wù)器的競爭力。尤其是在推理層面,超云更是將其提升至公司戰(zhàn)略層面,立下了“推理之巔、超云為先”的目標。目前,超云已完成了AI推理的全棧生態(tài)搭建,大模型、高密度、液冷、邊緣等各類推理機器不僅符合國內(nèi)的實際需求,而且在性能、成本和使用便利性等方面都達到了較高水平。

另一個技術(shù)狂想:具身智能的爆發(fā)點

機器人行業(yè)中一直存在一個經(jīng)典悖論——物理世界中最難解決的“容易”問題。如蹲下、起身、跳躍、轉(zhuǎn)圈等等,對機器人來說,這些簡單的動作都需要極為復(fù)雜的機械控制系統(tǒng)來實現(xiàn)。而現(xiàn)實生活中常見的簡單任務(wù),如做飯、沖咖啡、搬貨,把流程分解成每一個動作,并且要做到“不走形”。這一類“容易”問題層層累加,難度是指數(shù)級遞增的。

與基于軟件平臺的“對話機器人”的邏輯推理、或者更高層次的“生成式涌現(xiàn)”不同,目前活躍在一線的商業(yè)機器人、工業(yè)機器人整體走的還是自動化控制路線,需要解決的更多是機械控制問題。要解決這些問題,算法是有邊界的,大多數(shù)研發(fā)與工程瓶頸被卡在傳感器、控制器這一類硬件單元上,軟硬件的智能融合處于非常早期探索階段。

大模型在自然語言連續(xù)對話、通識理解、少樣本/零樣本學(xué)習(xí)等能力方向的突破,補全了讓機器人產(chǎn)業(yè)從1%到10%躍升的技術(shù)基礎(chǔ),這也是業(yè)內(nèi)看中機器人+大模型的主要原因,使得機器人在軟件層面終于看到了變革的曙光。

特斯拉帶來的Optimus二代人形機器人,更靈活,可操作任務(wù)更復(fù)雜。第二代機器人在AI大模型的加持下,體重比一代更輕,步行速度加快,身體控制能力增強;手部關(guān)節(jié)全新升級,活動更加自然,手指部分搭載觸覺傳感器,甚至能完成抓雞蛋等精細活。同時,Optimus二代還可以做多個深蹲動作,顯示出其平衡能力有所增強。

傅利葉發(fā)布了首款全尺寸人形機器人GR-1,并率先實現(xiàn)量產(chǎn)交付。一年來,研發(fā)團隊在仿真環(huán)境中訓(xùn)練GR-1,再將訓(xùn)練好的模型遷移到現(xiàn)實世界。通過遠程遙操采集人類的動作數(shù)據(jù),用于訓(xùn)練和改進仿真模型,GR-1得以模仿學(xué)習(xí)人類運動,完成跳舞、打鼓、放置物品等日常生活動作。GR-1還能在戶外復(fù)雜地形如草地、非平整路面及泥濘斜坡上順利行走,實現(xiàn)穩(wěn)定、自主的運動控制表現(xiàn),為機器人在實際應(yīng)用中的高效作業(yè)打下堅實的基礎(chǔ)。

每一次技術(shù)革新都推動著人類文明的腳步不斷向前。在科技的璀璨星河里,我們躍入了嶄新的人工智能時代,如同一個巨大的熔爐,匯聚著無數(shù)的機遇與挑戰(zhàn),冷思考與熱驅(qū)動在這里碰撞出絢爛的火花。這個時代還有很多問題需要面對和解決,但翻越一座座大山之后,我們終將抵達遼闊的星辰大海。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-07-08
人工智能“頂流”齊聚WAIC 2024,他們都做了什么?
科技云報道原創(chuàng)。一個由智能驅(qū)動的未來世界長啥樣?從完成跨??绯呛骄€的“空中的士”、全無人駕駛汽車、實現(xiàn)奔跑功能的全尺寸通用人形機器...

長按掃碼 閱讀全文