5月14日結束的OpenAI發(fā)布會推出其最新旗艦模型GPT-4o,展現了AI技術愈發(fā)強大的能力。在人工智能飛速發(fā)展、大模型不斷涌現的今天,適逢訊飛星火大模型發(fā)布1周年。這一年里,訊飛星火給虛擬人帶來很多驚喜與變革。
(圖片由訊飛星火生成)
虛擬人本質上是對人的一種數字化模擬,具備三大特征:外觀、行為、思想。這些特性的實現依賴一系列先進技術的融合,如圖像識別、3D建模、動作捕捉、自然語言處理、計算機視覺等。目前訊飛星火大模型對虛擬人的賦能,體現在如下方面。
①形象定制更輕量:秒級構建
依托星火大模型,訊飛智作上線“秒級聲音/形象構建”功能,可以實現聲音和形象的快速制作!
訊飛智作“秒級聲音&形象構建”功能頁面
只需10秒以內的個人形象視頻素材,通過AI算法提取外貌特征、聲音特點等要素,系統能在極短時間內生成個人“數字化分身”。同時還支持形象模型的自訓練、標準訓練,滿足虛擬人在不同場景下的應用需求。
根據真人主播生成的虛擬主播“安小佳”
根據真人主播生成的虛擬主持人“小俊“
黑龍江中醫(yī)藥大學王金環(huán)教授“數字分身”
教培、媒體傳播、科技服務、客服導覽、短視頻制作等多種場景,涉及不同內容需求,訊飛智作都能很好地滿足。
②行為驅動更真實:超擬人聲音+AI生成動作
1月30日發(fā)布的星火語音大模型可實現超擬人對話,聲音效果接近人類日常生活的口語表達狀態(tài),擁有呼吸嘆氣、變語速、停頓思考、輕重讀、語氣詞(嗯、啊)等副語言能力。此外,大模型對情緒的感知度達85%+,能更生動地表達高興、抱歉、撒嬌、困惑等情緒。
目前超擬人聲音已上線訊飛智作,包含“聆小琪”、“聆小珊”、“聆玉言”、”聆玉昭“、“聆飛哲”5款男女發(fā)音人。無論是日常閑聊,還是復雜專業(yè)的問答咨詢,這樣的聲音都能更好地表達性格與情感。
超擬人聲音內容更真實
除聲音之外,動作也是虛擬人交互的關鍵要素。大模型技術加持下,可以對語義文本進行深度理解,自動匹配和生成動作,讓虛擬人動作更加自然、流暢和逼真,也更有生命力。
多樣化姿態(tài)場景更豐富
AI生成動作互動更自然
目前訊飛智作新上線多款虛擬人形象,支持AI生成動作,搭配場景化視頻模板,讓內容效果更貼近真實場景。
③交互大腦有意識:虛擬人智能交互機再進化
虛擬交互的升級,意味著用戶與虛擬人之間的溝通互動更自然、高效和智能。
作為一款集合先進語音識別、自然語言處理和機器學習技術的智能設備,虛擬人智能交互機在星火大模型加持下,不斷升級其智能感知能力、語義理解能力、情感表達能力,讓虛擬人與用戶的“面對面”交流問答更有效、更開放。
目前,智能交互機已在金融、政務、文旅、商業(yè)、展會等多個領域大規(guī)模應用。圓明園、明中都、駱崗公園等景區(qū),全國兩會、北京冬奧會、成都大運會等重大場合,都能見到它。
明中都遺址公園虛擬導游小可進行景區(qū)導覽
圓明園遺址公園虛擬導游可愛進行知識科普
科大訊飛打造的成都大運會虛擬志愿者小芙
虛擬人智能交互機亮相2023世界人工智能大會
北京冬奧虛擬志愿者愛加進行多語種交互問詢
先進的星火大模型給虛擬人帶來全面提升,不僅是外在形象、語言和動作上,更在于對虛擬人交互能力的升級,對虛擬人“自主意識”的增強,進而引領虛擬人“全新意識”。
作為新質生產力代表,訊飛智作始終堅持踐行人工智能+,讓虛擬人成為人類伙伴。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )