網易 AI Lab 榮獲INTERSPEECH 2020 雙料冠軍

近日,全球最大的語音會議 INTERSPEECH 2020 公布了 SdSV 聲紋識別比賽成績,網易 AI Lab 從眾多國際頂級隊伍中脫穎而出,獲文本相關聲紋識別賽道綜合排名第一、單模型第一的雙料冠軍。此次獲獎,彰顯了網易 AI Lab 在語音聲紋識別技術領域的領先地位。

網易 AI Lab 榮獲INTERSPEECH 2020 雙料冠軍

INTERSPEECH會議是全球最大的綜合性語音信號處理領域的科技盛會,業(yè)內享有極高的聲譽,對參與企業(yè)有著嚴苛的準入門檻要求。本次國際聲紋識別比賽的參賽隊伍來自國際多家知名高校與企業(yè),包括近兩年全球各項聲紋識別比賽中的“常勝將軍”:布爾諾工業(yè)大學、新加坡通信研究院、約翰霍普金斯大學等。

比賽采用 MinDCF(最小檢測代價)和 EER(等錯誤率)作為評測指標。網易 AI Lab 的單模型在兩個指標均為最佳,其中 EER 達到了 1.67%,相比第二名降低了 11.6%,并遠低于比賽 X-Vector 基線系統(tǒng)(EER=9.05%)。

除了在綜合指標上的領先外,網易 AI Lab 基于常見的 X-Vector 和 PLDA 算法,創(chuàng)新地提出了一種 ASR-free 的文本相關聲紋識別算法。相比傳統(tǒng)的 Deep Speaker Embedding 方法,該算法不需要依賴語音識別, 就能夠在多語言環(huán)境下,同時完成說話人和文本內容的驗證。

聲紋識別技術以往多應用于安防等場景中,而網易 AI Lab 則創(chuàng)新性的將聲紋識別技術與游戲場景結合,除了進行游戲身份驗證,還能夠針對音色對用戶進行分類、豐富玩家畫像,從而更加精準地為玩家推薦志趣相投的好友、匹配實力相當的對手,為玩家?guī)砀玫挠螒蝮w驗。

積極探索人工智能技術與應用場景的結合,是網易布局人工智能的重要方向之一。近日,網易CEO丁磊也在2020世界人工智能大會上表示,人工智能不是技術問題,是應用場景問題。

網易 AI Lab 榮獲INTERSPEECH 2020 雙料冠軍

近幾年,網易結合自身業(yè)務,在計算機視覺和智能語音語言方面做了多項應用場景的落地。比如,去年《一夢江湖》與網易互娛AIlab合作推出全新功能——AI智能捏臉。該功能通過人臉特征的映射采用“人臉屬性識別”和“自適應參數映射”技術,將人臉視覺特征與捏臉參數相匯通。AI捏臉不僅會保留照片原有的五官、形狀、布局,還會保留照片上例如微笑、悲傷等細節(jié)神態(tài),使臉型傳神又真實。用戶只需上傳一張真人照片,就可以獲得便捷、智能、多元化的捏臉體驗,該玩法一經推出,便受到許多用戶歡迎。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )