被互聯網女皇看好的語音,將成為巨頭爭奪的焦點

KPCB合伙人、享有“互聯網女皇”稱號的瑪麗·米克爾的互聯網趨勢報告于今天正式發(fā)布。毫不夸張地說,這份報告是互聯網行業(yè)分析的“超級碗”,它用200多頁的Keynote濃縮了全球龐大而復雜的互聯網發(fā)展現狀和趨勢,是互聯網從業(yè)者、投資人以及想要窺見互聯網風貌的外界人士不可多得的參考資料。

有人說,今年報告亮點不多,在我看來,亮點卻非常之多:不僅覆蓋了手機、電商、社交、廣告等基本面,還點名了移動營銷、網絡直播、智能汽車諸多正在崛起的所有新興領域。與IDC等機構報告不同的是,女皇報告更側重于行業(yè)現象概括和行業(yè)趨勢展望,事實證明,她對未來趨勢的評判準確率相當之高。而今年報告最大亮點在于:語音。213頁的Keynote,23頁給了語音,篇幅遠遠超過汽車、直播等領域,僅次于每年的重頭戲即“營銷”的31篇。

女皇認為麥克風正在取代鍵盤

瑪麗·米克爾認為,語音正在被重塑,成為人機交互的新范式,在過去75年里,每10年就有一次人機交互的重大革新,人類對機器的操作,從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏,而現在語音成為了重要的交互方式。

在其看來,語音交互相對于傳統(tǒng)交互而言具有以下特點:輸入更快速,人類每分鐘可說出150個單詞,打字卻只能完成40個單詞;使用更簡單,不需要用手和眼,時間更及時,不需要任何學習;更加個性化,機器可基于上下文、環(huán)境、位置、語調等大環(huán)境更好地理解人類的需求。從技術角度來看,語音計算具有成本低、尺寸小的特點,特別適合物聯網。

為何語音現在會爆發(fā)?瑪麗·米克爾認為:

1、技術成熟是核心原因之一。如果語音識別準確率從95%提升到99%將從量變引發(fā)質變,即“爆發(fā)點”到來,語音識別準確率已從2010年的70%上升到今年的90%,百度、谷歌、Hound等平臺的語音識別準確率已超過90%,針對戶外嘈雜環(huán)境和講話者特性的語音識別是下階段的攻克重點。

2、語音交互應用正在日益變多。語音搜索正在蠶食搜索份額,百度、谷歌的語音搜索在近十年來均取得了數十倍的增長,其中安卓、百度和必應語音搜索比例分別達到20%、10%、25%;以Siri為代表的語音助手正在快速普及,美國用戶使用這類工具的比例,已從2013年的30%增加到2015年的65%。因為語音能夠解放雙手和眼睛,人們越來越多地在車里、家里和隨身使用語音。相關數據顯示,從2014年到2016年間,全球API調用百度語音識別以及文本轉語音(TTS)的每日使用量急速攀升,百度語音在百度產品中使用率快速增長。

3、語音吸引更多第三方開發(fā)者。開發(fā)者擁抱語音大幅增加了支持語音交互的軟件和硬件,女皇重點闡述了Amazon眼下炙手可熱的硬件:Echo。其內置了Amazon Alexa語音助手,目標是占領家居、汽車、手機的麥克風,還能智能購物。這款產品銷量已突破400萬臺。女皇更是大膽指出:語音拐點已經到來,在2015年智能手機銷量下滑之后,Echo銷量或將騰飛。

英雄所見略同。在瑪麗·米克爾預測語音會成為核心交互方式的同時,科技巨頭早已在這一領域大力投入。2014年百度世界大會上李彥宏預測:五年內語音和圖像搜索比例有可能突破50%。百度在人工智能上一項顯著的進展便是基于深度學習的Deep Speech在噪音環(huán)境下的語音識別效果超越了谷歌,這一研究成果在瑪麗·米克爾的報告中被提及,該項技術已成功應用到百度語音搜索上。目前,百度語音搜索已通過人工智能做到了“聽”和“說”,而且還嘗試完成人類復雜的行為——溝通。集成語音識別、語義理解、深度問答、知識推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等能力于一身后,相較于鍵盤輸入,百度語音搜索已經能夠滿足用戶的多種復雜需求,引領人機交互邁入聽說時代。

此外,不久之前的谷歌I/O大會上,最亮點產品是類似于Echo的Google Home,其內置了Google Assitant語音助手。而在即將召開的蘋果開發(fā)者大會WWDC上,iOS 10最大亮點很可能會是Siri。語音是下一站,已成全球共識,“麥克風+觸摸屏”取代“鍵盤+鼠標”,已是大勢所趨。

語音正在多個領域全面開花

“女皇報告”重點提到了語音的三大典型應用:搜索、助理和Echo,一個重要事實是,語音不只是在這些領域發(fā)揮作用,在許多領域,它都比鍵盤越來越有存在感。

1、語音搜索:移動搜索的重要分支

谷歌、百度、Bing,全球主流搜索引擎的語音搜索比例都在逐步增加,麥克風圖標變得跟搜索框一樣重要。搜索引擎來自移動端的搜索流量均已超過50%,人們在自帶麥克風的移動設備上使用語音更方便,而在移動場景下打字并不方便。有報告指出,百度語音搜索的整體用戶量在2015年增長超過3倍,用戶中的90后和00后的人群占比接近50%,百度語音搜索已經成為眾多年輕人移動互聯網生活的標配,優(yōu)勢在于省去了中英文輸入法切換的繁瑣、支持口語化多輪交互、能夠提供貼心的語音播報和有聲搜索。

2、語音助手:不再是被調戲的玩具

幾年前,Siri這是一個被調戲的玩具?,F在,它可以理解很多命令,比如設置鬧鐘、添加日歷,打開App等,語音助理已完成從玩具到工具的蛻變。除了Siri之外,Windows內置的Cortana、Google Now升級而來的Google Assitant,以及百度、搜狗、科大訊飛等公司均推出了自己的語音助理軟件。以百度推出的度秘為例,已經接入到手機百度APP,用戶可在手百端直接調用,使用語音對話的形式享受點餐、購物、路線、訂票等多項生活類服務??梢娨龊谜Z音助理并不容易,除了語音識別和語義理解之外,它必須要能“完成任務”,而這需要獲取其他設備和應用的控制權,而這一點只有巨頭才能做到,創(chuàng)業(yè)型玩家基本已經消失。

3、語音通訊:不再是昂貴的溝通

微信能夠成為超級App,一大重要原因在于它支持語音通信,類似于對講機的語音交互,給了人們在傳統(tǒng)手機通訊下前所未有的體驗。需要流量,但相對于傳統(tǒng)電話而言已很廉價。事實上,傳統(tǒng)電話也已被互聯網化,有信等網絡電話App的崛起表明,人們未來只需要為語音通訊花很少的錢。女皇說,語音是最有效率的交互方式。除此之外,語音還是最自然、最簡單和最有效的溝通方式,免費的語音通訊將會成為大勢所趨,運營商正在被逼著依靠販賣流量謀生。

4、語音內容:不再是冷門的形式

微博剛剛興起時,許朝軍做了一個啪啪,要做語音版的微博,后來發(fā)生的事情大家都知道了。不過,語音內容正在卷土重來。最近在行做的“分答”十分火爆,這款App集合了語音、打賞、共享經濟諸多新興模式,讓知識分享前所未有的有趣。而在去年,喜馬拉雅等網絡電臺崛起了。這些現象均表明,“聲音”依然會是十分重要的一類內容形態(tài),人們不會浪費耳朵這個重要器官,在許多場景下,“語音消費”都更適合,比如開車時,高德地圖與林志玲等明星合作的語音導航就取得很好的市場反饋。在許多垂直領域,例如教育,語音技術同樣在體現其重要性,比如通過語音技術做口語訓練。就是說,不只是“麥克風”變得重要了,“喇叭”也在變得重要。

5、語音硬件:隨時待命的助理

“女皇報告”說,Amazon Echo將要起飛。除了Echo之外,Google 已推出Google Home硬件,擁有Siri的Apple很可能會發(fā)布類似產品。為何“語音助理硬件”會普及?為什么不直接用手機上的Siri等助理呢?因為手機是個人設備,并不適合家庭成員共享;而當前的語音技術,讓手機支持“隨時待命可被喚醒”會很耗電,基于Echo等家用設備不需擔憂這個問題。正是因為此,類似于Echo的產品將成為接下來的爆點,國內巨頭同樣在布局,京東已推出叮咚智能音箱,阿里巴巴聯合科大訊飛推出了“飛兒”,語音技術成熟的百度近日推出的度秘實體機器人也成功入駐肯德基,通過多輪交互和語音語義理解等技術為用戶完成智能點餐的過程。除了專用的語音助理硬件,語音與電視、與汽車等硬件的整合也會加速,國內的“Echo”大戰(zhàn)即將爆發(fā)。

正如女皇報告所指出的那樣,語音即將成為最重要的交互方式之一,語音技術從量變到質變的引爆點已經到來。除了交互之外,語音還將在搜索、內容、通訊和硬件等領域全面開花,“麥克風”變得重要,“喇叭”亦將變得重要,關于聲音的戰(zhàn)爭已經拉開序幕。

微博@互聯網阿超 微信 羅超(luochaotmt)

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2016-06-02
被互聯網女皇看好的語音,將成為巨頭爭奪的焦點
KPCB合伙人、享有“互聯網女皇”稱號的瑪麗·米克爾的互聯網趨勢報告于今天正式發(fā)布。毫不夸張地說,這份報告是互聯網行業(yè)分析的“超級碗”

長按掃碼 閱讀全文