亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

【網(wǎng)易智能訊 8月11日消息】人工智能語(yǔ)音設(shè)備不僅僅是一臺(tái)可以表達(dá)觀點(diǎn)的自動(dòng)唱機(jī),它們很可能成為人機(jī)互動(dòng)的主要方式之一。

Alexa的誕生與技能擴(kuò)張

2012年8月31日,四名亞馬遜工程師注冊(cè)了一項(xiàng)基礎(chǔ)性專利,這項(xiàng)專利的內(nèi)容日后最終演變成了Alexa。專利涉及了一種人工智能系統(tǒng),該系統(tǒng)旨在與人類語(yǔ)言,這一世界上最大、最復(fù)雜的數(shù)據(jù)集進(jìn)行互動(dòng)。工程師當(dāng)時(shí)只需要使用11個(gè)單詞和一個(gè)簡(jiǎn)單的圖表就能描述它的工作原理。

一個(gè)男性用戶在一個(gè)安靜的房間里說(shuō):“請(qǐng)播放甲殼蟲樂(lè)隊(duì)的Let It Be。”

一臺(tái)小型臺(tái)式電腦回答說(shuō):“沒(méi)問(wèn)題。”

然后系統(tǒng)開始播放這首歌曲。

由此開始,家用語(yǔ)音人工智能成為了亞馬遜的一項(xiàng)重要業(yè)務(wù),而這一領(lǐng)域也成為亞馬遜與其科技界的競(jìng)爭(zhēng)對(duì)手們較量的重要戰(zhàn)場(chǎng)。谷歌,蘋果、三星和微軟都在這一領(lǐng)域投入了上千名研究人員和商業(yè)專家,以期待制造出可以同人類進(jìn)行交流,且便于使用的強(qiáng)大設(shè)備。

直到現(xiàn)在,我們還必須去打字、敲擊或者滑動(dòng)來(lái)解鎖設(shè)備和操作。而目前,新的用戶界面正在逐漸適應(yīng)人類,Witlingo公司的首席執(zhí)行官Ahmed Bouzid說(shuō)道。該公司制造了各種各樣適用于銀行、大學(xué)、法律公司和其他企業(yè)的語(yǔ)音驅(qū)動(dòng)應(yīng)用程序。

對(duì)于亞馬遜來(lái)說(shuō),其最初只是想制造一個(gè)自動(dòng)唱機(jī),但后來(lái)這一項(xiàng)目變得越來(lái)越大:它變成了一種基于人類數(shù)據(jù)并且可以不斷學(xué)習(xí)的人工智能系統(tǒng)。它生產(chǎn)的Echo和體積更小的Dot是無(wú)處不在的家庭好幫手,它們可以關(guān)燈,講笑話,或者讓你不用手就能知曉天下事。

他們還收集了大量關(guān)于用戶的數(shù)據(jù),這些數(shù)據(jù)被用來(lái)改善設(shè)備本身,并增加他們的功能。自2014年上市以來(lái),已經(jīng)售出了上千萬(wàn)臺(tái)的Alexa設(shè)備。據(jù)第三方機(jī)構(gòu)統(tǒng)計(jì),亞馬遜目前已經(jīng)占據(jù)了美國(guó)人工智能語(yǔ)音設(shè)備70%的市場(chǎng)。

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

(圖:溝通的原則:亞馬遜設(shè)備能聽懂的指令越來(lái)越多,以下是當(dāng)你想讓它調(diào)整房間燈光亮度時(shí),一些可以奏效或不能奏效的指令,紅色為不能奏效的)

目前,Alexa同超過(guò)50種智能照明系統(tǒng)合作,包括飛利浦、通用電氣和宜家等。 2016年,德語(yǔ)版的Alexa誕生,其他非英語(yǔ)語(yǔ)種的Alexa也將陸續(xù)誕生。但是,亞馬遜并沒(méi)有試圖從可與Alexa相連接設(shè)備的制造商那里獲得收入,這些設(shè)備包括智能恒溫器、燈泡等。不過(guò),照這樣的趨勢(shì)發(fā)展,未來(lái)亞馬遜與這些公司之間很有可能會(huì)簽訂收入共享合同或者是采取其他的支付方式。這三個(gè)市場(chǎng)中最小的一個(gè)是家庭自動(dòng)化市場(chǎng),在這一市場(chǎng)中每年的支出已經(jīng)超過(guò)了50億美元,而去年美國(guó)的零售總額為4.9萬(wàn)億美元。

如今,亞馬遜通過(guò)出售這些設(shè)備來(lái)賺錢,設(shè)備的價(jià)格從50美元到230美元不等,最高端的Echo show產(chǎn)品帶有視頻屏幕。如果選購(gòu)這些設(shè)備的用戶最終在亞馬遜龐大的網(wǎng)上商店中購(gòu)買了更多的商品,那么亞馬遜就能再賺上一筆(不過(guò)亞馬遜是不會(huì)透露這些數(shù)據(jù)的)。若要讓Echo像智能手機(jī)那樣普及,他們還需要更多的努力。為此,亞馬遜鼓勵(lì)獨(dú)立開發(fā)者在其平臺(tái)上開發(fā)新服務(wù),正如蘋果長(zhǎng)期以來(lái)與所做的那樣。

到目前為止,已經(jīng)出現(xiàn)了超過(guò)15000個(gè)這樣的“技能”或應(yīng)用程序。應(yīng)用程序構(gòu)建工具十分易于使用,以至于不具備太多知識(shí)的人現(xiàn)在可以在大約一小時(shí)內(nèi)打造出一個(gè)簡(jiǎn)單的技能。其中最受歡迎的應(yīng)用是優(yōu)步和Lyft的叫車服務(wù)。而Duds擁有48種不同的技能,可以以狂轟濫炸之勢(shì)詆毀它的聽眾。

而那些最具雄心的開發(fā)商中包括了制造、銷售與Alexa配合的硬件或服務(wù)的公司。例如,CapitalOne向其銀行客戶提供基于Alexa的賬單支付服務(wù)。而總部位于多倫多的Ecobee公司是一家智能恒溫器制造商,該公司生產(chǎn)的恒溫器可以受Alexa控制,用戶可以僅僅通過(guò)幾個(gè)簡(jiǎn)單的指令就能夠提高或降低室溫。

“我們的客戶都很忙,”Ecobee的首席執(zhí)行官StuartLombard說(shuō)。該公司現(xiàn)在從其與Alexa合作的產(chǎn)品中獲得的銷售額占總銷售額的40%,這些產(chǎn)品也成為了該公司10年來(lái)增長(zhǎng)最快的業(yè)務(wù)。

“為了回家,他們不得不忍受交通擁堵,然后他們還要給孩子們喂飯,換尿布,誰(shuí)知道還要干什么別的。”

“我們讓他們不用雙手就能完成一些工作,這樣他們就可以‘多管齊下’了。”

Google Home也有了數(shù)百萬(wàn)的銷量,蘋果和微軟也在研發(fā)他們自己的設(shè)備。這些努力的最終回報(bào)是有機(jī)會(huì)可以占領(lǐng)或至少可以影響三個(gè)重要的市場(chǎng):家庭自動(dòng)化、家庭娛樂(lè)和購(gòu)物。

雖然可能沒(méi)有太多人愿意和他們的冰箱交談,但不可否認(rèn)的是,生活方式在發(fā)生巨大改變。正如同智能手機(jī)改變了生活的方方面面,語(yǔ)音人工智能設(shè)備也在變革著我們的居家生活。為什么需要從床上爬起來(lái)去鎖門,或者是在大冷天還要去手動(dòng)開啟車上的暖風(fēng)呢?Alexa或是它的“親戚”們就能幫你做這些事了。

當(dāng)話語(yǔ)遇見AI

基于語(yǔ)音的人工智能技術(shù)之所以如此吸引消費(fèi)者,是因?yàn)樗鼭M足了人類的要求:它按照人類的交流方式進(jìn)行交流和思考,而使我們不再需要在鍵盤或屏幕上打字。

但這樣的技術(shù)同時(shí)也很難打造。人類在說(shuō)話時(shí)完全不考慮規(guī)律性。相反,我們打斷自己的話。我們的思維時(shí)常反反復(fù)復(fù)。我們還常常莫名其妙地說(shuō)出一些只言片語(yǔ),有時(shí)點(diǎn)頭有時(shí)搖頭,甚至有時(shí)支支吾吾說(shuō)不出話。對(duì)于人類,有時(shí)明明是在胡說(shuō)八道,我們?nèi)韵嘈抛约赫f(shuō)的話有道理。

數(shù)千名亞馬遜員工正在努力應(yīng)對(duì)這一挑戰(zhàn),這包括在其位于西雅圖、加州森尼維爾和馬薩諸塞州劍橋等地研究中心的研究人員們。即便如此,亞馬遜最近還在為1100個(gè)分布在各個(gè)部門的、和Alexa相關(guān)的工作崗位進(jìn)行招聘,其中包括215個(gè)機(jī)器學(xué)習(xí)專家職位。在公司位于劍橋的辦公室召開的一次會(huì)議上,經(jīng)過(guò)詢問(wèn)Alexa的首席科學(xué)家RohitPrasad關(guān)于為什么他需要這么多的人,以及他的研究團(tuán)隊(duì)何時(shí)才能完全建成等問(wèn)題。Prasad回答說(shuō):“你的問(wèn)題在我聽來(lái)簡(jiǎn)直太好笑了。我已經(jīng)從事了20年的語(yǔ)音技術(shù)研究工作,絕大多數(shù)時(shí)候,我們?nèi)〉眠M(jìn)展的速度都非常緩慢。然而,在過(guò)去的五年里出現(xiàn)了很多難逢的良機(jī)。”

發(fā)明一個(gè)真正奏效的語(yǔ)音激活式人工智能系統(tǒng)是一個(gè)非常復(fù)雜且尚未被攻克的難題。在過(guò)去,語(yǔ)言科學(xué)家們?cè)谠噲D一次性確定雜亂語(yǔ)句的具體含義時(shí)遇到了困難。而現(xiàn)在,新的機(jī)器學(xué)習(xí)方法另覓蹊徑,以期待能解決這一問(wèn)題:他們?cè)谝婚_始時(shí)就著手處理那些不完美的詞語(yǔ)搭配,繼而通過(guò)臨時(shí)性的猜測(cè)快速調(diào)整這些搭配。

Prasad表示:“問(wèn)題的關(guān)鍵是具備處理大量用戶數(shù)據(jù)的能力,并可以從之前的錯(cuò)誤中吸取教訓(xùn)。隨著Alexa同用戶相處的時(shí)間增加,它收集到的數(shù)據(jù)會(huì)越來(lái)越多,它也隨之變得越來(lái)越聰明。伴隨著這些進(jìn)步,越來(lái)越多的機(jī)會(huì)出現(xiàn),隨之而來(lái)也需要越來(lái)越多的人力。”這也就是為什么需要招聘這么多人的原因。

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

“讓我給你舉個(gè)例子,”Prasad說(shuō),“如果你問(wèn)‘阿黛爾的第一張專輯是什么’?答案應(yīng)該是《19》。如果你說(shuō)‘播放它’,那么Alexa就可以獲得足夠多的信息,并開始播放那張專輯。但如果有一些對(duì)話式的玩笑夾雜其間會(huì)怎么樣呢?如果你先問(wèn)一下專輯是哪一年出版的,它賣了多少?gòu)?,又?huì)發(fā)生什么呢?如果進(jìn)行了上述對(duì)話,最后用一個(gè)具有困惑性的‘播放它’結(jié)束,那么早期版本的Alexa可能就會(huì)被難住。而現(xiàn)在這項(xiàng)技術(shù)可以遵循一種思維方式,這使得它至少在部分時(shí)間可以意識(shí)到‘播放它’中的‘它’仍然意味著專輯《19》。”

這種改進(jìn)來(lái)自于機(jī)器學(xué)習(xí)技術(shù)對(duì)于此前數(shù)千次類似交流的反思,在這些交流中Alexa被搞糊涂過(guò)。系統(tǒng)了解了用戶真正想聽的是哪首歌曲,以及具體是在之前對(duì)話的什么地方出現(xiàn)了那首歌曲的名字。麻省理工學(xué)院口語(yǔ)系統(tǒng)小組的負(fù)責(zé)人JamesGlass說(shuō):“一開始你需要做一些關(guān)于人們?nèi)绾翁嵋蟮募僭O(shè),然后收集數(shù)據(jù),對(duì)你的模型進(jìn)行調(diào)整。”Glass表示,這種機(jī)器學(xué)習(xí)方法得到了廣泛的認(rèn)可,但如果想讓它發(fā)揮作用,那需要的數(shù)據(jù)則遠(yuǎn)遠(yuǎn)超過(guò)了大學(xué)研究人員所能掌握的。

隨著Alexa的使用量激增,亞馬遜現(xiàn)在擁有了一個(gè)巨大的人機(jī)對(duì)話數(shù)據(jù)庫(kù)——這讓它在改進(jìn)語(yǔ)音技術(shù)方面擁有了一定的優(yōu)勢(shì),而谷歌長(zhǎng)期以來(lái)一直憑借其文本搜索查詢獲得的數(shù)據(jù)進(jìn)行這樣的改進(jìn)。外部數(shù)據(jù)也是有幫助的:例如,2016年一個(gè)龐大的歌詞數(shù)據(jù)庫(kù)被載入了Alexa中,這可以幫助確保當(dāng)客戶提出想聽“drovemyChevytothelevee”(歌曲《American Pie》中的歌詞)時(shí),系統(tǒng)可以自動(dòng)播放歌手DonMcLean的名曲《American Pie》。

Prasad團(tuán)隊(duì)的一個(gè)最新項(xiàng)目凸顯了這一方法的靈活性。這一項(xiàng)目致力于破解用戶在何時(shí)會(huì)重新提及他們之前提過(guò)的要求。提示方式可能千差萬(wàn)別:有些人常說(shuō)“不,不,不”,但另一些人偏向于使用“停止那個(gè)”,也有人喜歡嘗試不同的表達(dá),比如“等一下,實(shí)際上,我是想這么做”。但Alexa不需要解碼所有的話語(yǔ)。大規(guī)模的樣本數(shù)據(jù)和半監(jiān)督式機(jī)器學(xué)習(xí)使系統(tǒng)能夠勾畫出一組可能的否定性語(yǔ)言標(biāo)記,之后它可以在這些表達(dá)出現(xiàn)變化時(shí),從這組標(biāo)記中找到一個(gè)易于理解的新的請(qǐng)求方式。

除了將Alexa打造成一個(gè)更好的聽眾之外,亞馬遜的人工智能專家還在使用大量的數(shù)據(jù)來(lái)讓它成為一個(gè)更好的演講者,對(duì)機(jī)器合成女聲的話語(yǔ)節(jié)奏進(jìn)行調(diào)整,以使其可以更好地被使用。傳統(tǒng)的語(yǔ)音合成依靠的是將眾多被記錄下的人類語(yǔ)言片段進(jìn)行融合。雖然這種技術(shù)可以產(chǎn)生一種相當(dāng)自然的聲音,但它并不能表達(dá)竊竊私語(yǔ)、諷刺或其他類型的話語(yǔ)模式,而這些模式在人類交談中會(huì)被使用到。為了繼續(xù)加強(qiáng)Alexa對(duì)于從活潑的對(duì)話到深沉的朗誦等不同類型話語(yǔ)的把控能力,亞馬遜的機(jī)器學(xué)習(xí)算法采取了不同以往的方法去訓(xùn)練Alexa,使其能夠掌握或急切或焦慮等聽起來(lái)很逼真的聲音,那聽起來(lái)就像是專業(yè)的播音員發(fā)出的。

據(jù)悉,亞馬遜擁有自己的有聲讀物出版機(jī)構(gòu)Audible,這對(duì)這項(xiàng)研究有所幫助。

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

如何幫助更多人

語(yǔ)音人工智能技術(shù)最熱情的使用者是那些無(wú)法輕易在手機(jī)或平板電腦上打字的人。據(jù)外媒報(bào)道,費(fèi)城的Inglis公司為殘疾人提供住房和其他服務(wù),其首席執(zhí)行官Gavin Kerr在8個(gè)居民住宅中安裝了亞馬遜Echo和Dot設(shè)備。他希望在先期試點(diǎn)測(cè)試完成后,最終可以為所有300座住宅全部配備這樣的設(shè)備。“這對(duì)當(dāng)?shù)鼐用駚?lái)說(shuō)是一個(gè)難以置信的好消息,”Kerr說(shuō),“他們會(huì)過(guò)得更舒服。因?yàn)檫@使得他們可以‘獨(dú)立’”。

據(jù)悉,Kerr公司的服務(wù)對(duì)象是數(shù)百名患有多發(fā)性硬化癥或其他身體衰弱狀況的人。對(duì)于那些臥床不起或坐著輪椅的人來(lái)說(shuō),夠不到墻上的溫度控制器是非常痛苦的。“他們因?yàn)樯眢w問(wèn)題,很難調(diào)節(jié)室內(nèi)室溫,”Kerr解釋道。“而72華氏度的房間對(duì)他們來(lái)說(shuō)可能一會(huì)覺得熱,一會(huì)覺得冷”。由于行動(dòng)障礙,他們很難讓室溫保持舒適,特別是在沒(méi)有全天候護(hù)理人員的情況下。

在對(duì)Alexa進(jìn)行一些小改動(dòng)后,它就可以為那些語(yǔ)言功能嚴(yán)重受限的人群提供服務(wù)了。Kerr提到了一個(gè)快四十歲男人的故事,這名男士想要離開長(zhǎng)期護(hù)理機(jī)構(gòu),重返日常生活。Kerr回憶道:“他告訴我們,我永遠(yuǎn)都無(wú)法說(shuō)出Alexa的指令。”于是我們問(wèn)他:“你能說(shuō)什么呢?然后我們重新修改了軟件,這樣Alexa就可以根據(jù)他的情況工作了?,F(xiàn)在當(dāng)他想打開廚房燈時(shí),他可以說(shuō)‘媽媽’,當(dāng)他想打開浴室燈時(shí),他可以說(shuō)‘約翰’。”

盡管Inglis公司為新的Echo用戶提供了四個(gè)小時(shí)的培訓(xùn),但通常是靠新用戶是自己探索發(fā)現(xiàn)的。將新的Echo從包裝盒里拿出來(lái),包裝上會(huì)特別說(shuō)明一些常見的功能,比如播放音樂(lè)、設(shè)置鬧鐘或更新購(gòu)物清單。對(duì)產(chǎn)品有良好了解的用戶可以通過(guò)他們筆記本或智能手機(jī)進(jìn)入Alexa的控制界面,以修改設(shè)置,尋找新的應(yīng)用程序,或者了解如何讓一款應(yīng)用最好地發(fā)揮作用。

六月,在一篇閱讀量很高的博客中,微軟的產(chǎn)品經(jīng)理Darren Austin寫道,Alexa取得的更大的成功在于它能夠緩解過(guò)于忙碌的生活帶來(lái)的壓力,它是一個(gè)可以隨時(shí)幫助你的好伴侶。他說(shuō):“通過(guò)簡(jiǎn)單的提問(wèn),Alexa可以解決因?yàn)椴淮_定性而帶來(lái)的負(fù)面情緒和人們對(duì)遺忘的恐懼。”他說(shuō)用戶們喜歡隨時(shí)給Alexa出一些難題,或者將自己的愿望告訴它,而它就是一個(gè)隨時(shí)都可以跟你互動(dòng)的好伙伴。

Alexa的總經(jīng)理Rob Pulciani通常會(huì)每周或更頻繁地查看關(guān)于Alexa和Dot用戶最常用語(yǔ)言的總體數(shù)據(jù)統(tǒng)計(jì)。通常情況下,這一列表的頂部是對(duì)于音樂(lè)、新聞、天氣、交通和游戲的請(qǐng)求。然而,今年春天,列表上卻出現(xiàn)了一個(gè)新晉“熱詞”。這個(gè)熱門短語(yǔ)就是“Alexa,幫我放松一下。”

當(dāng)用戶發(fā)出這個(gè)請(qǐng)求時(shí),他們會(huì)聽到一系列令人情緒舒緩的聲音:小鳥唧唧喳喳地叫著,遠(yuǎn)處的海浪沖擊著海岸,或是貨運(yùn)列車隆隆地穿過(guò)黑夜。如果用戶要求,這樣的聲音可以持續(xù)播放幾個(gè)小時(shí)。當(dāng)這些應(yīng)用程序在2015年第一次出現(xiàn)在Alexa的平臺(tái)上時(shí),Pulciani覺得這只是小眾人群的“怪癖好”。但這些應(yīng)用很快就獲得了大批追隨者,壓力纏身的成年人會(huì)聽著這些聲音入睡。父母?jìng)儠?huì)把它們變成搖籃曲的替代品。

當(dāng)Pulciani發(fā)現(xiàn)這一點(diǎn)之后,他和他的同事們?cè)趲字軆?nèi)對(duì)Alexa的內(nèi)部結(jié)構(gòu)進(jìn)行了調(diào)整,以使新的Echo買家可以迅速發(fā)現(xiàn)這些撫慰人心的聲音,在他們要求系統(tǒng)推薦新技能以供嘗試時(shí),這一功能會(huì)被推薦給他們。

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

下一個(gè)目標(biāo):持續(xù)性對(duì)話

在研究中,谷歌、蘋果、微軟和亞馬遜的人工智能平臺(tái)顯示出了不同的優(yōu)勢(shì)。其中,谷歌助理在大范圍搜索指令上表現(xiàn)最出色。而蘋果的Siri和微軟的Cortana在其他一些方面天賦異稟。但在購(gòu)物指令方面,Alexa表現(xiàn)最佳。

具備與用戶進(jìn)行一場(chǎng)合理的、持續(xù)多分鐘的對(duì)話將會(huì)是語(yǔ)音人工智能技術(shù)的終極目標(biāo)。這樣宏偉目標(biāo)的實(shí)現(xiàn)要求機(jī)器具備非常強(qiáng)的意圖識(shí)別能力,即便是說(shuō)話人沒(méi)有提出明確的要求。如果一個(gè)人說(shuō)“我?guī)字軟](méi)去健身房了”,那他的朋友可能會(huì)猜出來(lái)他想要談?wù)勛约好鎸?duì)的壓力或者是與自尊心相關(guān)的話題。對(duì)于人工智能軟件來(lái)說(shuō),這一關(guān)卻很難過(guò)。對(duì)于話題的突然轉(zhuǎn)換,或者隱晦的暗示,人工智能也很難理解。

為了加強(qiáng)其與新一代人工智能和語(yǔ)音技術(shù)研究人員的聯(lián)系,亞馬遜在一年前邀請(qǐng)了世界各地十幾所大學(xué)工程專業(yè)的學(xué)生,讓他們制造能進(jìn)行20分鐘對(duì)話的語(yǔ)音機(jī)器人。在今年11月截止之前,取得最大進(jìn)展的學(xué)校將獲得50萬(wàn)美元的獎(jiǎng)金。

研究人員在用一個(gè)周末的時(shí)間測(cè)試了6個(gè)這樣的機(jī)器人,對(duì)他們提出各種問(wèn)題,包括簡(jiǎn)單的請(qǐng)求和較為復(fù)雜的開放式觀點(diǎn)陳述,而后者可能會(huì)有很多種回復(fù)方式。

一個(gè)機(jī)器人問(wèn):“你最近看了什么電影嗎?”這是個(gè)良好的開局。

“是的,”研究人員回答,“我們看了《隱藏人物》。”

對(duì)于這部講述NASA早年歷史,風(fēng)格深刻而辛辣的電影,機(jī)器人并沒(méi)有做出與報(bào)刊影評(píng)類似的評(píng)論。相反,這個(gè)社交機(jī)器人回復(fù)說(shuō):“我覺得《隱藏人物》對(duì)數(shù)學(xué)問(wèn)題的處理上沒(méi)有太多說(shuō)服力。”

這可不是研究人員對(duì)這部電影的觀點(diǎn),但對(duì)一個(gè)人工智能程序來(lái)說(shuō),這樣的回應(yīng)似乎很可愛,也很合理。之后的交談很快結(jié)束了,但至少人機(jī)之間擁有了一個(gè)短暫而美好的瞬間??上У氖?,其他機(jī)器人都無(wú)法做到這一點(diǎn)。最令人困惑的一個(gè)回答是“你喜歡吃路邊攤嗎?”而研究人員想跟他談的話題和網(wǎng)站有關(guān)。但當(dāng)人類可能是說(shuō)到了機(jī)器人的局限性時(shí),這一話題似乎有點(diǎn)尖銳,卻得到了驢唇不對(duì)把嘴地反問(wèn)“你們能進(jìn)行集體協(xié)商嗎?”

幾天后,當(dāng)研究人員向亞馬遜公司的Prasad詢問(wèn)他對(duì)社交機(jī)器人的看法時(shí),他卻表示并不為智能機(jī)器人早期的挫折而感到失望。“這是一個(gè)非常重要的領(lǐng)域,”Prasad告訴我。“而在這些領(lǐng)域Alexa可以繼續(xù)提升,變得更智能。”

但這比下圍棋或象棋要難多了。因?yàn)樵谶@些游戲中,即使有很多可能的動(dòng)作,但你知道游戲最終的目標(biāo)是什么。而在對(duì)話中,你可能甚至都不知道對(duì)方想要達(dá)到什么目的。當(dāng)Alexa最終能夠解決這個(gè)問(wèn)題時(shí),我們就能實(shí)現(xiàn)真正的交流了。

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

【網(wǎng)易智能訊 8月11日消息】人工智能語(yǔ)音設(shè)備不僅僅是一臺(tái)可以表達(dá)觀點(diǎn)的自動(dòng)唱機(jī),它們很可能成為人機(jī)互動(dòng)的主要方式之一。

Alexa的誕生與技能擴(kuò)張

2012年8月31日,四名亞馬遜工程師注冊(cè)了一項(xiàng)基礎(chǔ)性專利,這項(xiàng)專利的內(nèi)容日后最終演變成了Alexa。專利涉及了一種人工智能系統(tǒng),該系統(tǒng)旨在與人類語(yǔ)言,這一世界上最大、最復(fù)雜的數(shù)據(jù)集進(jìn)行互動(dòng)。工程師當(dāng)時(shí)只需要使用11個(gè)單詞和一個(gè)簡(jiǎn)單的圖表就能描述它的工作原理。

一個(gè)男性用戶在一個(gè)安靜的房間里說(shuō):“請(qǐng)播放甲殼蟲樂(lè)隊(duì)的Let It Be。”

一臺(tái)小型臺(tái)式電腦回答說(shuō):“沒(méi)問(wèn)題。”

然后系統(tǒng)開始播放這首歌曲。

由此開始,家用語(yǔ)音人工智能成為了亞馬遜的一項(xiàng)重要業(yè)務(wù),而這一領(lǐng)域也成為亞馬遜與其科技界的競(jìng)爭(zhēng)對(duì)手們較量的重要戰(zhàn)場(chǎng)。谷歌,蘋果、三星和微軟都在這一領(lǐng)域投入了上千名研究人員和商業(yè)專家,以期待制造出可以同人類進(jìn)行交流,且便于使用的強(qiáng)大設(shè)備。

直到現(xiàn)在,我們還必須去打字、敲擊或者滑動(dòng)來(lái)解鎖設(shè)備和操作。而目前,新的用戶界面正在逐漸適應(yīng)人類,Witlingo公司的首席執(zhí)行官Ahmed Bouzid說(shuō)道。該公司制造了各種各樣適用于銀行、大學(xué)、法律公司和其他企業(yè)的語(yǔ)音驅(qū)動(dòng)應(yīng)用程序。

對(duì)于亞馬遜來(lái)說(shuō),其最初只是想制造一個(gè)自動(dòng)唱機(jī),但后來(lái)這一項(xiàng)目變得越來(lái)越大:它變成了一種基于人類數(shù)據(jù)并且可以不斷學(xué)習(xí)的人工智能系統(tǒng)。它生產(chǎn)的Echo和體積更小的Dot是無(wú)處不在的家庭好幫手,它們可以關(guān)燈,講笑話,或者讓你不用手就能知曉天下事。

他們還收集了大量關(guān)于用戶的數(shù)據(jù),這些數(shù)據(jù)被用來(lái)改善設(shè)備本身,并增加他們的功能。自2014年上市以來(lái),已經(jīng)售出了上千萬(wàn)臺(tái)的Alexa設(shè)備。據(jù)第三方機(jī)構(gòu)統(tǒng)計(jì),亞馬遜目前已經(jīng)占據(jù)了美國(guó)人工智能語(yǔ)音設(shè)備70%的市場(chǎng)。

亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變

(圖:溝通的原則:亞馬遜設(shè)備能聽懂的指令越來(lái)越多,以下是當(dāng)你想讓它調(diào)整房間燈光亮度時(shí),一些可以奏效或不能奏效的指令,紅色為不能奏效的)

目前,Alexa同超過(guò)50種智能照明系統(tǒng)合作,包括飛利浦、通用電氣和宜家等。 2016年,德語(yǔ)版的Alexa誕生,其他非英語(yǔ)語(yǔ)種的Alexa也將陸續(xù)誕生。但是,亞馬遜并沒(méi)有試圖從可與Alexa相連接設(shè)備的制造商那里獲得收入,這些設(shè)備包括智能恒溫器、燈泡等。不過(guò),照這樣的趨勢(shì)發(fā)展,未來(lái)亞馬遜與這些公司之間很有可能會(huì)簽訂收入共享合同或者是采取其他的支付方式。這三個(gè)市場(chǎng)中最小的一個(gè)是家庭自動(dòng)化市場(chǎng),在這一市場(chǎng)中每年的支出已經(jīng)超過(guò)了50億美元,而去年美國(guó)的零售總額為4.9萬(wàn)億美元。

如今,亞馬遜通過(guò)出售這些設(shè)備來(lái)賺錢,設(shè)備的價(jià)格從50美元到230美元不等,最高端的Echo show產(chǎn)品帶有視頻屏幕。如果選購(gòu)這些設(shè)備的用戶最終在亞馬遜龐大的網(wǎng)上商店中購(gòu)買了更多的商品,那么亞馬遜就能再賺上一筆(不過(guò)亞馬遜是不會(huì)透露這些數(shù)據(jù)的)。若要讓Echo像智能手機(jī)那樣普及,他們還需要更多的努力。為此,亞馬遜鼓勵(lì)獨(dú)立開發(fā)者在其平臺(tái)上開發(fā)新服務(wù),正如蘋果長(zhǎng)期以來(lái)與所做的那樣。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-08-11
亞馬遜Alexa進(jìn)化史:當(dāng)話語(yǔ)遇見AI 生活發(fā)生了巨變
人工智能語(yǔ)音設(shè)備不僅僅是一臺(tái)可以表達(dá)觀點(diǎn)的自動(dòng)唱機(jī),它們很可能成為人機(jī)互動(dòng)的主要方式之一。對(duì)于亞馬遜來(lái)說(shuō),其最初只是想制造一個(gè)自動(dòng)唱機(jī),但后來(lái)這一項(xiàng)目變得越來(lái)越

長(zhǎng)按掃碼 閱讀全文