機(jī)器人抓取再出新招,人類雙手會(huì)得到進(jìn)一步解放嗎?

原標(biāo)題:機(jī)器人抓取再出新招,人類雙手會(huì)得到進(jìn)一步解放嗎?

機(jī)器人早已在工業(yè)流水線尤其是制造業(yè)上得到了廣泛的應(yīng)用,比如手機(jī)制造、汽車組裝等。在最初的應(yīng)用中,機(jī)器人的設(shè)計(jì)被固定在某一項(xiàng)任務(wù)當(dāng)中,打眼就是打眼,安螺絲就是安螺絲。在這個(gè)時(shí)期,工業(yè)機(jī)器人實(shí)質(zhì)上是替代了簡(jiǎn)單的組裝工作,并且只適應(yīng)設(shè)計(jì)好的特定環(huán)節(jié),基本沒有任何延展性。

而在人工智能時(shí)代,加入了機(jī)器視覺之后,機(jī)器人的應(yīng)用范圍逐漸一下子被擴(kuò)大了許多。更多的行業(yè)被涉足并發(fā)生了質(zhì)的革新,比如物流的智能分揀。

目前來說,對(duì)機(jī)器人進(jìn)行視覺訓(xùn)練,應(yīng)用在工業(yè)當(dāng)中的基本任務(wù)就是:認(rèn)識(shí)某物。也就是說,通過對(duì)機(jī)器的訓(xùn)練,使其能夠分辨出哪一樣是自己的工作對(duì)象。而這也是機(jī)器視覺學(xué)習(xí)的最簡(jiǎn)單而有效的應(yīng)用。

但工業(yè)應(yīng)用場(chǎng)景并不僅僅只有識(shí)別。比如對(duì)倉儲(chǔ)物品的抓取和分類,或者很多并不是固定物品的應(yīng)用場(chǎng)景,這就會(huì)導(dǎo)致機(jī)器既有的學(xué)習(xí)內(nèi)容用不上。那么,不認(rèn)識(shí)這個(gè)東西,機(jī)器就不知道該如何處理,在做一些抓取搬運(yùn)工作的時(shí)候就難免會(huì)出岔子。

從這個(gè)角度上來說,以后對(duì)工業(yè)機(jī)器人的要求,將不滿足于局限于既有的學(xué)習(xí)內(nèi)容,同樣還要有自主的學(xué)習(xí)能力。也就是說,在機(jī)器人碰到陌生的物體的時(shí)候,能夠自主地判斷該怎么去處理。

AI繪制三維圖形,判斷最佳抓取姿勢(shì)

有人覺得,培養(yǎng)機(jī)器人的遷移學(xué)習(xí)能力不就好了嗎?比如記住一些物體的具體特征,人工智能既然能分辨出什么是人、什么是大猩猩、什么是貓狗,那么只要訓(xùn)練到位,機(jī)器人同樣也能對(duì)其他陌生的物體做出分辨。

但很可惜這樣想可能有點(diǎn)不切實(shí)際。比如讓機(jī)器人去把倉庫里亂七八糟的東西給歸置整齊了,里面可能有大電視機(jī),也可能有小面包機(jī),它怎么分類?它該怎么拿?所以,很顯然用認(rèn)識(shí)同一類物體的方法是不適用于這樣的場(chǎng)景當(dāng)中的。

那么,為了讓機(jī)器人什么都能拿,麻省理工的研究人員們動(dòng)了點(diǎn)心思。

研究人員設(shè)計(jì)了這樣一個(gè)系統(tǒng):面對(duì)自己不熟悉的物體,機(jī)器人能夠快速地對(duì)其進(jìn)行估算,然后做出最適合的抓取和細(xì)節(jié)處理決策。該系統(tǒng)被稱為DON(Dense Object Nets,密集物體聯(lián)網(wǎng)),通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),機(jī)器人可以產(chǎn)生一個(gè)視覺路線圖,對(duì)物體進(jìn)行一個(gè)約莫20分鐘的視覺檢查。

在此基礎(chǔ)上,機(jī)器人會(huì)從多個(gè)角度來確定物體的點(diǎn),然后把所有的點(diǎn)形成一個(gè)整體坐標(biāo)系統(tǒng)。把這些點(diǎn)聯(lián)系到一起之后,就可以繪制出物體的三維立體圖。值得注意的是,在繪制三維立體圖的過程中,機(jī)器完全不需要人的干預(yù),因此這種學(xué)習(xí)方式又被稱為自我監(jiān)督式學(xué)習(xí)。

這樣的學(xué)習(xí)過程其實(shí)是和人類有很大的相似之處。我們看到暖瓶知道要握把才能提起,該系統(tǒng)的目的也是訓(xùn)練機(jī)器人的這種能力。只不過在目前的實(shí)驗(yàn)中,三維立體圖形繪制出來之后,還需要研究人員在電腦上給出指定的位置,以告訴機(jī)器人從哪里下手。

在實(shí)驗(yàn)中,機(jī)器人成功抓起了一只鞋子和杯子。

其實(shí)對(duì)機(jī)器人進(jìn)行不同環(huán)境、物體的抓取訓(xùn)練思路,麻省理工并不是第一個(gè)。2016國內(nèi)一家科技公司就研發(fā)出了首套基于3D視覺定位系統(tǒng)的機(jī)器人,可以達(dá)到每秒1200萬點(diǎn)的快速掃描,從而建立一個(gè)物體的3D模型。再經(jīng)過一系列的智能分析,可以判斷出物體當(dāng)時(shí)的擺放姿態(tài),從而完成一套抓取動(dòng)作。

可以預(yù)見的是,今后也將有越來越多的關(guān)于基于3D立體判斷的工業(yè)機(jī)器人解決方案出現(xiàn)。讓機(jī)器人從簡(jiǎn)單的識(shí)別固定唯一的物體到自如地適應(yīng)不同物體抓取,也將成為工業(yè)機(jī)器人領(lǐng)域中不可忽視的重要技術(shù)。

抓得穩(wěn)又抓得準(zhǔn),人類的雙手該歇歇了

目前來說,該技術(shù)的最大問題在于建模所需的時(shí)間還比較長(zhǎng),遠(yuǎn)遠(yuǎn)無法滿足即時(shí)的工業(yè)應(yīng)用需求。

上文介紹的麻省理工的研究,其要實(shí)現(xiàn)對(duì)物體的三維圖像描繪需要大概二十分鐘的時(shí)間。但在做個(gè)搬運(yùn)工的時(shí)候,比如說清理房間,很可能會(huì)遇到非常多的不認(rèn)識(shí)的物品。對(duì)這種機(jī)器人來說,每個(gè)物品都需要重新認(rèn)識(shí)一遍。認(rèn)識(shí)一個(gè)花二十分鐘,搬運(yùn)一下一分鐘,那得了,整個(gè)時(shí)間就都消耗在這上面了。

而工業(yè)最講究的就是效率,如果能通過提升芯片計(jì)算速度、優(yōu)化算法的方法令機(jī)器人快速建模并實(shí)現(xiàn)實(shí)時(shí)自主抓取,無疑是最成熟。當(dāng)然,這對(duì)機(jī)器而言存在的困難還是很大。畢竟人類的神經(jīng)元有1000億個(gè),其形成的人類大腦反應(yīng)恐怕機(jī)器在很長(zhǎng)的一段時(shí)間內(nèi)都很難企及。

如果機(jī)器人能實(shí)現(xiàn)抓取的即時(shí)反應(yīng)、利用視覺判斷物體材料和表面光滑度控制好抓取力度等,其在無論是工業(yè)場(chǎng)景、消費(fèi)場(chǎng)景還是其他場(chǎng)景等都將充滿廣闊的想象力。

搬家機(jī)器人。以前搬家,打幾個(gè)包袱弄輛推車,找?guī)讉€(gè)鄰居幫忙就可以搞定。而現(xiàn)在隨著家居用品的日益增加,搬家成為了一件巨麻煩的事情。很多人都會(huì)叫搬家公司來幫忙。實(shí)質(zhì)上這就是在購買勞動(dòng)。搬家貴,主要就是人力成本太高。當(dāng)機(jī)器人搬運(yùn)東西的時(shí)候可以做到舉重若輕,搬家工人或許將逐漸被取代。干活快、不發(fā)牢騷、不用發(fā)工資、購買一次可以長(zhǎng)期重復(fù)使用,對(duì)搬家公司而言,利用搬家機(jī)器人可謂一勞永逸。成本降低之后,相應(yīng)地搬家公司的收益會(huì)提高,而分?jǐn)偟较M(fèi)者身上的成本也會(huì)大大降低。

優(yōu)化機(jī)器人無序抓取。在工業(yè)場(chǎng)景下,尤其是物流領(lǐng)域,很多物品的擺放都是散亂而無序的。傳統(tǒng)的機(jī)器人只是分揀符合自身程序設(shè)定標(biāo)準(zhǔn)的物件,最終仍然需要人工來對(duì)這些貨物進(jìn)行碼垛等操作。當(dāng)機(jī)器人可以實(shí)現(xiàn)對(duì)物品的三維掃描繪制,就可以將抓取過程更加智能化,以前由兩個(gè)機(jī)器人做的事情現(xiàn)在一個(gè)就可以完成;以前由人工操作的碼垛任務(wù),最終也可以由機(jī)器完成。減少機(jī)器人配置和節(jié)省人力這兩方面,都將會(huì)得到優(yōu)化。

清理事故現(xiàn)場(chǎng)和救災(zāi)。嚴(yán)重的交通事故、工廠的意外爆炸、自然災(zāi)害或者其他會(huì)產(chǎn)生大量分解物體的事故現(xiàn)場(chǎng),清理是一件非常麻煩的事情。尤其是在一些危險(xiǎn)隱患尚未解除的時(shí)候,靈巧的機(jī)器人雙手可以代替人類作許多事情。而在地震等自然災(zāi)害之后,機(jī)器人可以代替人類深入現(xiàn)場(chǎng)做一些危險(xiǎn)情況排除工作,甚至可以直接參與救人行動(dòng)。

機(jī)器人抓取一直都是機(jī)器人研究領(lǐng)域的一個(gè)熱點(diǎn)問題,這也正從一個(gè)側(cè)面了解決這個(gè)問題對(duì)整個(gè)機(jī)器人技術(shù)革新的重要意義。當(dāng)機(jī)器人在未來擁有了一雙和人類一樣靈巧的雙手的時(shí)候,可能也就意味著,人類的雙手將在更多的場(chǎng)景中得到徹底的解放。

而DON看起來,則很可能成為將在這場(chǎng)解放運(yùn)動(dòng)中發(fā)揮重要作用。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-09-12
機(jī)器人抓取再出新招,人類雙手會(huì)得到進(jìn)一步解放嗎?
原標(biāo)題:機(jī)器人抓取再出新招,人類雙手會(huì)得到進(jìn)一步解放嗎?機(jī)器人早已在工業(yè)流水線尤其是制造業(yè)上得到了廣泛的應(yīng)用,比如手機(jī)制造、汽車組裝等。

長(zhǎng)按掃碼 閱讀全文