科技云報(bào)道原創(chuàng)。
在哈利·波特的魔法世界中,分院帽是一頂磨得很舊,打著補(bǔ)丁,而且臟得要命的尖頂巫師。不過(guò)可別小看它,它可是充滿智能、會(huì)思想的魔法帽,能看出學(xué)生具備何種才能,從而將學(xué)生分到適合的學(xué)院。
如果現(xiàn)實(shí)世界存在分院帽的話,那么它應(yīng)該類似于機(jī)器學(xué)習(xí)的應(yīng)用程序,可以根據(jù)復(fù)雜的數(shù)據(jù)集自主地做出決策。
如今,機(jī)器學(xué)習(xí)正在推動(dòng)數(shù)萬(wàn)億規(guī)模的全球產(chǎn)業(yè),市場(chǎng)調(diào)查機(jī)構(gòu)Grand View Research最近發(fā)布的《機(jī)器學(xué)習(xí)市場(chǎng)報(bào)告2025》預(yù)計(jì),到2025年,全球機(jī)器學(xué)習(xí)市場(chǎng)規(guī)模將達(dá)到967億美元。2019年-2025年的年復(fù)合增長(zhǎng)率為43.8%,其中金融服務(wù),零售和汽車領(lǐng)域處于領(lǐng)先地位。如果機(jī)器學(xué)習(xí)有望創(chuàng)造更大規(guī)模的市場(chǎng)價(jià)值,那么問(wèn)題來(lái)了:這些價(jià)值將在哪里產(chǎn)生呢?
從初創(chuàng)公司到科技巨頭 機(jī)器學(xué)習(xí)深度嵌入垂直場(chǎng)景
早在50年前,機(jī)器學(xué)習(xí)的概念就出現(xiàn)了。只是直到今天,隨著云計(jì)算的出現(xiàn),人工智能和機(jī)器學(xué)習(xí)才進(jìn)入千千萬(wàn)萬(wàn)的企業(yè),不再局限于少數(shù)科技巨頭和硬核的研究機(jī)構(gòu)。云計(jì)算時(shí)代的到來(lái),掃清了企業(yè)應(yīng)用人工智能和機(jī)器學(xué)習(xí)的障礙,而即便最保守的企業(yè)在當(dāng)今都無(wú)法忽視人工智能的作用。根據(jù)IDC的數(shù)據(jù),當(dāng)前40%的企業(yè)數(shù)字化轉(zhuǎn)型項(xiàng)目都會(huì)運(yùn)用人工智能。
Facebook、Amazon、Apple、Netflix、Google等科技巨頭在機(jī)器學(xué)習(xí)方面的創(chuàng)新廣為人知,從新聞推送到推薦引擎不一而足。其實(shí),這些科技巨頭在機(jī)器學(xué)習(xí)領(lǐng)域早已布局。比如Amazon就在這個(gè)領(lǐng)域已經(jīng)投入了20多年,其在線零售的個(gè)性化產(chǎn)品推薦、機(jī)器人倉(cāng)儲(chǔ)中心、無(wú)人機(jī)送貨、Alexa語(yǔ)音助理、Amazon GO無(wú)人值守超市,都依靠人工智能和機(jī)器學(xué)習(xí)技術(shù)的支持。
但就更多場(chǎng)景而言,人工智能的應(yīng)用仍然較為局限。目前,制約人工智能廣泛應(yīng)用的因素有三個(gè)方面:一是掌握人工智能專業(yè)知識(shí)的人才不足;二是構(gòu)建和擴(kuò)展人工智能的技術(shù)產(chǎn)品有難度;三是在生產(chǎn)經(jīng)營(yíng)中部署人工智能應(yīng)用費(fèi)時(shí)且成本高。最終導(dǎo)致缺乏低成本、易使用、可擴(kuò)展的人工智能產(chǎn)品和服務(wù)。就機(jī)器學(xué)習(xí)而言,多數(shù)機(jī)器學(xué)習(xí)方法的性能在很大程度上依賴于過(guò)量的模型設(shè)計(jì)策略,這導(dǎo)致新手難以較快地掌握和應(yīng)用機(jī)器學(xué)習(xí)。
對(duì)此,Amazon SageMaker的出現(xiàn)幫助企業(yè)解決了這些挑戰(zhàn)。作為一個(gè)工具集,Amazon SageMaker提供了用于機(jī)器學(xué)習(xí)的所有組件,比如彈性筆記本、實(shí)驗(yàn)管理、自動(dòng)模型創(chuàng)建、調(diào)試與分析,以及模型概念漂移檢測(cè)等多元化工具和功能,貫穿整個(gè)機(jī)器學(xué)習(xí)的工作流程,從而以更少的努力、更低的成本、更快地將機(jī)器學(xué)習(xí)模型投入生產(chǎn)。
2021年5月11日,Amazon SageMaker以落地中國(guó)區(qū)域一周年為契機(jī),進(jìn)一步在中國(guó)區(qū)域落地多項(xiàng)人工智能與機(jī)器學(xué)習(xí)的新服務(wù)和功能,“希望通過(guò)將更多服務(wù)落地到中國(guó)區(qū)域,并堅(jiān)持‘授人以魚不如授人以漁’,甚至更進(jìn)一步‘扶上馬,送一程’的方式,幫助客戶更快應(yīng)用機(jī)器學(xué)習(xí)技術(shù),把機(jī)器學(xué)習(xí)的能力交到每一位構(gòu)建者手中,加速人工智能和機(jī)器學(xué)習(xí)的普惠?!眮嗰R遜云科技大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡表示。
亞馬遜云科技大中華區(qū)云服務(wù)產(chǎn)品管理總經(jīng)理顧凡
除了科技巨頭,全球一些初創(chuàng)型的公司也都在將機(jī)器學(xué)習(xí)與垂直領(lǐng)域相結(jié)合,最好的機(jī)器學(xué)習(xí)公司都有著清晰的垂直重點(diǎn)。他們甚至不會(huì)將自己定義為機(jī)器學(xué)習(xí)公司。比如在工業(yè)和物流領(lǐng)域,Covariant是一家結(jié)合了強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的初創(chuàng)公司,該公司讓機(jī)器人能夠管理大型倉(cāng)庫(kù)設(shè)施中的物體;Interos應(yīng)用機(jī)器學(xué)習(xí)技術(shù)評(píng)估全球供應(yīng)鏈網(wǎng)絡(luò),幫助企業(yè)圍繞供應(yīng)商管理、業(yè)務(wù)連續(xù)性和風(fēng)險(xiǎn)做出關(guān)鍵決策。
在醫(yī)療領(lǐng)域,Athelas已將機(jī)器學(xué)習(xí)應(yīng)用于免疫監(jiān)測(cè),通過(guò)收集病人白血球數(shù)量的數(shù)據(jù)幫助他們優(yōu)化藥物攝入。Curai利用機(jī)器學(xué)習(xí)技術(shù)來(lái)提高醫(yī)生推薦的效率和質(zhì)量,讓他們可以把更多的時(shí)間花在治療患者的工作上。Zebra和AIdoc通過(guò)訓(xùn)練數(shù)據(jù)集來(lái)更快地確定醫(yī)療狀況,從而提高了放射科醫(yī)生的工作能力。
然而,大規(guī)模部署機(jī)器學(xué)習(xí)模型也可能為企業(yè)帶來(lái)諸多挑戰(zhàn)。例如,規(guī)模化的部署需要實(shí)現(xiàn)“數(shù)據(jù)-模型-成果”這一復(fù)雜且反復(fù)的端到端工作流程。而且,企業(yè)也需要提高自身治理能力,合理應(yīng)對(duì)模型部署可能帶給終端客戶服務(wù)的影響(如隱私問(wèn)題),并著眼于數(shù)據(jù)應(yīng)用的合規(guī)性和安全性,以及該模型是否能轉(zhuǎn)化成為生產(chǎn)級(jí)模型等。
前途光明但道路曲折 機(jī)器學(xué)習(xí)模型仍面臨四大挑戰(zhàn)
據(jù)國(guó)外知名科技媒體VentureBeat報(bào)道,大約90%的機(jī)器學(xué)習(xí)模型從未投入生產(chǎn)。換句話說(shuō),機(jī)器學(xué)習(xí)只有10%能夠真正產(chǎn)出對(duì)公司有用的東西。盡管大家都相信,人工智能將成為下一次科技革命的中心,但人工智能的采用和部署尚未獲得長(zhǎng)足的發(fā)展。目前來(lái)看,機(jī)器學(xué)習(xí)要想大規(guī)模應(yīng)用仍然還面臨比較大的挑戰(zhàn)。
挑戰(zhàn)一:數(shù)據(jù)獲取和訪問(wèn)難度大
許多公司的IT系統(tǒng)都是高度筒倉(cāng)化的,這意味著每個(gè)部門都有自己收集數(shù)據(jù)的方式、首選格式、存儲(chǔ)位置以及安全和隱私偏好。另一方面,機(jī)器學(xué)習(xí)經(jīng)常需要來(lái)自多個(gè)部門的數(shù)據(jù),筒倉(cāng)化模式增加了清理和處理這些數(shù)據(jù)的難度。但在今天這個(gè)技術(shù)飛速變革的時(shí)代,企業(yè)將需要加快步伐,在整個(gè)過(guò)程中建立起統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)。
挑戰(zhàn)二:IT、數(shù)據(jù)科學(xué)和工程脫節(jié)
如果公司的目標(biāo)是減少“數(shù)據(jù)筒倉(cāng)”,就意味著各部門需要更多地相互溝通,調(diào)整各自的目標(biāo)。但在許多公司中,IT部門和數(shù)據(jù)部門之間存在著根本性的分歧。IT傾向于優(yōu)先考慮讓事情正常運(yùn)轉(zhuǎn)并保持穩(wěn)定,而數(shù)據(jù)專家則更喜歡進(jìn)行一些嘗試性創(chuàng)造,這就會(huì)導(dǎo)致一些不穩(wěn)定情況發(fā)生,使雙方的溝通產(chǎn)生困難。此外,對(duì)于數(shù)據(jù)專家來(lái)說(shuō),與IT工程師的溝通也是一道障礙,因?yàn)镮T工程師有時(shí)候可能無(wú)法了解數(shù)據(jù)專家所設(shè)想的所有細(xì)節(jié),或者可能會(huì)由于溝通錯(cuò)誤而改變實(shí)現(xiàn)方式。
挑戰(zhàn)三:重復(fù)性工作多 應(yīng)用擴(kuò)展較難
機(jī)器學(xué)習(xí)模型可能在小規(guī)模數(shù)據(jù)樣本的環(huán)境中工作得很好,但這并不意味著它在任何地方都可以工作得很好。首先,可能沒(méi)有處理更大數(shù)據(jù)集的硬件或云存儲(chǔ)空間可供使用。此外,在規(guī)模很大時(shí),機(jī)器學(xué)習(xí)模型的模塊并不總是像規(guī)模較小時(shí)那么有效。另外,由于公司的筒倉(cāng)結(jié)構(gòu),數(shù)據(jù)獲取可能也比較困難,這也是在組織之間統(tǒng)一數(shù)據(jù)結(jié)構(gòu)、鼓勵(lì)不同部門之間進(jìn)行交流的另一個(gè)原因。
在部署機(jī)器學(xué)習(xí)模型的漫長(zhǎng)道路上,超過(guò)25%的企業(yè)都存在重復(fù)工作。例如,軟件工程師可能會(huì)按數(shù)據(jù)專家的說(shuō)法進(jìn)行實(shí)現(xiàn),后者可能也會(huì)自己做一些工作。這不僅浪費(fèi)時(shí)間和資源,而且在遇到任何錯(cuò)誤時(shí)就不知道應(yīng)該向誰(shuí)求助,這會(huì)導(dǎo)致額外的混亂。如果數(shù)據(jù)專家能夠?qū)崿F(xiàn)他們的模型,但對(duì)于職責(zé)如何劃分、如何明確分工,他們應(yīng)該與IT工程師溝通清楚,這樣就可以節(jié)省時(shí)間和資源。
挑戰(zhàn)四:不能跨語(yǔ)言且缺少框架支持
由于機(jī)器學(xué)習(xí)模型仍處于起步階段,不同的語(yǔ)言和框架仍有相當(dāng)大的差距。有些模型開(kāi)始時(shí)使用的是Python語(yǔ)言開(kāi)始,中間切換到R語(yǔ)言,最后用的是Julia語(yǔ)言。有的則相反,或者完全使用其他語(yǔ)言。由于每種語(yǔ)言都有自己獨(dú)特的庫(kù)和依賴項(xiàng),項(xiàng)目很快就變得很難跟蹤。此外,有些模型可能會(huì)使用Docker和Kubernetes進(jìn)行容器化,并部署特定的API,其他模型則不會(huì),這樣的例子不勝枚舉。為了彌補(bǔ)這種不足,像TFX、Mlflow和Kubeflow這樣的工具出現(xiàn)了。但這些工具仍處于起步階段,但到目前為止,這方面的專業(yè)人才還很少。
事實(shí)上,模仿人類的思維并不是機(jī)器學(xué)習(xí)的唯一目標(biāo),相反機(jī)器學(xué)習(xí)可以通過(guò)對(duì)大型數(shù)據(jù)集進(jìn)行詳盡的分析來(lái)提高人類的智能水平,就像搜索引擎能夠通過(guò)組織Web來(lái)擴(kuò)展人類的知識(shí)一樣。機(jī)器學(xué)習(xí)還可以匯總多個(gè)數(shù)據(jù)集的信息,探索模式,并為一些問(wèn)題提出新的解決方案,從而在醫(yī)療、商業(yè)、交通等多個(gè)領(lǐng)域?yàn)槿祟愄峁┬滦头?wù)。
機(jī)器學(xué)習(xí)技術(shù)必將推動(dòng)企業(yè)機(jī)構(gòu)的變革,目前許多機(jī)器學(xué)習(xí)應(yīng)用已經(jīng)為企業(yè)機(jī)構(gòu)帶來(lái)了實(shí)際的業(yè)務(wù)成果。機(jī)器學(xué)習(xí)可以實(shí)現(xiàn)流程自動(dòng)化、發(fā)現(xiàn)新洞察,從而幫助企業(yè)創(chuàng)造新產(chǎn)品或增強(qiáng)現(xiàn)有產(chǎn)品及服務(wù),從而提供更好的客戶體驗(yàn)。
但企業(yè)機(jī)構(gòu)要想真正將機(jī)器學(xué)習(xí)應(yīng)用到實(shí)際業(yè)務(wù)場(chǎng)景之中,還需完成全方位運(yùn)營(yíng)轉(zhuǎn)型,具備建立和開(kāi)發(fā)機(jī)器學(xué)習(xí)模型以及部署和運(yùn)營(yíng)整個(gè)模型的能力,從而全方位發(fā)掘機(jī)器學(xué)習(xí)的潛力。目前為止,大型企業(yè)孵化了最先進(jìn)的技術(shù),但是真正的希望存在于下一波機(jī)器學(xué)習(xí)應(yīng)用程序和工具之中,將圍繞機(jī)器智能將哈利·波特式的幻想轉(zhuǎn)化為有形的社會(huì)價(jià)值。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。