導(dǎo)語:DeepMind 正在全力提高 AlphaGo 的智能程度,全新版 AlphaGo 將在 2017 年復(fù)出下棋。
今日,DeepMind CEO Demis Hassabis 在 Twitter 上發(fā)布聲明:他們正在全力提高 AlphaGo 的智能程度,全新版 AlphaGo 將在 2017 年復(fù)出下棋。DeepMind 會在近期內(nèi)公布更多信息。
隨后樊麾也在微博上發(fā)文稱 AlphaGo 的棋力得到了巨大的提升。
樊麾現(xiàn)任法國圍棋隊(duì)總教練,曾三度獲得歐洲冠軍,是第一位與 AlphaGo 交手的職業(yè)棋手,去年 10 月,他在一場閉門比賽中 0 比 5 敗給機(jī)器。隨后樊麾加盟了DeepMind團(tuán)隊(duì),擔(dān)任專職陪練。
今年 3 月李世石與 AlphaGo 大戰(zhàn)之后,柯杰非常期待挑戰(zhàn) AlphaGo。國家體育總局棋牌運(yùn)動管理中心黨委書記楊俊安曾在公開場合披露柯潔將挑戰(zhàn) AlphaGo,消息一出被 DeepMind 否認(rèn)。據(jù)業(yè)內(nèi)人消息,中國棋院確實(shí)與 DeepMind 達(dá)成對戰(zhàn)協(xié)議,但由于特殊原因,遲遲未能公布。因此,柯潔在明年對戰(zhàn) AlphaGo 的概率非常大。
一年時(shí)間的“閉關(guān)修煉”,AlphaGo 可能在干嘛?
此前田淵棟在《AlphaGo 為什么那么厲害?》一文中提到:
與之前的圍棋系統(tǒng)相比,AlphaGo 較少依賴圍棋的領(lǐng)域知識,但還遠(yuǎn)未達(dá)到通用系統(tǒng)的程度。職業(yè)棋手可以在看過了寥寥幾局之后明白對手的風(fēng)格并采取相應(yīng)策略,一位資深游戲玩家也可以在玩一個新游戲幾次后很快上手,但到目前為止,人工智能系統(tǒng)要達(dá)到人類水平,還是需要大量樣本的訓(xùn)練的。
業(yè)內(nèi)人士分析,AlphaGo 隱退的這一年間,它可能會進(jìn)行大量的樣本訓(xùn)練,應(yīng)用增強(qiáng)學(xué)習(xí)不斷與自己“左右手互博”:在電腦里自行模擬,產(chǎn)生新的棋局,使得收集到的經(jīng)驗(yàn)和樣本變得更多,逐步增強(qiáng)自己的能力。
與此同時(shí),田淵棟也解釋到,樣本訓(xùn)練固然重要,但動態(tài)實(shí)戰(zhàn)經(jīng)驗(yàn)所起到的作用可能會更大。
在 AlphaGo 中,增強(qiáng)學(xué)習(xí)(Reinforcement Learning)所扮演的角色并沒有想像中那么大。在理想情況下,我們希望人工智能系統(tǒng)能在對局中動態(tài)地適應(yīng)環(huán)境和對手的招式并且找到辦法反制之,但是在 AlphaGo 中增強(qiáng)學(xué)習(xí)更多地是用于提供更多質(zhì)量更好的樣本,給有監(jiān)督學(xué)習(xí)(Supervised Learning)以訓(xùn)練出更好的模型。
出于這方面的考量,DeepMind 把樊麾等頂尖棋手招入麾下給 AlphaGo 做陪練,專門進(jìn)行動態(tài)實(shí)戰(zhàn)訓(xùn)練,至于效果如何,暫時(shí)還無法得知。IBM 資深工程師兼弈城業(yè)余 4 段棋手Zhuang Zhuang 向雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))透露:
AlphaGo 對戰(zhàn)李世石時(shí)是 V18 版,現(xiàn)在為 V20 版,明年初正式發(fā)布即便是 V21 版也不奇怪。從表面來看,至少三個版本的更迭大致可以看出 AlphaGo 的升級速度相對較快,實(shí)力應(yīng)該有著不少提升。
柯杰與 AlphaGo 誰厲害這一問題一直被擺在熱議話題中,那么人類棋手在與 AI 對戰(zhàn)時(shí)應(yīng)該注意什么?
Zhuang Zhuang 指出:
與機(jī)器交手的心態(tài)很重要,這不同于和真人對戰(zhàn)。職業(yè)棋手在準(zhǔn)備重大比賽的時(shí)候,可以研究對手的棋風(fēng)偏好,可以準(zhǔn)備一些布局套路,對局時(shí)可以在一定程度上推測對手的選擇,但這些對 AlphaGo 都不管用。AlphaGo 的棋風(fēng)是什么?其實(shí)不是那么容易說清楚,但是有一點(diǎn)應(yīng)該是公認(rèn)的,就是價(jià)值判斷絕大部分情況下超過人類棋手,它的選擇沒有感情,不是基于棋風(fēng),是基于勝率、價(jià)值。當(dāng)棋手面對 AlphaGo 這樣強(qiáng)勁對手,最佳策略就是不斷追求最善、最直接的一手,這樣才能最大化勝率。在這期間,棋手應(yīng)該多與冷冰冰的機(jī)器系統(tǒng)交戰(zhàn),形成應(yīng)對機(jī)器棋手的獨(dú)特心態(tài)。
除了 AlphaGo 外, Zen 圍棋 AI 目前也已升級到了 V13,智能程度不俗??梢灶A(yù)見未來我們看到的不僅是 AI 與人之間的較量,甚至還有各公司水平超越人類的圍棋 AI 系統(tǒng)之間的對決。
- 比亞迪捐資30億元成立教育慈善基金,助力培養(yǎng)卓越人才,推動中國科教進(jìn)步
- ?5年投入200億打造飛行汽車!?長安汽車布局萬億“低空”市場
- 英偉達(dá)涉嫌違反反壟斷法 市場監(jiān)管總局依法決定立案調(diào)查
- 上海敲定5G-A發(fā)展目標(biāo):到2026年發(fā)展500萬用戶,建設(shè)3.2萬個3CC基站
- 中國電信注資10億成立天通衛(wèi)星科技公司,將推動衛(wèi)星通信手機(jī)向3000元下探
- 上汽今年銷量或會被比亞迪反超,痛失18年“中國車企銷量冠軍”
- 英特爾CEO基辛格名為退休,實(shí)為被董事會趕下臺?
- 華為申請多枚鴻蒙辦公商標(biāo),涉及辦公用品等多個領(lǐng)域
- “數(shù)智化”登頂《咬文嚼字》十大流行語,數(shù)智技術(shù)應(yīng)用深入人心
- IDC預(yù)計(jì):2028年AI基礎(chǔ)設(shè)施支出將超1000億美元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。