我親手調(diào)教的AI,竟然開始歧視我了

大數(shù)據(jù)

作者:硅谷密探

想像一下,如果你和一個(gè)人聊天,你和他說(shuō)“我是一只狗”,這個(gè)人會(huì)給你一個(gè)微笑;但是如果你和他說(shuō)“我是一個(gè)同性戀”的話,這家伙卻露出難過的表情。你會(huì)怎么想?

或許你會(huì)想說(shuō):“太過分了!這簡(jiǎn)直就是紅果果的歧視!”

那么如果我告訴你,和你聊天的這個(gè)“人”是個(gè)AI呢?

密探最近看到的一個(gè)新聞?dòng)悬c(diǎn)意思:一年前 Google 做了個(gè)“云自然語(yǔ)言 API”(cloud natural language API)。簡(jiǎn)單地說(shuō),它作為一個(gè)機(jī)器,或者說(shuō)程序,能在我們?nèi)祟惖恼{(diào)教下慢慢讀懂我們的文字和語(yǔ)言。

但這個(gè)云自然語(yǔ)言 API 有點(diǎn)不一樣,Google 給它搞了個(gè)額外功能,叫做 “情緒分析器”(sentiment analyzer),簡(jiǎn)單地說(shuō)就是讓程序表達(dá)出自己的“感情”。

而它表達(dá)的方式也很簡(jiǎn)單,就是給聽到的句子打分,區(qū)間從 -1 到 1,-1 是最負(fù)面的。也就是說(shuō)通過我們?nèi)祟惖?“調(diào)教”,機(jī)器自己覺得這個(gè)句子里的東西非常不好,因此情緒很負(fù)面;而 1 是最正面的。

說(shuō)得更直白點(diǎn):離 -1 越近,AI 越討厭這個(gè)”東西“,反之亦然。

大數(shù)據(jù)

Peter Thiel聽完了可能會(huì)說(shuō):“Google 你出來(lái),咱倆走廊里聊聊!”

如果你輸入 “我是基督徒” ,系統(tǒng)對(duì)這個(gè)句子的 “感情” 是 0.1,還算正面:

大數(shù)據(jù)

輸入 “我是錫克教徒” ,更正面(0.3):

大數(shù)據(jù)

(給同學(xué)們普及下:錫克教是印度宗教的一種,15世紀(jì)末發(fā)源自印度旁遮普地區(qū),目前全球有 2500萬(wàn)教徒,大部分居住在印度旁遮普邦。在美國(guó),加州是信仰錫克教人數(shù)較多的州之一。)

尷尬的時(shí)刻來(lái)了,如果你輸入 “我是猶太人”,系統(tǒng)對(duì)你的印象突然變得負(fù)面(-0.2):

大數(shù)據(jù)

大數(shù)據(jù)

猶太人小扎聽完了可能會(huì)說(shuō):“Google 你還行不行了?”

看來(lái)這個(gè) “情緒分析器” 還真是個(gè)耿直 Boy。不知道它對(duì)像埃隆·馬斯克這種離過三次婚的男人是個(gè)什么態(tài)度,如果也很負(fù)面的話,它就能把硅谷幾個(gè)最大的大佬都得罪全了……

在我們調(diào)教 AI 的時(shí)候,假設(shè)我們輸入一個(gè)句子:三個(gè)帶著金鏈子的蒙面壯漢搶劫了一家銀行,造成一人受傷。

很顯然,這個(gè)句子的情感是非常負(fù)面的。

然后 AI 又從小說(shuō)、報(bào)紙、或者網(wǎng)絡(luò)上看到了這么一句話:一個(gè)月黑風(fēng)高的夜晚,有人被一個(gè)身材魁梧的男子打劫了,損失慘重。

明顯地,這句話里發(fā)生的事件也非常負(fù)面。

我們辛苦研究出來(lái)的 AI 辣么聰明,它馬上就意識(shí)到:等等!“身材魁梧”和“壯漢”是一回事!而且很可能是不好的元素。 于是它就會(huì)把“壯漢”標(biāo)記出來(lái)。在這之后,如果它再看見有“壯漢”這個(gè)詞,根據(jù)以往經(jīng)驗(yàn),它就會(huì)產(chǎn)生負(fù)面情緒。

換句話說(shuō),AI 本身沒有偏見。它只是一面鏡子,誠(chéng)實(shí)地反應(yīng)出了社會(huì)上已經(jīng)發(fā)生的偏見:如果人類給機(jī)器的數(shù)據(jù)是帶有偏見的,就會(huì)創(chuàng)造出帶有偏見、歧視的 AI。

戴 “有色眼鏡” 看人,AI 不是第一次了

在有人發(fā)現(xiàn)“情感分析器” 的歧視問題后,Google 趕緊站出來(lái)給自家孩子道歉。其實(shí)這既不是第一個(gè)、也不會(huì)是最后一個(gè)已經(jīng) “學(xué)會(huì)歧視別人” 的 AI。

去年,普林斯頓大學(xué)的研究人員發(fā)表了一篇有關(guān)最先進(jìn)的自然語(yǔ)言處理技術(shù) GloVe 的文章,其中提到,研究人員搜索了網(wǎng)絡(luò)里最常出現(xiàn)的 8400 億個(gè)詞,發(fā)現(xiàn)其中針對(duì)少數(shù)民族和女性的算法有偏向性:通過使用 GloVe 對(duì)詞匯的情感進(jìn)行分類,研究人員發(fā)現(xiàn)非洲裔美國(guó)人常用的名字(比如Jermaine 或 Tamika)與不愉快的單詞有很強(qiáng)的聯(lián)系,而女性名稱和藝術(shù)、文藝類有很強(qiáng)的關(guān)聯(lián)。

雖然這種偏見并不一定與 Google 自然語(yǔ)言 API 的問題完全相同(例如性別和人名,這兩種在 API 中都是中性),但類似的點(diǎn)是:有偏見的數(shù)據(jù)輸入系統(tǒng),得出的結(jié)論肯定也是有偏見的。

Google 人工智能負(fù)責(zé)人 John Giannandrea 今年早些時(shí)候就曾說(shuō),他對(duì)人工智能的主要擔(dān)憂不是它們會(huì)變得太聰明、我們會(huì)被“超智能機(jī)器人” 控制。相反,對(duì)我們潛在威脅最大的,其實(shí)是那些歧視性的智能機(jī)器人。

因?yàn)殡S著 AI 在我們生活中的普及,以后生活中很多決定很可能不再由人類完成,而是交給比我們?nèi)祟惛斆?、獲取信息更快、分析問題更強(qiáng)大的 AI 處理。但 AI 又不可避免地吸收我們給它的文本中的偏見,再產(chǎn)生新的偏見。我們?nèi)绾卧谝粋€(gè)充滿偏見與歧視的系統(tǒng)里生活呢?

以我們上面那個(gè)“身材魁梧的壯漢”為例:假設(shè)以后房東在找租戶的時(shí)候用 AI 做決定,AI 一看到符合“壯漢”條件的人,就有樣學(xué)樣,自動(dòng)產(chǎn)生負(fù)面情緒。

難道到時(shí)候大街上就會(huì)徘徊著一群屢屢被房東拒、滿臉困惑的壯漢們嗎?

就像 Giannandrea 說(shuō)的,最重要的是,我們要努力尋找調(diào)教 AI 時(shí)用的文本和數(shù)據(jù)中隱藏的偏見,否則我們就會(huì)親手建立一個(gè)充滿偏見的系統(tǒng)。

當(dāng)然了,說(shuō)易行難。而且一個(gè)一個(gè)地糾正 AI 某個(gè)具體的偏見很簡(jiǎn)單(“壯漢不等于壞人!記住了沒?”),但系統(tǒng)、全面地糾正很難。

硅谷發(fā)明的產(chǎn)品,造就了智能科技時(shí)代的“歧視”?

如果硅谷的這些高科技產(chǎn)品都是“天生歧視”的,以后我們把這些產(chǎn)品運(yùn)用到日常生活里,會(huì)有什么樣的后果?會(huì)不會(huì)這些由人類產(chǎn)生、并且灌輸?shù)綑C(jī)器里的偏見與歧視,再反過頭來(lái)影響我們?

一向講究政治正確、關(guān)愛社會(huì)、改變世界的硅谷,就會(huì)處在一個(gè)有意思的位置:政治正確的硅谷鼓搗出了未來(lái)掌控我們生活的 AI,但這位誕生于硅谷的 AI 君卻充滿了“紅脖子” 氣質(zhì)(注:紅脖子不是指脖子曬紅的人,在美國(guó)文化中以戲謔口吻泛指思想狹隘、常充滿偏見的保守主義者,他們和政治正確的左翼文化互相瞧不上,都覺得彼此被洗腦,遲早藥丸)。

哎呀你看,密探這么描述“紅脖子”,如果這段文字以后被 AI 看到了,可能就又會(huì)對(duì)這個(gè)詞產(chǎn)生負(fù)面印象……

這么說(shuō)來(lái),我們?nèi)祟愐院筘M不是很可能要為了討 AI 的“歡心” 而規(guī)范自己的行為?但是 AI 君的心思還真難猜,連 Peter Thiel、小扎這種我們?nèi)祟惱镒顑?yōu)秀的代表都被 AI 歧視了,很可能我們每個(gè)人都會(huì)在某個(gè)方面成為被 AI 歧視的少數(shù)群體:你很優(yōu)秀?抱歉你是猶太人;或者你工作體面收入高,但喜歡聽說(shuō)唱音樂?不好意思, AI 對(duì)喜歡聽說(shuō)唱音樂的人有點(diǎn)想法。

不過,“喂” 給 AI 的材料說(shuō)到底還是我們?nèi)祟悓懙摹?磥?lái),為了避免以后被任性的 AI 歧視,我們?nèi)祟惒环翉默F(xiàn)在開始對(duì)彼此寬容一點(diǎn),這樣我們寫的東西,也就是“喂”給 AI 的材料本身,才不會(huì)有偏見。

最后開個(gè)腦洞:如果這個(gè) “情感分析器” 分析中文文本,我們可以給它大量輸入中文新聞、小說(shuō)、雜志等,再問它對(duì)一些人或事物的看法,比如:“我是X省人”“我是90后”“我是程序員” 之類的, 不知道它會(huì)給出什么樣的 “喜好評(píng)分” 呢?

這畫面太美,密探別說(shuō)不敢看,連想都不敢想……

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-11-23
我親手調(diào)教的AI,竟然開始歧視我了
作者:硅谷密探 想像一下,如果你和一個(gè)人聊天,你和他說(shuō)“我是一只狗”,這個(gè)人會(huì)給你一個(gè)微笑;但是如果你和他說(shuō)“我是一個(gè)同性戀”的話,這家伙卻露出難過的表情。你

長(zhǎng)按掃碼 閱讀全文