AI制造的垃圾正在污染我們的文化

大量人工智能生成的內(nèi)容充斥網(wǎng)絡(luò),不僅影響網(wǎng)絡(luò)環(huán)境,更滲透到科學(xué)研究、社交媒體、新聞媒體等領(lǐng)域,對(duì)人類文化造成負(fù)面影響,亟需采取措施加以管制。

越來(lái)越多的合成AI生成的內(nèi)容充斥著我們的信息流和搜索結(jié)果。這些問(wèn)題的嚴(yán)重性遠(yuǎn)遠(yuǎn)超出了我們的屏幕。整個(gè)文化都受到了AI的溢出效應(yīng)影響,這種影響正悄然侵蝕我們最重要的機(jī)構(gòu)。

以科學(xué)為例。在OpenAI發(fā)布的最新人工智能模型GPT-4之后,科學(xué)研究的語(yǔ)言開(kāi)始發(fā)生變化。尤其是在AI領(lǐng)域本身。本月發(fā)表的一項(xiàng)研究考察了多個(gè)知名科學(xué)會(huì)議上研究AI的科學(xué)家的同行評(píng)審——這些評(píng)審是科學(xué)研究進(jìn)展的基石——在這些會(huì)議上,同行評(píng)審中使用“細(xì)致”一詞的頻率是前一年的34倍以上。使用“值得稱贊”的頻率大約是10倍,“復(fù)雜”則是11倍。其他大型會(huì)議也顯示出類似的模式。

這些短語(yǔ)當(dāng)然是現(xiàn)代大型語(yǔ)言模型(如ChatGPT)的最愛(ài)。換句話說(shuō),大量AI會(huì)議上的研究人員被發(fā)現(xiàn)將他們的同行評(píng)審工作交給了AI——或者至少是在AI的大量幫助下撰寫。而且,提交的評(píng)審越是臨近截止日期,其中發(fā)現(xiàn)的AI使用就越多。

如果這讓你感到不適——尤其是考慮到AI目前的不可靠性——或者你認(rèn)為應(yīng)該由科學(xué)家而不是AI來(lái)評(píng)審科學(xué),這些感受突顯了這項(xiàng)技術(shù)核心的悖論:在欺詐和常規(guī)使用之間的道德界限并不清楚。一些AI生成的欺詐很容易識(shí)別,就像一篇醫(yī)學(xué)期刊論文中出現(xiàn)的卡通老鼠,其生殖器官異常巨大。許多其他欺詐則更為隱蔽,就像同一篇論文中描述的錯(cuò)誤標(biāo)記和幻覺(jué)般的調(diào)控途徑——這篇論文也經(jīng)過(guò)了同行評(píng)審(也許,有人可能會(huì)推測(cè),是由另一個(gè)AI評(píng)審的?)。

當(dāng)AI以預(yù)期的方式被使用——協(xié)助寫作時(shí),又會(huì)發(fā)生什么?最近,當(dāng)人們發(fā)現(xiàn)簡(jiǎn)單的科學(xué)數(shù)據(jù)庫(kù)搜索返回了像“作為一個(gè)AI語(yǔ)言模型”這樣的短語(yǔ),這是因?yàn)橐蕾嘇I的作者忘記了掩蓋他們的蹤跡。如果這些作者簡(jiǎn)單地刪除了這些意外的水印,他們使用AI來(lái)寫論文是否就可以接受?

科學(xué)領(lǐng)域正在發(fā)生的事情只是一個(gè)更大問(wèn)題的縮影。在社交媒體上發(fā)帖?現(xiàn)在任何關(guān)于X的熱門帖子幾乎肯定包含了AI生成的回復(fù),從對(duì)原始帖子的總結(jié)到用ChatGPT那種平淡無(wú)奇的維基百科式語(yǔ)氣寫出的反應(yīng),都是為了吸引關(guān)注。Instagram上充斥著AI生成的模特,Spotify上有AI生成的歌曲。出版一本書(shū)?之后不久,在亞馬遜上通常會(huì)出售聲稱與你的書(shū)配套的AI生成的“工作簿”(它們的內(nèi)容是錯(cuò)誤的;我知道這一點(diǎn),因?yàn)檫@也發(fā)生在我身上)。谷歌搜索的頂部結(jié)果現(xiàn)在經(jīng)常是AI生成的圖像或文章。像《體育畫報(bào)》這樣的主要媒體已經(jīng)開(kāi)始創(chuàng)建AI生成的文章,歸功于同樣虛假的作者檔案。銷售搜索引擎優(yōu)化方法的營(yíng)銷人員公開(kāi)吹噓使用AI創(chuàng)建數(shù)千篇垃圾文章,以從競(jìng)爭(zhēng)對(duì)手那里竊取流量。

然后是生成性AI日益增長(zhǎng)的使用,用于擴(kuò)大YouTube上兒童合成視頻的制作規(guī)模。一些輸出的例子是洛夫克拉夫特式恐怖,比如關(guān)于鸚鵡的音樂(lè)視頻,其中鳥(niǎo)類有眼睛中的眼睛,喙中的喙,形態(tài)不可理解地變化,用人工聲音唱著,“樹(shù)上的鸚鵡說(shuō)你好,你好!”敘述沒(méi)有意義,角色隨機(jī)出現(xiàn)和消失,基本事實(shí)(如形狀的名稱)都是錯(cuò)誤的。在我發(fā)現(xiàn)我的通訊《內(nèi)在視角》上許多這樣的可疑頻道后,《連線》雜志發(fā)現(xiàn)了一些擁有數(shù)十萬(wàn)甚至數(shù)百萬(wàn)訂閱者的賬戶在生產(chǎn)流程中使用生成性AI的證據(jù)。

作為一名神經(jīng)科學(xué)家,這讓我感到擔(dān)憂。難道人類文化中不包含認(rèn)知微量營(yíng)養(yǎng)素——像連貫的句子、敘述和角色連貫性這樣的東西——發(fā)展中的大腦需要嗎?愛(ài)因斯坦據(jù)說(shuō)曾說(shuō)過(guò):“如果你想讓你的孩子聰明,就給他們讀童話故事。如果你想讓他們非常聰明,就給他們讀更多的童話故事。”但是,當(dāng)一個(gè)幼兒主要消費(fèi)AI生成的夢(mèng)想垃圾時(shí),會(huì)發(fā)生什么?我們發(fā)現(xiàn)自己正處于一個(gè)巨大的發(fā)展實(shí)驗(yàn)之中。

現(xiàn)在互聯(lián)網(wǎng)上有如此多的合成垃圾,以至于AI公司和研究人員自己也感到擔(dān)憂,他們擔(dān)心的不是文化的健康狀況,而是他們的模型將會(huì)發(fā)生什么。隨著AI能力在2022年的提升,我寫過(guò)關(guān)于文化變得如此泛濫于AI創(chuàng)作,以至于當(dāng)未來(lái)的AI被訓(xùn)練時(shí),之前的AI輸出將滲透到訓(xùn)練集中,導(dǎo)致未來(lái)的復(fù)制品的復(fù)制品的復(fù)制品,因?yàn)閮?nèi)容變得越來(lái)越刻板和可預(yù)測(cè)。2023年,研究人員引入了一個(gè)技術(shù)術(shù)語(yǔ)來(lái)描述這種風(fēng)險(xiǎn)如何影響AI訓(xùn)練:模型崩潰。在某種程度上,我們和這些公司處于同一條船上,劃著同一股污泥流入我們的文化海洋。

帶著這種不愉快的比喻,值得看看我們當(dāng)前情況的最清晰的類比:環(huán)境運(yùn)動(dòng)和氣候變化。正如公司和個(gè)人被不可阻擋的經(jīng)濟(jì)學(xué)驅(qū)動(dòng)去污染一樣,AI的文化污染也是由理性的決定驅(qū)動(dòng)的,以盡可能便宜的方式填補(bǔ)互聯(lián)網(wǎng)對(duì)內(nèi)容的貪婪需求。雖然環(huán)境問(wèn)題遠(yuǎn)未解決,但已經(jīng)取得了不可否認(rèn)的進(jìn)展,使我們的城市基本上沒(méi)有霧霾,我們的湖泊基本上沒(méi)有污水。這是怎么做到的?

在任何具體政策解決方案之前,是承認(rèn)環(huán)境污染是一個(gè)需要外部立法解決的問(wèn)題。對(duì)這一觀點(diǎn)產(chǎn)生影響的是1968年由生物學(xué)家和生態(tài)學(xué)家加勒特·哈丁提出的觀點(diǎn)。哈丁博士強(qiáng)調(diào),污染問(wèn)題是由人們?yōu)榱俗约旱睦嫘惺峦苿?dòng)的,因此“只要我們只像獨(dú)立的、理性的、自由企業(yè)者那樣行事,我們就鎖定在一個(gè)‘弄臟自己的巢’的系統(tǒng)中?!彼麑?wèn)題總結(jié)為“公地悲劇”。這種框架對(duì)環(huán)境運(yùn)動(dòng)起到了推動(dòng)作用,該運(yùn)動(dòng)依靠政府監(jiān)管來(lái)完成公司單獨(dú)或不愿意做的事情。

我們?cè)俅伟l(fā)現(xiàn)自己在上演一場(chǎng)公地悲?。憾唐诮?jīng)濟(jì)自利鼓勵(lì)使用廉價(jià)的AI內(nèi)容來(lái)最大化點(diǎn)擊和觀看,這反過(guò)來(lái)又污染了我們的文化,甚至削弱了我們對(duì)現(xiàn)實(shí)的把握。到目前為止,主要的AI公司拒絕采取先進(jìn)的方法來(lái)識(shí)別AI的作品——他們可以通過(guò)在單詞使用或圖像像素中隱藏微妙的統(tǒng)計(jì)模式來(lái)做到這一點(diǎn)。

不采取行動(dòng)的一個(gè)常見(jiàn)理由是,如果知道足夠多,人類編輯總可以調(diào)整任何使用的模式。然而,我們正在經(jīng)歷的許多問(wèn)題并不是由有動(dòng)機(jī)和技術(shù)熟練的惡意行為者引起的;它們主要是由普通用戶不遵守幾乎不存在的道德使用界限所引起的。大多數(shù)人對(duì)將統(tǒng)計(jì)模式納入輸出的先進(jìn)對(duì)策不感興趣,理想情況下,這些輸出應(yīng)該標(biāo)明它們是由AI生成的。

這就是為什么獨(dú)立研究人員能夠以驚人的高準(zhǔn)確率在同行評(píng)審系統(tǒng)中檢測(cè)到AI輸出:他們真的嘗試了。同樣,現(xiàn)在全國(guó)的老師們已經(jīng)創(chuàng)建了自制的輸出側(cè)檢測(cè)方法,比如在只有復(fù)制粘貼時(shí)才會(huì)出現(xiàn)的論文提示中添加隱藏的單詞使用模式請(qǐng)求。

特別是,AI公司似乎反對(duì)任何可以提高AI檢測(cè)努力合理水平的內(nèi)置模式,也許是因?yàn)樗麄儞?dān)心,執(zhí)行這些模式可能會(huì)通過(guò)限制輸出太多而干擾模型的性能——盡管目前沒(méi)有證據(jù)表明這是風(fēng)險(xiǎn)。盡管公開(kāi)承諾要開(kāi)發(fā)更先進(jìn)的水印技術(shù),但越來(lái)越清楚的是,公司之所以拖延,是因?yàn)閷?duì)于AI行業(yè)來(lái)說(shuō),擁有可檢測(cè)的產(chǎn)品是違背其底線的。

為了應(yīng)對(duì)這種企業(yè)的拒絕行動(dòng),我們需要相當(dāng)于《清潔空氣法》的東西:《清潔互聯(lián)網(wǎng)法》。也許最簡(jiǎn)單的解決方案將是立法強(qiáng)制生成的輸出內(nèi)在的高級(jí)水印,比如不容易移除的模式。就像20世紀(jì)需要廣泛的干預(yù)來(lái)保護(hù)共享環(huán)境一樣,21世紀(jì)將需要廣泛的干預(yù)來(lái)保護(hù)一個(gè)不同的、但同樣關(guān)鍵的共同資源,一個(gè)我們直到現(xiàn)在才注意到的共同資源,因?yàn)樗鼜奈词艿酵{:我們共享的人類文化。

本文譯自 The New York Times,由 BALI 編輯發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2024-04-04
AI制造的垃圾正在污染我們的文化
大量人工智能生成的內(nèi)容充斥網(wǎng)絡(luò),不僅影響網(wǎng)絡(luò)環(huán)境,更滲透到科學(xué)研究、社交媒體、新聞媒體等領(lǐng)域,對(duì)人類文化造成負(fù)面影響,亟需采取措施加以管制。 越來(lái)越多的合成AI生成的內(nèi)容充斥著我們的信息流和搜索結(jié)果。

長(zhǎng)按掃碼 閱讀全文