無(wú)論選民說(shuō)何種語(yǔ)言,AI生成的網(wǎng)絡(luò)虛擬人物(也被稱為Avatar)都可以直接叫出你的名字。
專家們擔(dān)心在這個(gè)假信息泛濫的國(guó)家里,AI工具極有可能被誤用。
01
印度總理納倫德拉莫迪用AI生成競(jìng)選視頻拉選票
想要一窺人工智能(AI)是如何在大選中發(fā)揮作用的,必須看向全球最大的民主國(guó)家印度,4月19日正是拉選票的日子。
AI生成了一段印度總理納倫德拉 莫迪的高度個(gè)性化視頻,并通過(guò)社交軟件WhatsApp傳遞給了印度近10億選民,說(shuō)明了AI拉票的可能性。這段演示視頻的源頭尚不明確,但視頻中莫迪竟然可以對(duì)觀看視頻的用戶直呼其名。
但視頻仍有瑕疵。視頻里的莫迪似乎戴了兩副眼鏡,也有部分內(nèi)容非常模糊。
02
技術(shù)濫用、虛假信息,AI世界是否成為法外之地?
莫迪所在的印度人民黨工作人員上行下效,使用AI生成的視頻在WhatsApp上向選民拉票,特別針對(duì)受益于政府優(yōu)惠政策的選民,要求他們給自己的政黨投票。
這些視頻可自動(dòng)生成幾十種印度本土語(yǔ)言,通過(guò)AI技術(shù)可以用政黨領(lǐng)導(dǎo)者的聲音直接給選民打電話,尋求他們的支持。
相比于傳統(tǒng)的競(jìng)選手段,如此大范圍的深入基層選民竟節(jié)省了大量的時(shí)間和資金,因此也極有可能成為未來(lái)競(jìng)選的重要工具?茖W(xué)技術(shù)正在侵入政治領(lǐng)域,卻鮮有預(yù)防措施避免技術(shù)的濫用。
個(gè)性化視頻和聊天內(nèi)容看似無(wú)害,但專家擔(dān)心隨著技術(shù)的發(fā)展和推廣,選民們也將越來(lái)越難于鑒別信息的真假。
總部設(shè)在新德里的宣傳機(jī)構(gòu)互聯(lián)網(wǎng)自由基金會(huì)(Internet Freedom Foundation)執(zhí)行董事Prateek Waghre稱:“今年的AI世界就是無(wú)法無(wú)天的西部荒野”。他認(rèn)為AI技術(shù)正在進(jìn)入早已充斥著虛假信息的媒體世界。
放眼全球,選舉活動(dòng)正在成為AI繁榮發(fā)展的試驗(yàn)常新罕布什爾初選之時(shí),選民們接到了自動(dòng)語(yǔ)音電話讓他們不要投票,而來(lái)電聲音像極了美國(guó)總統(tǒng)拜登。
在印度,莫迪的印度人民黨和反對(duì)黨印度國(guó)民大會(huì)黨相互指責(zé)對(duì)方在網(wǎng)絡(luò)上傳播深度偽造的選舉相關(guān)內(nèi)容。
03
面部數(shù)據(jù)采集,模型訓(xùn)練,一天1萬(wàn)多個(gè)視頻的產(chǎn)量,AI初創(chuàng)公司是否在助紂為虐?
印度這場(chǎng)新戰(zhàn)斗的一個(gè)前線站點(diǎn)就在印度西部沙漠之邦的拉賈斯坦。在一條滿是塵土的背街旁的居民樓一樓,31歲的Divyendra Singh Jadoun從大學(xué)輟學(xué),開(kāi)創(chuàng)了一家AI公司“The Indian Deepfaker”(印度深度偽造)。
這家初創(chuàng)公司共有9人,他們用AI 生成寶萊塢男女明星視頻,今年年初,各個(gè)政黨和政黨領(lǐng)袖們開(kāi)始讓他們制作虛假視頻,Jadoun說(shuō)他收到了200單生意并同意制作其中的14單。
其中就有一單是印度人民黨33歲的Shakti Singh Rathore,他的工作是讓更多的人支持莫迪的方針政策,為此他決定用AI在互聯(lián)網(wǎng)生成一個(gè)虛擬的自己。
Rathore坐在The Indian Deepfaker公司辦公室的攝像頭前,準(zhǔn)備生成數(shù)字化的自己,他說(shuō):“AI技術(shù)非常棒,這是技術(shù)發(fā)展的必然,沒(méi)有這種技術(shù)我怎么可能在這么短的時(shí)間內(nèi),向更多的人傳播莫迪的政策。”
他們首先從錄制的視頻每一幀里抽取Rathore的臉部畫面。
然后收集他的面部特征,包括面部和唇部的大小以及雙眼凝視的相關(guān)數(shù)據(jù)。
Jadoun說(shuō)他們將采集到的數(shù)據(jù)輸入到AI模型,讓AI學(xué)習(xí)數(shù)據(jù)并預(yù)測(cè)面部微表情變化。“需要一直運(yùn)行程序,微調(diào)面部表情,直到滿意為止。”
此外,“克隆算法”程序可以分析錄音,學(xué)習(xí)聲音的高低起伏和音調(diào)變化。Jadoun說(shuō)他們通常需要6到8個(gè)小時(shí)的時(shí)間調(diào)整面部表情和唇部直到畫面與聲音同步。剩余的工作基本都是機(jī)器自動(dòng)完成。
在一段演示視頻中,這個(gè)團(tuán)隊(duì)只用了4分鐘就生成了大約20份個(gè)性化問(wèn)候視頻。
Jadoun說(shuō)他的團(tuán)隊(duì)一天之內(nèi)最多可以生成10000個(gè)視頻。對(duì)于那些時(shí)間緊任務(wù)重的工作,他們會(huì)租用GPU(圖形處理器)。
生成式人工智能還可以消除語(yǔ)言障礙,這對(duì)于一個(gè)多語(yǔ)言的國(guó)家尤其重要。人工智能生成的Rathore形象通過(guò)計(jì)算機(jī)處理可以用方言與印度各個(gè)角落的人溝通交流,即便是最偏遠(yuǎn)的地區(qū)也不例外。
各政黨不僅給選民發(fā)信息,還通過(guò)克隆聲音直接與選民打招呼,這一切都?xì)w功于類似ChatGPT一樣的聊天機(jī)器人。
04
當(dāng)總理喊出你的名字,對(duì)你表示問(wèn)候,說(shuō)出你的困難時(shí),你是否會(huì)因?yàn)楦袆?dòng)而投票?
過(guò)去的政黨代表給選民打電話時(shí),選民們通常會(huì)直接掛斷電話,Rathore說(shuō):“如今因?yàn)楫?dāng)?shù)卣h代表可以直接喊出選民的名字,就可以吸引他們的注意力。”
在與選民交流的過(guò)程中,聊天機(jī)器人會(huì)問(wèn)及當(dāng)?shù)卣疄槌鮿?chuàng)企業(yè)提供免費(fèi)用電或資金項(xiàng)目的情況,Rathore表示所有聊天均被錄像并轉(zhuǎn)寫,用于質(zhì)量控制和人工智能訓(xùn)練。
Rathore稱自己已經(jīng)為此花了大約24000美元,通過(guò)視頻信息和電話與120萬(wàn)人溝通交流,了解了哪些人不接視頻或電話。他稱這是印度人民黨未來(lái)工作的一項(xiàng)投資。
印度當(dāng)?shù)財(cái)?shù)字化媒體MediaNama的編輯Nikhil Pahwa表示個(gè)性化信息在印度可能有著難以估量的力量。
他表示:“印度人喜歡和冒充名人的人合影留念,比如他們接到了總理打來(lái)的電話,而總理說(shuō)話的口氣就好像很了解他們,知道他們住在哪里,知道他們的困難是什么,那么他們就會(huì)無(wú)比激動(dòng)。”
互聯(lián)網(wǎng)自由基金會(huì)的Waghre則質(zhì)疑人工智能生成的內(nèi)容是否足以說(shuō)服選民從而影響選舉結(jié)果,但他也承認(rèn)長(zhǎng)期的影響一定會(huì)出現(xiàn)問(wèn)題的,并表示:“一旦這種內(nèi)容變成了人們接受信息的正常渠道,那以后如果有虛假視頻那該怎么辦?”
莫迪自己要求對(duì)AI生成的視頻增加免責(zé)聲明,從而避免人們被“誤導(dǎo)”。Jadoun和另外兩個(gè)印度AI初創(chuàng)公司代表發(fā)起了“AI聯(lián)合聲明”運(yùn)動(dòng),要求保護(hù)數(shù)據(jù)隱私,增強(qiáng)選舉誠(chéng)信。例如Indian Deepfaker公司用AI生成的視頻會(huì)標(biāo)注“AI生成”,Jadoun稱AI生成的語(yǔ)音聊天機(jī)器人會(huì)表明自己的聲音是AI合成。
擁有拉賈斯坦邦多處度假勝地的28歲的Narendra Singh Bhati說(shuō)自己本周就接到了Rathore打給他的AI生成的語(yǔ)音電話。Bhati表示自己對(duì)于如此個(gè)性化的聲音印象深刻,感到震驚。
Bhati說(shuō)盡管電話已告知自己內(nèi)容是AI生成,但自己完全無(wú)法判斷是否真的是AI生成的。他說(shuō)自己甚至在通話快結(jié)束時(shí)對(duì)著電話說(shuō)了“再見(jiàn),Bhati先生”。