李偉
通過簡(jiǎn)單的App操作,視頻中的一個(gè)人物就能輕易地被替換成另一個(gè)人物,表情、動(dòng)作、姿態(tài)幾乎能夠完全同步。這類基于AI的人體圖像合成技術(shù)被統(tǒng)稱為“深度偽造”,意指通過AI深度學(xué)習(xí)的方式,將現(xiàn)有的圖像和視頻組合并疊加成新的圖像和視頻,達(dá)到以假亂真的效果。它最初有另外一個(gè)名稱——“深度合成”。2015年到2016年,美國的程序員圈子開始流行制作搞笑的“換頭”視頻。在此基礎(chǔ)上,AI深度學(xué)習(xí)的算法不斷疊加,形成了一個(gè)技術(shù)體系,被稱為“深度合成”。典型的“深度合成”技術(shù)體系主要包括人臉替換、人臉再現(xiàn)、人臉合成以及語音合成等4種形式。
人臉替換是指將某人(源人物)的臉部圖像“縫合”到另一個(gè)人(目標(biāo)人物)的臉上,從而覆蓋目標(biāo)人物的面部;人臉再現(xiàn)利用AI技術(shù)改變?nèi)说拿娌刻卣?,包括目?biāo)對(duì)象的口鼻、眉毛、眼睛,從而操控目標(biāo)對(duì)象的臉部表情。人臉再現(xiàn)不同于人臉替換,前者側(cè)重于改變某人的面部表情,從而讓其“看起來正在說他從未說過的話”;人臉合成可以創(chuàng)建全新的人臉圖像,隨機(jī)生成的人臉圖像,可以媲美真實(shí)的人臉圖像,甚至能夠代替一些真實(shí)人物的肖像,用于廣告宣傳、用戶頭像等;語音合成涉及創(chuàng)建特定的聲音模型,不僅可以將文字轉(zhuǎn)化成聲音,而且可以將其轉(zhuǎn)化為接近真人語調(diào)和語音節(jié)奏的聲音。例如,風(fēng)靡加拿大的語音合成系統(tǒng)軟件RealTalk,與以往基于語音輸入生成人聲的系統(tǒng)不同,它可以僅基于文本輸入就生成接近真人語音的聲音。
2017年,“深度合成”技術(shù)因?yàn)橐粋€(gè)無良網(wǎng)民的操作而變了味。在美國新聞網(wǎng)站Reddit的論壇上,一個(gè)名為“深度偽造”的用戶上傳了經(jīng)過AI技術(shù)篡改的色情視頻,這些視頻中的成人演員的臉竟然被替換成了當(dāng)紅明星的臉!為了吸引流量,追求商業(yè)利益,Reddit網(wǎng)站非但沒有對(duì)這種操作進(jìn)行封殺,反而將論壇直接更名為“深度偽造”,搖身一變成為分享虛假色情視頻的線上窩點(diǎn)。
盡管“深度偽造”論壇因充斥大量合成的色情視頻而被美國政府勒令關(guān)閉,但這種技術(shù)開源的算法和工具性的應(yīng)用不斷涌現(xiàn),比如Faceswap、FakeApp、face2face等。從那時(shí)起,美歐的新聞媒體開始使用“深度偽造”一詞來指代這種基于AI的技術(shù)。
“深度偽造”技術(shù)在中國的流行始于2019年初。彼時(shí),這種技術(shù)被稱為“AI換臉”。有影視劇愛好者將1994年版《射雕英雄傳》的一個(gè)片段在網(wǎng)絡(luò)上傳播開來。劇中人物黃蓉的扮演者朱茵的面孔,被換成了一位當(dāng)紅的內(nèi)地女明星。雖然人物的五官能夠看出不同,但換臉后的人物表情、動(dòng)作自然、流暢?!白屇趁餍撬查g擁有實(shí)力派演員的演技”,這種操作風(fēng)靡一時(shí),影視劇愛好者爭(zhēng)相制作并傳播經(jīng)典影視劇的“換臉”視頻。
互聯(lián)網(wǎng)時(shí)代,沒有永遠(yuǎn)的旁觀者,人人都可以成為參與者。既然可以給明星換臉,那么自己為什么不嘗試一下呢?2019年八九月份,一種新奇的App刷屏微信朋友圈。在手機(jī)上安裝這類App,就可以在視頻模板中給自己“一鍵換臉”,把自己植入某經(jīng)典影視劇的片段中。用戶體驗(yàn)后的感受是:視頻中自己的臉介于某明星和自己的相貌之間,相似度超過80%。
從此,“深度偽造”技術(shù)在我國的社交平臺(tái)上流行起來。在一些互聯(lián)網(wǎng)平臺(tái)上搜索“換臉術(shù)”,能找到相當(dāng)數(shù)量的視頻。有的是由軟件直接生成的,有的是由專門做“換臉視頻“的發(fā)燒友上傳的。
1997年,著名導(dǎo)演吳宇森曾執(zhí)導(dǎo)過一部獲得第70屆奧斯卡金像獎(jiǎng)的動(dòng)作影片——《變臉》,講述恐怖分子和探員之間通過整形手術(shù)換臉后互換身份角色的故事。吳宇森或許沒有想到,20多年后,不需要實(shí)施整形手術(shù)就可實(shí)現(xiàn)的“AI換臉”風(fēng)靡全球。
在國內(nèi),“深度偽造”技術(shù)已經(jīng)在影視劇制作領(lǐng)域得到應(yīng)用?;蛟S有觀眾在電視劇中看到過這樣的角色:他看起來有點(diǎn)像演員A,但仔細(xì)看看,發(fā)現(xiàn)是演員B。其實(shí)這個(gè)角色最開始是由演員A飾演的,但他因個(gè)人的不當(dāng)言論或行為而被封殺,導(dǎo)致該劇不能播出。制作方只得請(qǐng)來演員B救場(chǎng)。劇集當(dāng)然不可能重新拍攝,這時(shí)候就輪到“深度偽造”技術(shù)大顯身手了。經(jīng)過“AI換臉”,劇中演員A的形象全部換成了演員B。
目前“深度偽造”技術(shù)被應(yīng)用于影視、娛樂和社交等諸多領(lǐng)域,或是被用于升級(jí)傳統(tǒng)的音視頻處理技術(shù),帶來更好的影音體驗(yàn),或是被用于進(jìn)一步打破語言障礙,優(yōu)化社交體驗(yàn)。從中長(zhǎng)期來看,“深度偽造”技術(shù)既可以基于其深度仿真的特征,超越時(shí)空限制,豐富人們?cè)谔摂M世界的交互體驗(yàn),也可以基于其合成性,創(chuàng)造一些超越真實(shí)世界的“素材”。
然而,與在影視劇制作等領(lǐng)域的應(yīng)用相比,“深度偽造”技術(shù)催生的“灰色產(chǎn)業(yè)”令人擔(dān)憂。在線上購物平臺(tái)搜索“AI換臉”,能找到大量音視頻。有商家提供這種定制服務(wù),報(bào)價(jià)僅幾十元。有的商家提供PS“換頭換臉”服務(wù),可以為用戶的照片更換背景,制作與明星的“合影”,或者將用戶的“頭”完美地“嫁接”到明星的身上,不僅能實(shí)現(xiàn)正臉替換,還能將側(cè)臉換成正臉。也有商家表示,可以定制“AI換臉”視頻,制作“穿越大片”、實(shí)施形象包裝。制作這類視頻的收費(fèi)標(biāo)準(zhǔn)一般為每分鐘60元左右。
AI的快速發(fā)展,使得“深度偽造”技術(shù)不斷迭代,尤其是“生成對(duì)抗網(wǎng)絡(luò)”(GAN)技術(shù)的出現(xiàn),使得“深度偽造”技術(shù)不僅所需的數(shù)據(jù)量下降,而且產(chǎn)品質(zhì)量也比前幾代版本大幅提高。“深度偽造”作為一種技術(shù)工具,能讓“偽造物”具有高度的真實(shí)性。這種技術(shù)優(yōu)勢(shì)意味著,它可以在很多領(lǐng)域發(fā)揮作用。
2017年以來,有關(guān)“深度偽造”技術(shù)的開源軟件在全球各國涌現(xiàn)。其開發(fā)成本大幅降低,并且能夠被不具備專業(yè)知識(shí)的普通人輕易地使用。制作這類視頻不需要高超的技巧,AI算法與面部映射軟件結(jié)合,在偽造的內(nèi)容中嵌入一個(gè)人的聲音、面孔和體態(tài)等身份信息,“一鍵”便可制作想要的視頻。
上傳自己的“臉”,就能把諸多明星的表演換成自己的“表演”——這類技術(shù)帶來有趣體驗(yàn)的同時(shí),也引發(fā)人們對(duì)隱私、版權(quán)、安全等方面的擔(dān)憂。
“深度偽造”技術(shù)泛濫帶來的一個(gè)嚴(yán)重后果,就是使信息的真實(shí)性面臨嚴(yán)峻挑戰(zhàn)。自從攝影技術(shù)、視頻、射線掃描技術(shù)出現(xiàn)后,視覺文本的客觀性就在法律、新聞以及其他社會(huì)領(lǐng)域被慢慢建立起來,成為真相的代表,或者說,它們是反映真相的最有力的證據(jù)?!把垡姙閷?shí)”成為這一認(rèn)知權(quán)威的通俗表達(dá)。在這個(gè)意義上,視覺客觀性源自特定的專業(yè)權(quán)威體制。
然而,“深度偽造”的技術(shù)優(yōu)勢(shì)和“游獵”特征,使得這一專業(yè)權(quán)威體制遭遇前所未有的挑戰(zhàn)。借助這種技術(shù)制作出的視覺文本,有了與事實(shí)不同乃至完全相反的內(nèi)容和涵義,造成了視覺文本的自我顛覆,也就從根本上顛覆了客觀性或者真相的生產(chǎn)體制。
PS技術(shù)出現(xiàn)并被廣泛應(yīng)用后,“有圖”不再“有真相”?!吧疃葌卧臁奔夹g(shù)的出現(xiàn),則讓原本代表著真相的視頻變成了鏡花水月。這對(duì)于本來就“假消息滿天飛”的互聯(lián)網(wǎng)來說,無疑進(jìn)一步造成“信任崩壞”。
迄今為止,可以說立法是滯后于“深度偽造”技術(shù)發(fā)展的,催生了一定的“灰色地帶”?!吧疃葌卧臁奔夹g(shù)生成的圖像和視頻,基本上都是由AI從零開始創(chuàng)建的,而且可以不受限制地用于任何目的,不必?fù)?dān)心版權(quán)、傳播權(quán)、侵權(quán)賠償和版稅等問題。因此,這也帶來了“深度偽造”圖像及視頻的版權(quán)歸屬問題。
“深度偽造”行為一旦被利益相關(guān)者發(fā)現(xiàn),誰有權(quán)刪除數(shù)據(jù)?違法者或侵權(quán)者制作的信息,是否具備權(quán)利屬性?當(dāng)社交平臺(tái)發(fā)現(xiàn)疑似“深度偽造”視頻時(shí),是否可以簡(jiǎn)單地通過刪除來規(guī)避責(zé)任?這種行為是否會(huì)阻礙信息傳播自由?
在注意力經(jīng)濟(jì)興起的社會(huì)背景下,與“深度偽造”的博弈是一場(chǎng)“有關(guān)真實(shí)的游戲”。在以AI為技術(shù)基礎(chǔ)的“后真相時(shí)代”,“深度偽造”進(jìn)一步用超越人類識(shí)別能力的技術(shù),模糊了真與假的界限,并將真相開放為“可加工的內(nèi)容”,供所有參與者使用?!吧疃葌卧臁遍_啟的是普通人參與視覺表達(dá)的新階段。然而,這種表達(dá)方式也給整個(gè)社會(huì)帶來了更大的挑戰(zhàn)。察覺風(fēng)險(xiǎn),審慎回應(yīng),應(yīng)該是我們做出努力的第一步。