李英菁
4月29日,仿生人形機器人“小柒”在2024中關村論壇年會現(xiàn)場與參觀者互動。
自ChatGPT橫空出世以來,人工智能(AI)發(fā)展步入了新階段,各類AI大模型如雨后春筍般不斷生長。隨著Stable Diffusion、Midjourney等圖像生成大模型的誕生和OpenAI推出全新文生視頻模型Sora,多模態(tài)AIGC(人工智能生成內(nèi)容)的潛力被廣泛看好。
但當前各國人工智能領域相關法律還處在探索階段,AIGC版權管理等問題懸而未決,尤其是倫理挑戰(zhàn)已經(jīng)成為AI帶來的廣泛爭議中最為突出的話題。在法律法規(guī)完善之前,AI正快速地改變著人們的生活。
進入互聯(lián)網(wǎng)時代,智械危機一直是文學、影視創(chuàng)作的熱門題材,電影《黑客帝國》中描繪了機器覺醒智能后統(tǒng)治人類,將人類變?yōu)榘l(fā)電工具這一令人毛骨悚然的想象。如果說AlphaGo戰(zhàn)勝柯潔讓世界意識到AI在特定領域的優(yōu)越性,以ChatGPT為代表的新一代大模型展現(xiàn)出的潛力則在帶來巨大驚喜的同時,讓人們不禁擔憂那些原本遙遠的科學幻想或許即將走入現(xiàn)實。
但在有關于人類命運的思考之外,很多人面臨的問題并不是擁抱AI還是拒絕AI,而是使用或者被淘汰。
現(xiàn)階段,盡管AI在技術和成本層面還不具備大規(guī)模替代人力的能力,但隨著大模型的不斷迭代和功能完善,其應用場景將越來越廣泛,特別是實用性強的AIGC尤為受到追捧。
4月15日,四川日報社發(fā)布國內(nèi)首個針對數(shù)字記者的管理辦法——《四川日報社數(shù)字記者信息管理辦法(試行)》,其背后是四川日報社已構建起國內(nèi)最大數(shù)字記者矩陣。
依托目前的數(shù)字人技術,通過對記者形象、聲線的克隆生成數(shù)字形象后,記者只需要在播報數(shù)智人平臺輸入文字、音頻,即可快速生成數(shù)字人播報視頻,視頻新聞的生產(chǎn)效率得到極大提升,省去了妝發(fā)、調(diào)試、拍攝等環(huán)節(jié)的程序。過去耗費一個小時至幾個小時才能制作出的視頻新聞,只需要幾分鐘就可以生成,甚至可以支持多種語言的轉化。
丸子是一名獨立游戲的開發(fā)者,在各大開源模型推出之初,他就開始研究如何更好地使用AI?!癆I幫我節(jié)省了大量尋找美術方面參考素材的時間?!彼嬖V《中國報道》記者,“AI輔助下,我的工作效率能提高10%左右,對‘大廠(大型互聯(lián)網(wǎng)公司)來說,這個提升率會更高。”
多個“大廠”的AIGC相關職位招聘如火如荼,很多非專門崗位也標注了熟悉AIGC者優(yōu)先,而美術、設計、程序等崗位則面臨著優(yōu)化自己或者被優(yōu)化的窘境。
幾次科技革命的前車之鑒猶在眼前,在這場人工智能變革中,誰都不想落于人后,做那個“跟不上時代”的人。然而,有追捧自然也有反對,畢竟在對人工智能應用的探索中,“翻車”的情況并不少。
2023年11月,有用戶對WPS隱私政策中“我們將對您主動上傳的文檔材料,在采取脫敏處理后作為AI訓練的基礎材料使用”的說明提出質(zhì)疑,引發(fā)軒然大波。當月18日,金山文檔道歉并修改相關內(nèi)容。
今年4月30日,配音演員林景在社交平臺上控訴中央廣播電視總臺“中國之聲”欄目發(fā)布的國內(nèi)首部AI全流程廣播科幻劇《異世界甜甜圈》中使用的AI聲線音色、咬字習慣與其本人相似度極高,而視頻中的另一個聲音與配音演員彭博的聲音幾乎一模一樣。
無獨有偶,4月23日,北京互聯(lián)網(wǎng)法院對全國首例“AI聲音侵權案”進行一審宣判,認定被告方使用原告聲音,開發(fā)案涉AI文本轉語音產(chǎn)品未獲得合法授權,構成侵權,需書面賠禮道歉,并賠償原告各項損失25萬元。消息公布后,知名配音演員阿杰等紛紛轉發(fā),號召保護聲音權益。兩天后,騰訊音樂娛樂集團(TME)宣布與配音演員趙乾景合作演繹《凡人修仙傳》AI有聲劇。
與此前的AI聲音侵權案不同,TME和配音演員本人達成了授權協(xié)議,雙方的合作似乎無可指摘,然而消息公布后,迎來的卻是幾乎清一色的反對聲。在TME與趙乾景微博評論區(qū),不少廣播劇和配音愛好者表達了對趙乾景“販賣聲線”的憤怒、失望,以及對配音行業(yè)前景的擔憂。
“AI不應被用于創(chuàng)作?!狈磳φ哒J為,配音演員對人物情感的揣摩、對臺詞的細節(jié)處理才是配音的精髓所在,盡管AI配音乍一聽很“前衛(wèi)”,但只能仿形而不能仿神,對這種充滿了“科技與狠活”的作品,他們并不買賬。更重要的是,要實現(xiàn)AI聲線克隆,僅僅有授權者自己的聲音是不夠的,必須先將海量其他人的聲音素材“喂”進去,訓練出基礎大模型,而這些素材大多數(shù)是無授權的。
目前主要的人工智能大模型采用的都是opt-out(選擇退出)的授權方式,即默認互聯(lián)網(wǎng)上公開發(fā)布的所有素材可以用于模型訓練,如有異議則需在規(guī)定時間內(nèi)選擇退出。
換句話說,就是所有互聯(lián)網(wǎng)用戶都自動“被同意”將自己發(fā)表過的內(nèi)容用于AI模型訓練,這也是生成式AI在版權上的重要爭議所在。
想要大模型維持足夠的穩(wěn)定性和不斷進化,就必須有海量的真實素材“打底”,在反對者看來,這是一種披上科技外衣的剽竊。他們認為,現(xiàn)有AIGC本質(zhì)只是寄生在創(chuàng)作者身上,將無數(shù)素材進行“分尸”,經(jīng)過海量運算后,根據(jù)特定指令拼接糅合的結果,并將AI產(chǎn)出內(nèi)容的過程稱為“尸塊拼接”。
針對生成式AI,抵抗者們也在積極開發(fā)應對策略。一個來自芝加哥大學的團隊推出了免費程序Glaze,用于保護素材不被AI識別,并在此基礎上開發(fā)出Nightshade,通過對圖像“涂毒”,干擾、破壞AI模型,以達到保護創(chuàng)作者的目的。
該團隊在The Glaze Protect官網(wǎng)上闡述了其價值觀和使命:“藝術來源于人類對經(jīng)歷、情感、痛苦和創(chuàng)傷的表達。藝術將人類聯(lián)系在一起,為我們解釋人之所以為人。我們相信,人類的創(chuàng)造力是獨一無二的……我們的目標是通過提供技術工具,使所有人類創(chuàng)作者(藝術家、音樂家、作家、記者、配音、舞者、編舞家……)能夠保護他們的藝術創(chuàng)作不會在非自愿情況下被用于人工智能訓練和模仿,讓人類的創(chuàng)造力繼續(xù)繁榮。”
此外,AI在生產(chǎn)虛假內(nèi)容上的“高質(zhì)量、高效率”也引發(fā)了廣泛擔憂。隨著大模型的進化,如果發(fā)布者不主動標注,辨識AIGC的難度和成本將越來越高,帶來一系列連鎖反應。
2023年5月2日,美國編劇工會爆發(fā)規(guī)??棺h活動,這場曠日持久的罷工持續(xù)了148天,好萊塢停擺,多部影視劇延遲上映,米爾肯研究所經(jīng)濟學家凱文·克勞登估計,相關行業(yè)至少蒙受了50億美元的經(jīng)濟損失。而這場罷工的導火索之一就是AI進入劇本創(chuàng)作環(huán)節(jié)。
參與罷工的編劇舉著“AI無法取代編劇”“AI沒有靈魂”“我讓ChatGPT寫一條標語,但它寫得很爛”等標語,編劇們擔心,制作公司會用劇本訓練人工智能模型,讓編劇修改由AI生成的稿件,這將嚴重影響編劇的創(chuàng)作收益,并助長剽竊行為。
最終,盡管美國電影電視制片人聯(lián)盟與美國編劇工會聯(lián)盟達成協(xié)議,約定了AI生成素材的限制條件以保護編劇權益,并承諾公司不能強制編劇使用AI寫作。但人工智能在劇本創(chuàng)作等領域的應用已經(jīng)成為無法逆轉的趨勢。
“用戶對AI比較敏感?!弊鳛橐幻嫀?,周周日常的主要工作是游戲的原畫設計。她向記者反映,雖然由于玩家的抵觸,沒有游戲會公開承認自己使用AI完成部分流程,但使用AI輔助美術環(huán)節(jié),提升工作效率已經(jīng)成為業(yè)內(nèi)的常見現(xiàn)象。
“游戲研發(fā)過程中,AI一般會用于前期跑概念。我?guī)秃M庋邪l(fā)團隊做人物設計的時候,會根據(jù)團隊的描述用AI快速生成概念圖,節(jié)省了很多找素材核對的時間。中期,在草圖、線稿和輔色大關系確定以后,也會使用AI進行細化?!彼榻B道,“但AI跑出來的圖沒辦法直接用,必須再進行修改。一是太假了,能一眼看出是AI出圖;二是電腦參數(shù)會限制出圖的清晰度。”
談及圈子里一些畫師對AI繪畫的抵制,周周直言:“我們不在一個階段。對商業(yè)繪畫來說,AI只是一個提高效率的工具。打個比方,原本一張圖的制作周期是兩周,AI來了以后,上級說讓你三天做完。游戲什么時候上線?項目經(jīng)理瘋狂催催催,你得跟上進度。”
“反對AI的人有自己的價值追求。但對我來說,AI能縮短我的工期,那是我的面包,是我的六便士?!?/p>
(應受訪者要求,文中人名均為化名)