2022年11月,OpenAI震撼推出對(duì)話式AI模型ChatGPT,引發(fā)了新一輪人工智能(Artificial Intelligence,AI)邁向大模型時(shí)代的浪潮?;凇按髷?shù)據(jù)”“大算力”和“強(qiáng)算法”深度學(xué)習(xí)模型下的生成式人工智能(Artificial Intelligence Generated Content,AIGC,下文簡(jiǎn)稱人工智能)開始深入普通人的日常生活,在極大便利人們工作、娛樂、藝","Introduction":"","Columns":"學(xué)術(shù)","Volume":"","Content":"
2022年11月,OpenAI震撼推出對(duì)話式AI模型ChatGPT,引發(fā)了新一輪人工智能(Artificial"Intelligence,AI)邁向大模型時(shí)代的浪潮?;凇按髷?shù)據(jù)”“大算力”和“強(qiáng)算法”深度學(xué)習(xí)模型下的生成式人工智能(Artificial"Intelligence"Generated"Content,AIGC,下文簡(jiǎn)稱人工智能)開始深入普通人的日常生活,在極大便利人們工作、娛樂、藝術(shù)創(chuàng)作的同時(shí),將可能顛覆性地改變對(duì)人類成果的權(quán)益劃分邊界和收益分配規(guī)則。生成式人工智能的快速發(fā)展得益于包括既有作品等大量著作權(quán)客體在內(nèi)的大數(shù)據(jù)資源,以滿足生成式人工智能數(shù)據(jù)訓(xùn)練的要求。此種廣泛持續(xù)對(duì)他人作品的使用行為以人工智能生成物形式通過網(wǎng)絡(luò)輸出予以呈現(xiàn)。人工智能所引發(fā)的各類法律爭(zhēng)議也紛至沓來,如何在實(shí)現(xiàn)生成式人工智能良性高效發(fā)展的同時(shí),維護(hù)著作權(quán)法框架下權(quán)利人的合法權(quán)利,行政、司法機(jī)關(guān)已經(jīng)開展積極探索,著作權(quán)糾紛是首先被關(guān)注的焦點(diǎn)。
一、人工智能引發(fā)著作權(quán)糾紛的相關(guān)背景
在國(guó)內(nèi),北京互聯(lián)網(wǎng)法院于2023年下半年判決的首例“AI文生圖”著作權(quán)糾紛案認(rèn)定用戶通過輸入提示詞使用AI繪畫工具所獲圖片構(gòu)成作品,廣州互聯(lián)網(wǎng)法院判決的首例“生成式AI服務(wù)”著作權(quán)糾紛案認(rèn)定作為人工智能企業(yè)的被告在提供生成式人工智能服務(wù)過程中侵害了原告對(duì)奧特曼作品所享有的著作權(quán),兩案均引發(fā)了學(xué)界、業(yè)界的廣泛熱議。最高人民法院發(fā)布的《中國(guó)法院知識(shí)產(chǎn)權(quán)司法保護(hù)狀況(2023年)》中評(píng)價(jià)首例“AI文生圖”案探索了人工智能生成物的著作權(quán)保護(hù)路徑。國(guó)內(nèi)訴訟糾紛主要集中在討論人工智能生成物的客體性質(zhì)以及提供人工智能生成物行為的侵權(quán)責(zé)任層面。
近期,《紐約每日新聞》等八家美國(guó)知名報(bào)紙媒體起訴了OpenAI和微軟。此前《紐約時(shí)報(bào)》作為首家報(bào)紙媒體就曾以O(shè)penAI和微軟違規(guī)使用其百萬篇文章用于訓(xùn)練兩家公司旗下的自動(dòng)聊天機(jī)器人為由提起訴訟。此外,國(guó)外已有《黎明的扎里亞》《太空歌劇院》等多幅漫畫或圖像,因缺乏人的創(chuàng)造性貢獻(xiàn)而被行政機(jī)關(guān)拒絕作為作品登記且得到法院支持的先例。相關(guān)爭(zhēng)議已經(jīng)聚焦于人工智能大模型數(shù)據(jù)訓(xùn)練(也稱“數(shù)據(jù)挖掘”“機(jī)器學(xué)習(xí)”)相關(guān)的著作權(quán)保護(hù)等問題。
高金智庫等于2023年10月發(fā)布的《2023生成式人工智能服務(wù)合規(guī)發(fā)展白皮書》稱,人工智能是技術(shù)和數(shù)據(jù)的集合產(chǎn)物,其基于生成對(duì)抗網(wǎng)絡(luò)(GAN)和大型預(yù)訓(xùn)練模型等人工智能技術(shù),利用已有數(shù)據(jù)來尋找規(guī)律,并通過適當(dāng)泛化能力來生成相關(guān)內(nèi)容。其中,利用已有數(shù)據(jù)尋找規(guī)律的過程主要為數(shù)據(jù)訓(xùn)練過程。數(shù)據(jù)訓(xùn)練用人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)和數(shù)據(jù)庫的交叉方法在相對(duì)較大型的數(shù)據(jù)集中發(fā)現(xiàn)模式的計(jì)算過程。現(xiàn)階段國(guó)內(nèi)外爭(zhēng)議恰好反映了與人工智能相關(guān)的兩類焦點(diǎn)問題:一是人工智能輸入端問題,即根據(jù)人工智能生成物認(rèn)定人工智能服務(wù)提供者在數(shù)據(jù)訓(xùn)練中未經(jīng)許可使用他人作品,并判斷該行為的法律責(zé)任。二是人工智能輸出端問題,即人工智能生成物能否成為著作權(quán)法保護(hù)的作品等權(quán)利客體;如果可以成為權(quán)利客體,如何認(rèn)定權(quán)利主體。下文就前述問題展開討論。
二、人工智能數(shù)據(jù)訓(xùn)練涉及的著作權(quán)問題
為發(fā)展優(yōu)化人工智能,尤其是生成式人工智能,需要“投喂”大量的數(shù)據(jù)(文字、圖像、音頻、視頻等)進(jìn)行數(shù)據(jù)訓(xùn)練。大數(shù)據(jù)模型不可避免地在進(jìn)行數(shù)據(jù)訓(xùn)練過程中使用他人已發(fā)表作品等公開的權(quán)利客體。但是僅僅只是訓(xùn)練階段的使用,尚未提供給合作伙伴或者相關(guān)用戶使用其人工智能產(chǎn)品的,他人并沒有機(jī)會(huì)或者途徑了解到其作品被訓(xùn)練使用的情況。正如OpenAI的ChatGPT研發(fā)訓(xùn)練多年,在沒有向用戶提供廣泛使用前,并未發(fā)生普遍爭(zhēng)議。
人工智能若僅停留在單純數(shù)據(jù)訓(xùn)練階段不進(jìn)入應(yīng)用階段是沒有現(xiàn)實(shí)意義的??陀^上國(guó)內(nèi)外已有眾多人工智能產(chǎn)品面世進(jìn)入應(yīng)用領(lǐng)域,并且正是通過用戶的廣泛持續(xù)大量使用進(jìn)一步完善數(shù)據(jù)訓(xùn)練,提升人工智能產(chǎn)品的智能化水平和程度。如ChatGPT的用戶協(xié)議中約定,用戶輸入的內(nèi)容將作為ChatGPT學(xué)習(xí)的文本數(shù)據(jù)之一,如果用戶不同意此使用方式,可以通過郵件等方式拒絕授權(quán)而不會(huì)影響其正常使用等。
(一)從人工智能生成物看數(shù)據(jù)訓(xùn)練行為
如果經(jīng)過訓(xùn)練階段人工智能產(chǎn)品后續(xù)必將推向市場(chǎng)進(jìn)入公開使用階段,人工智能服務(wù)提供者一般有必要取得訓(xùn)練階段所使用他人作品的授權(quán),除非人工智能服務(wù)提供者能確保其人工智能產(chǎn)品智能化程度極高,人工智能生成物中完全看不出來使用他人作品的表達(dá)。但是目前,人工智能尚未達(dá)到如此高度。
按照目前著作權(quán)法“先授權(quán)后使用”的基本理論,不能因?yàn)闄?quán)利人不知悉自身作品被使用的情況,不會(huì)啟動(dòng)維權(quán),而使人工智能服務(wù)提供者無需為其數(shù)據(jù)訓(xùn)練所使用他人作品的行為取得授權(quán)。但是,客觀上,由于數(shù)據(jù)訓(xùn)練過程中對(duì)作品的使用具有“黑盒”性質(zhì),包括權(quán)利人在內(nèi)的他人并不知道具體的使用方式,也難以對(duì)應(yīng)現(xiàn)行著作權(quán)法第10條中規(guī)定的具體權(quán)項(xiàng)所涉及的使用行為特征。所以往往只能通過人工智能生成物的表現(xiàn)形態(tài)再來主張數(shù)據(jù)訓(xùn)練過程中對(duì)他人作品的使用行為實(shí)際可能影響的著作權(quán)權(quán)項(xiàng)。
實(shí)踐中,對(duì)數(shù)據(jù)訓(xùn)練未經(jīng)許可使用他人權(quán)利客體產(chǎn)生爭(zhēng)議的情形主要發(fā)生在用戶使用人工智能產(chǎn)品并獲得人工智能生成物后,權(quán)利人發(fā)現(xiàn)該生成物中體現(xiàn)了其權(quán)利客體內(nèi)容,進(jìn)而推知在人工智能數(shù)據(jù)訓(xùn)練中未經(jīng)許可使用其權(quán)利客體。此爭(zhēng)議發(fā)生的前提是人工智能生成物中能相對(duì)完整地體現(xiàn)他人的作品表達(dá)或者受保護(hù)的權(quán)利客體內(nèi)容。假如首例“AI文生圖”案中《春風(fēng)送來了溫柔》一圖中的人物肖像本身來自某攝影師的攝影作品,此時(shí)該攝影師可能會(huì)提出侵權(quán)主張,但如果該圖完全無法體現(xiàn)在先作品的痕跡,權(quán)利人要主張人工智能數(shù)據(jù)訓(xùn)練中使用其作品將面臨舉證困難而難以得到支持。如果難以舉證,或者確實(shí)沒有利用他人享有著作權(quán)的作品生成類似風(fēng)格的作品,原則上不應(yīng)當(dāng)認(rèn)定構(gòu)成對(duì)他人著作權(quán)的侵害??梢灶A(yù)見,在未來的強(qiáng)人工智能時(shí)代(通常指認(rèn)為未來可能制造出推理和解決問題的智能機(jī)器,且機(jī)器具有自我意識(shí))當(dāng)前探討的一系列問題終將不成問題。
當(dāng)然,目前的人工智能尚未脫離人的自主意識(shí)階段,正如《紐約時(shí)報(bào)》起訴OpenAI的訴訟中引用的案例顯示,當(dāng)被問及相關(guān)時(shí)事時(shí),ChatGPT有時(shí)會(huì)生成《紐約時(shí)報(bào)》文章的逐字摘錄,而這些文章在《紐約時(shí)報(bào)》的網(wǎng)站上是需要付費(fèi)閱讀的。所以,現(xiàn)階段通過人工智能生成物進(jìn)而衍生探討人工智能數(shù)據(jù)訓(xùn)練相關(guān)的著作權(quán)問題是有意義的。
(二)因人工智能數(shù)據(jù)訓(xùn)練可能引發(fā)的著作權(quán)侵權(quán)責(zé)任
1.人工智能訓(xùn)練數(shù)據(jù)是否構(gòu)成對(duì)著作權(quán)權(quán)利客體的使用
使用大量已有數(shù)據(jù)進(jìn)行數(shù)據(jù)訓(xùn)練顯然是人工智能完成文本、圖像、語音等內(nèi)容智能合成的必要條件。在大量數(shù)據(jù)集基礎(chǔ)上的訓(xùn)練,通常包含對(duì)既有數(shù)據(jù)的收集、存儲(chǔ)、采樣、處理,以及在特定算法下的輸出等。在此過程中,可能涉及對(duì)作品、制品的復(fù)制權(quán)、表演權(quán)、廣播權(quán)、信息網(wǎng)絡(luò)傳播權(quán)等著作權(quán)法項(xiàng)下多個(gè)權(quán)項(xiàng)的侵權(quán)行為。我國(guó)《生成式人工智能服務(wù)管理暫行辦法》第七條規(guī)定了人工智能服務(wù)提供者應(yīng)當(dāng)依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng),使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型;涉及知識(shí)產(chǎn)權(quán)的,不得侵害他人依法享有的知識(shí)產(chǎn)權(quán)。不僅是我國(guó),歐盟的《人工智能法案》(the"AI"Act),規(guī)定用于生成藝術(shù)、音樂和其他內(nèi)容的生成基礎(chǔ)AI模型將受到嚴(yán)格的披露義務(wù)的約束。此類模型和生成內(nèi)容的提供者必須披露內(nèi)容是由AI而不是人類生成的,訓(xùn)練和設(shè)計(jì)其模型以防止生成非法內(nèi)容,并發(fā)布有關(guān)使用受版權(quán)法保護(hù)的訓(xùn)練數(shù)據(jù)的信息。該法案于當(dāng)?shù)貢r(shí)間2024年3月13日在歐洲議會(huì)通過,5月21日于歐盟理事會(huì)通過,將于近日在歐盟官方公報(bào)上公布,并在公布20天后生效。
當(dāng)前,包括知識(shí)產(chǎn)權(quán)在內(nèi)的數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)要素和經(jīng)濟(jì)資源,人工智能數(shù)據(jù)訓(xùn)練過程中尊重并保護(hù)知識(shí)產(chǎn)權(quán)的原則和方向無疑是正確的,但任何針對(duì)事物的討論不能僅停留在單純理論分析層面,而應(yīng)結(jié)合法律基本規(guī)定對(duì)客觀事物本身的實(shí)現(xiàn)方式、應(yīng)用特點(diǎn)、功能作用等展開分析,才能有的放矢,解析真問題。下文將對(duì)人工智能數(shù)據(jù)訓(xùn)練過程中可能使用著作權(quán)權(quán)利客體的情形進(jìn)行梳理。
(1)復(fù)制權(quán)
《著作權(quán)法》第十條第一款第五項(xiàng)規(guī)定,復(fù)制權(quán)指以印刷、復(fù)印、拓印、錄音、錄像、翻錄、翻拍、數(shù)字化等方式將作品制作一份或者多份的權(quán)利。按照法律釋義,復(fù)制權(quán)是將作品制成有形的復(fù)制品的權(quán)利。復(fù)制權(quán)是著作權(quán)人最基礎(chǔ)、最核心的財(cái)產(chǎn)權(quán)利,因?yàn)閷?duì)作品的利用大多離不開復(fù)制。因此,部分觀點(diǎn)認(rèn)為,在數(shù)據(jù)訓(xùn)練過程中需對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ),自然落入了復(fù)制權(quán)的規(guī)制范疇,復(fù)制權(quán)是數(shù)據(jù)訓(xùn)練必須解決的問題,同時(shí),人工智能生成的內(nèi)容與原作品在表達(dá)上構(gòu)成實(shí)質(zhì)性相似,亦涉及復(fù)制權(quán)。部分觀點(diǎn)則認(rèn)為不構(gòu)成對(duì)復(fù)制權(quán)的侵害,理由涉及訓(xùn)練階段的實(shí)際行為是臨時(shí)復(fù)制,是對(duì)原作品的轉(zhuǎn)換和分析而非使用獨(dú)創(chuàng)性表達(dá)等。
復(fù)制權(quán)體現(xiàn)了著作權(quán)人通過控制作品有形復(fù)制件數(shù)量從而控制對(duì)作品的使用。實(shí)踐中,作品的復(fù)制行為通常是作品其他使用行為的前期準(zhǔn)備,通常與發(fā)行、信息網(wǎng)絡(luò)傳播等行為結(jié)合使用。
比如,北京高院在(2024)京民終234號(hào)民事判決書中認(rèn)定,“至于復(fù)制權(quán),可以認(rèn)定三鼎夢(mèng)公司在上傳涉案游戲過程中實(shí)施了復(fù)制涉案游戲的行為,但該行為系信息網(wǎng)絡(luò)傳播中直接提供行為的必要環(huán)節(jié),在認(rèn)定構(gòu)成侵害信息網(wǎng)絡(luò)傳播權(quán)的情況下,沒有必要單獨(dú)進(jìn)行認(rèn)定,其也不單獨(dú)造成權(quán)利人的損失?!痹诒本└咴海?020)京民申3206號(hào)民事裁定書(簡(jiǎn)稱3206號(hào)裁定書)中,該院認(rèn)定,“芝蘭玉樹公司傳播的系以涉案作品的詞、曲及一定的卡通畫面合成的Flash動(dòng)畫,其必然涉及利用一定的數(shù)字化設(shè)備進(jìn)行合成、制作的過程,該過程包含了將涉案作品以數(shù)字化的形式固定在數(shù)字化設(shè)備上的復(fù)制行為,已落入著作權(quán)法所規(guī)定的復(fù)制權(quán)范疇。芝蘭玉樹公司后續(xù)在網(wǎng)站上提供含涉案詞曲Flash動(dòng)畫的行為亦落入了著作權(quán)法所規(guī)定的信息網(wǎng)絡(luò)傳播權(quán)范疇?!?/p>
又如,作品復(fù)制權(quán)與發(fā)行權(quán)通常會(huì)結(jié)合使用,發(fā)行權(quán)是向公眾提供作品原件或復(fù)制件的權(quán)利?!吨鳈?quán)法》第六十三條將作品的復(fù)制、發(fā)行明確規(guī)定為出版,故單純的復(fù)制權(quán)常發(fā)生在權(quán)利人發(fā)現(xiàn)印刷公司批量印刷了部分侵權(quán)圖書,尚未公開投入市場(chǎng)的情形中。
人工智能數(shù)據(jù)訓(xùn)練過程中收集、存儲(chǔ)作品到用于訓(xùn)練的數(shù)據(jù)庫中,此過程通常不強(qiáng)調(diào)作品復(fù)制件數(shù)量,甚至隨著技術(shù)發(fā)展有些數(shù)據(jù)訓(xùn)練直接調(diào)用云端數(shù)據(jù)而不需要進(jìn)行存儲(chǔ)到己方服務(wù)器。同時(shí),由于在人工智能數(shù)據(jù)訓(xùn)練階段,尚無復(fù)制行為之后的發(fā)行、信息網(wǎng)絡(luò)傳播等行為,是否造成實(shí)際損害也是未知。因此,除數(shù)據(jù)訓(xùn)練階段有數(shù)據(jù)存儲(chǔ)情形涉及復(fù)制行為進(jìn)而可能侵害復(fù)制權(quán)外,筆者不贊同人工智能數(shù)據(jù)訓(xùn)練過程中使用他人作品的數(shù)據(jù)處理行為可能侵害復(fù)制權(quán)。
(2)表演權(quán)和表演者權(quán)
《著作權(quán)法》第十條第一款第九項(xiàng)規(guī)定,表演權(quán)指公開表演作品,以及用各種手段公開播送作品的表演的權(quán)利。公開表演作品通常是指“現(xiàn)場(chǎng)表演”或者“活表演”,典型情形如歌手在休閑廣場(chǎng)公開演唱歌曲,故人工智能訓(xùn)練數(shù)據(jù)中使用他人作品首先可以排除系公開表演他人作品。對(duì)于表演權(quán)定義的后半段,一般理解為“機(jī)械表演”,即借助技術(shù)設(shè)備將“活表演”進(jìn)行公開傳播,例如賓館、飯店大堂播放音樂。不論是“活表演”還是“機(jī)械表演”,都強(qiáng)調(diào)表演環(huán)境的“公開性”特點(diǎn)。顯然,人工智能數(shù)據(jù)訓(xùn)練的過程中即使存在對(duì)作品的“表演”,也不具備公開性,正相反,數(shù)據(jù)訓(xùn)練本身與人工智能的算法相結(jié)合,這顯然屬于人工智能核心技術(shù)內(nèi)容,一般不會(huì)公之于眾。
關(guān)于表演者權(quán),《著作權(quán)法》第三十九條規(guī)定的表演者所享有的權(quán)利包括表明身份、保護(hù)表演形象不受歪曲,許可他人從現(xiàn)場(chǎng)直播或公開傳送其現(xiàn)場(chǎng)表演,許可他人錄音錄像,許可他人復(fù)制、發(fā)行、出租錄有其表演的錄音錄像制品,許可他人通過信息網(wǎng)絡(luò)傳播其表演等。人工智能數(shù)據(jù)訓(xùn)練過程中可能將既有的表演者形象、聲音等特征性要素作為數(shù)據(jù)內(nèi)容進(jìn)行訓(xùn)練,有必要討論是否存在侵害表演者權(quán)的情形。表演者人身權(quán)通常為了規(guī)制他人使用表演者表演時(shí)割裂表演者與其表演的關(guān)系、影響表演者聲譽(yù)等行為,考慮到人工智能數(shù)據(jù)訓(xùn)練一般不向表演者在內(nèi)的普通用戶公開,數(shù)據(jù)訓(xùn)練過程也不屬于錄音錄像,或者現(xiàn)場(chǎng)直播或公開傳播現(xiàn)場(chǎng)表演等行為。同時(shí)我國(guó)出于對(duì)個(gè)人信息的保護(hù),目前在數(shù)據(jù)訓(xùn)練階段對(duì)個(gè)人信息清洗的要求越來越規(guī)范和嚴(yán)格。因此,除“許可他人通過信息網(wǎng)絡(luò)傳播其表演”外,人工智能數(shù)據(jù)訓(xùn)練一般不涉及表演者權(quán)的其他權(quán)項(xiàng)。
(3)廣播權(quán)
《著作權(quán)法》第十條第一款第十一項(xiàng)規(guī)定,廣播權(quán)指以有線或者無線方式公開傳播或者轉(zhuǎn)播作品,以及通過擴(kuò)音器或者其他傳送符號(hào)、聲音、圖像的類似工具向公眾傳播廣播的作品的權(quán)利,但不包括本款第十二項(xiàng)規(guī)定的權(quán)利。由于廣播權(quán)強(qiáng)調(diào)實(shí)時(shí)性,通常適用于廣播電視或網(wǎng)絡(luò)直播場(chǎng)景,顯然與人工智能數(shù)據(jù)訓(xùn)練的使用情形相距甚遠(yuǎn)。
(4)信息網(wǎng)絡(luò)傳播權(quán)
《著作權(quán)法》第十條第一款第十二項(xiàng)規(guī)定,信息網(wǎng)絡(luò)傳播權(quán)指以有線或者無線方式向公眾提供,使公眾可以在其選定的時(shí)間和地點(diǎn)獲得作品的權(quán)利。信息網(wǎng)絡(luò)傳播權(quán)強(qiáng)調(diào)通過信息網(wǎng)絡(luò)向用戶交互式提供作品、錄音錄像制品以及表演??紤]到當(dāng)前的人工智能產(chǎn)品主要以互動(dòng)聊天方式提供人工智能生成物,因此,如果人工智能生成物中出現(xiàn)了他人享有信息網(wǎng)絡(luò)傳播權(quán)的客體或受保護(hù)的客體部分,則可以合理推定人工智能服務(wù)提供者將他人受保護(hù)客體用于數(shù)據(jù)訓(xùn)練。此外,在數(shù)據(jù)訓(xùn)練過程中亦涉及對(duì)算法進(jìn)行測(cè)試及同行校驗(yàn),亦可能涉及信息網(wǎng)絡(luò)傳播權(quán)等向公眾傳播的權(quán)利。
我國(guó)著作權(quán)法框架下,信息網(wǎng)絡(luò)傳播權(quán)糾紛將可能成為人工智能數(shù)據(jù)訓(xùn)練所要面臨的最主要的著作權(quán)問題。
(5)改編權(quán)等
《著作權(quán)法》第十條第一款還規(guī)定了改編權(quán)、翻譯權(quán)、匯編權(quán)等權(quán)項(xiàng)。如改編權(quán),是指改編作品,創(chuàng)作出具有獨(dú)創(chuàng)性的新作品的權(quán)利。如果向用戶提供的人工智能生成物并非原樣提供他人作品,而是對(duì)他人作品進(jìn)行改編后的作品,無疑也可以合理推定人工智能服務(wù)提供者將他人作品在數(shù)據(jù)訓(xùn)練過程中進(jìn)行了使用。翻譯權(quán)、匯編權(quán)亦如此。
綜上,根據(jù)著作權(quán)法規(guī)定的相關(guān)權(quán)項(xiàng),結(jié)合人工智能數(shù)據(jù)訓(xùn)練使用場(chǎng)景等具體情形,人工智能服務(wù)提供者在進(jìn)行數(shù)據(jù)訓(xùn)練過程中,有必要根據(jù)用于數(shù)據(jù)訓(xùn)練的客體類型,取得作品信息網(wǎng)絡(luò)傳播權(quán)、改編權(quán)等權(quán)利。如錄音錄像制品權(quán)利人并無改編權(quán),則無需取得該權(quán)利。
人工智能的發(fā)展帶動(dòng)了訓(xùn)練數(shù)據(jù)市場(chǎng)增長(zhǎng),部分公司為訓(xùn)練更強(qiáng)大的人工智能模型獲得競(jìng)爭(zhēng)優(yōu)勢(shì),規(guī)避侵權(quán)風(fēng)險(xiǎn)等,開始購(gòu)買人工智能訓(xùn)練數(shù)據(jù),如Adobe公司購(gòu)買視頻訓(xùn)練AI模型。如權(quán)利人享有全部或部分權(quán)利的作品、制品可能被人工智能服務(wù)提供者用于數(shù)據(jù)訓(xùn)練,則應(yīng)結(jié)合自身所持有的客體類型明確對(duì)外授予的權(quán)利。
相對(duì)應(yīng)地,如果發(fā)現(xiàn)人工智能服務(wù)提供者在數(shù)據(jù)訓(xùn)練等過程中未經(jīng)許可使用他人權(quán)利客體,權(quán)利人維權(quán)索賠主張可以結(jié)合作品等權(quán)利客體被使用的范圍、持續(xù)時(shí)間等具體使用情節(jié)提出。如果人工智能服務(wù)提供者實(shí)施侵權(quán)行為存在故意且情節(jié)嚴(yán)重的情形,權(quán)利人還可以依法提出懲罰性賠償請(qǐng)求。
2.人工智能數(shù)據(jù)訓(xùn)練對(duì)他人著作權(quán)客體的使用是否構(gòu)成合理使用
著作權(quán)合理使用是在指明作者或者作品名稱的情況下,可以不經(jīng)著作權(quán)人許可,不支付報(bào)酬使用他人作品的情形?!吨鳈?quán)法》第二十四條吸收借鑒《伯爾尼公約》第9條第2款規(guī)定了合理使用的基本要件,即“不得影響該作品的正常使用,也不得不合理地?fù)p害著作權(quán)人的合法權(quán)益”,同時(shí)還列舉了12項(xiàng)典型的合理使用情形。
當(dāng)前,人工智能數(shù)據(jù)訓(xùn)練所涉數(shù)據(jù)中包含他人享有權(quán)利的作品、制品等大量著作權(quán)客體,部分學(xué)者就是否構(gòu)成合理使用問題從經(jīng)濟(jì)學(xué)等各種角度進(jìn)行分析,但正如上文分析,僅針對(duì)數(shù)據(jù)訓(xùn)練過程,包括數(shù)據(jù)挖掘、分析、處理等一系列方式對(duì)作品的使用一般不屬于著作權(quán)法所規(guī)定具體權(quán)項(xiàng)所涵蓋的行為范疇。實(shí)踐中,人工智能面向用戶使用的過程往往與數(shù)據(jù)訓(xùn)練過程融合,由此通過人工智能生成物可以認(rèn)定人工智能數(shù)據(jù)訓(xùn)練中使用了他人著作權(quán)客體或者部分客體。對(duì)于作品而言,盡管是片段式的,但只要能體現(xiàn)作品的獨(dú)創(chuàng)性表達(dá),都可獲得著作權(quán)保護(hù)。如北京互聯(lián)網(wǎng)法院曾在(2018)京0491民初1號(hào)民事判決書中認(rèn)定13秒時(shí)長(zhǎng)的短視頻構(gòu)成類電影作品肯定其著作權(quán)。因此,如果他人作品等著作權(quán)客體出現(xiàn)在人工智能生成物中,正如上文分析,不排除會(huì)侵害他人信息網(wǎng)絡(luò)傳播權(quán)、改編權(quán)等權(quán)項(xiàng),被認(rèn)定構(gòu)成合理使用的難度較大。
至于部分學(xué)者提到的美國(guó)法中“轉(zhuǎn)換性使用”等認(rèn)定,因未在我國(guó)法律法規(guī)或司法解釋中予以規(guī)定,我國(guó)法院在司法實(shí)踐中極少適用相關(guān)理論作出裁判。
3.人工智能服務(wù)提供者取得權(quán)利主體的授權(quán)能否解決人工智能數(shù)據(jù)訓(xùn)練可能產(chǎn)生的侵權(quán)責(zé)任
目前,我國(guó)出臺(tái)的一系列規(guī)范性文件,包括《生成式人工智能服務(wù)管理暫行辦法》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》等,美國(guó)出臺(tái)的《人工智能應(yīng)用規(guī)范指南》(Guidance"for"Regulation"of"Artificial"Intelligence"Applications),歐盟《人工智能法案》等,均對(duì)人工智能數(shù)據(jù)訓(xùn)練中的來源數(shù)據(jù)提出了要求。實(shí)踐中,多種權(quán)利主體呼吁或以提起維權(quán)訴訟等方式主張權(quán)利的行為,使不少涉及人工智能大模型數(shù)據(jù)訓(xùn)練的企業(yè)已經(jīng)意識(shí)到為了獲得全面、完整、穩(wěn)定且高質(zhì)量的訓(xùn)練數(shù)據(jù)需要與相關(guān)權(quán)利人訂立合同取得授權(quán),只有在授權(quán)范圍內(nèi)的使用行為,才能最大程度避免侵權(quán)發(fā)生。
首先,從數(shù)據(jù)權(quán)利人處取得授權(quán)顯然較未經(jīng)許可直接使用的侵權(quán)風(fēng)險(xiǎn)低。從長(zhǎng)遠(yuǎn)看,人工智能要順利健康可持續(xù)發(fā)展,必然是在各方權(quán)利安排有序、行為邊界清晰、利益分配合理的基礎(chǔ)上實(shí)現(xiàn),依靠初始發(fā)展階段簡(jiǎn)單粗暴的數(shù)據(jù)“拿來主義”顯然是不可行的。
其次,人工智能數(shù)據(jù)訓(xùn)練中對(duì)不同類型的數(shù)據(jù)使用方式不同,如對(duì)文字作品可能是提取段落、語句等要素,而對(duì)音樂要采集曲調(diào)、旋律或節(jié)奏片段,對(duì)視頻則要提取場(chǎng)景、圖像、特效等畫面。不同類型的數(shù)據(jù)對(duì)應(yīng)不同權(quán)利客體,亦對(duì)應(yīng)不同的權(quán)利主體。因此,人工智能服務(wù)提供者就有必要結(jié)合其具體使用場(chǎng)景、期限、范圍、是否允許轉(zhuǎn)授權(quán)等需求與相關(guān)權(quán)利主體訂立許可使用合同,以解決人工智能數(shù)據(jù)訓(xùn)練以及用戶使用、人工智能生成物后續(xù)傳播的著作權(quán)問題。
再次,與騰訊公司訴盈訊公司案中騰訊公司的主張不同,當(dāng)前的人工智能服務(wù)提供者大多不再主張享有人工智能生成物可能產(chǎn)生的知識(shí)產(chǎn)權(quán),而將這一權(quán)利讓渡給用戶。如首例“AI文生圖”案中,Stable"Diffusion的用戶協(xié)議約定其“僅用于AIGC技術(shù)學(xué)習(xí),其不對(duì)您使用模型生成的輸出聲稱任何權(quán)利。您對(duì)生成的輸出及其后續(xù)使用負(fù)有責(zé)任。”另一人工智能產(chǎn)品Kimi在用戶協(xié)議的“關(guān)于生成內(nèi)容的知識(shí)產(chǎn)權(quán)”部分明確“您基于Kimi智能助手生成的內(nèi)容的版權(quán)由您自行維護(hù)并對(duì)其獨(dú)立判斷后使用,產(chǎn)生的任何知識(shí)產(chǎn)權(quán)問題都由您自行處理”。
在此情況下,是否意味著人工智能生成物侵權(quán)與否與人工智能服務(wù)提供者無關(guān)?答案顯然是否定的。對(duì)于被用于人工智能數(shù)據(jù)訓(xùn)練而使用的著作權(quán)客體權(quán)利人而言,正是人工智能服務(wù)提供者首先使用其權(quán)利客體進(jìn)行數(shù)據(jù)訓(xùn)練,才導(dǎo)致在用戶使用人工智能產(chǎn)品后,相關(guān)包括了權(quán)利人客體的數(shù)據(jù)訓(xùn)練成果以人工智能生成物形式出現(xiàn)。不論人工智能服務(wù)提供者保留或是讓渡人工智能生成物的權(quán)利,其使用他人作品的行為是客觀存在的,就應(yīng)當(dāng)為其未事先取得授權(quán)而使用的行為承擔(dān)相應(yīng)的責(zé)任。
最后,從著作權(quán)客體權(quán)利人的角度考量,特別是在短視頻業(yè)務(wù)蓬勃發(fā)展的當(dāng)下,對(duì)于視頻類客體權(quán)利人,如果本身的視頻內(nèi)容并非原創(chuàng),如從其他權(quán)利人處取得授權(quán),再將所獲得的授權(quán)客體授予人工智能服務(wù)提供者時(shí),還要注意以下方面:一是向人工智能服務(wù)提供者授權(quán)屬于轉(zhuǎn)授權(quán)行為,需要上述權(quán)利人授予轉(zhuǎn)授權(quán)權(quán)利方可實(shí)施。二是權(quán)利人僅能在自身取得授權(quán)范圍內(nèi)向人工智能服務(wù)提供者授予權(quán)力,不能超出授權(quán)范圍。例如,取得權(quán)利的客體是動(dòng)漫作品本身,并未取得其中特定角色形象的著作權(quán),則不能向他人轉(zhuǎn)授權(quán)特定角色形象著作權(quán)。同樣地,對(duì)于人工智能服務(wù)提供者而言,其獲得著作權(quán)客體權(quán)利人的授權(quán)也應(yīng)謹(jǐn)慎審查其授權(quán)范圍等效力,以免出現(xiàn)無效授權(quán)。
三、人工智能生成物的客體性質(zhì)及權(quán)利主體
(一)人工智能生成物能否作為著作權(quán)法的權(quán)利客體
人工智能生成物客體性質(zhì)以及權(quán)利主體問題是當(dāng)前司法實(shí)踐以及學(xué)者探討的重點(diǎn)問題。如上文提及的首例“AI文生圖”案,以及此前的菲林訴百度公司案、騰訊公司訴盈訊公司案,三案生效判決在判決結(jié)果、審判思路方面存在不同。除了菲林訴百度公司案中法院否定人工智能生成的涉案文章內(nèi)容構(gòu)成作品,其余兩案均認(rèn)定人工智能生成物構(gòu)成作品?!癆I文生圖”案認(rèn)定提供了提示詞的人工智能用戶是作者,而騰訊公司訴盈訊公司案認(rèn)定提供人工智能服務(wù)的騰訊公司享有其人工智能自動(dòng)生成文章的著作權(quán)。
學(xué)者們?cè)诜e極討論過程中形成了旗幟鮮明的兩派觀點(diǎn):以王遷教授為代表的學(xué)者認(rèn)為,著作權(quán)法保護(hù)的作品須為人類的創(chuàng)作成果,包括ChatGPT在內(nèi)的人工智能生成的內(nèi)容在形式上的“獨(dú)創(chuàng)”,并不是構(gòu)成作品的充分條件,人工智能生成的內(nèi)容不屬于受著作權(quán)法保護(hù)的作品。既然不是作品,也就無所謂作者以及著作權(quán)人。以李揚(yáng)教授為代表的學(xué)者認(rèn)為,人工智能僅是人的創(chuàng)作工具,且相較于著作權(quán)法規(guī)定的法人作品,既然能將具備法律主體資格的自然人視為創(chuàng)作工具,將無法律主體資格的人工智能視為創(chuàng)作工具在法理上更無障礙。雖然人工智能生成內(nèi)容的獨(dú)創(chuàng)性來源于使用者對(duì)提示詞的選擇和安排,但排他權(quán)范圍僅延及人工智能最終生成的表達(dá)內(nèi)容,單獨(dú)的提示詞屬于不受保護(hù)的事實(shí)性材料,因此對(duì)滿足獨(dú)創(chuàng)性標(biāo)準(zhǔn)的人工智能生成內(nèi)容賦予著作權(quán)保護(hù),不會(huì)過度限制公眾的行動(dòng)自由。還有觀點(diǎn)擴(kuò)展解釋,著作權(quán)法的“寬進(jìn)寬出”結(jié)構(gòu)提示我們,將用戶作出獨(dú)創(chuàng)性表達(dá)的AIGC納入著作權(quán)法圖式是在認(rèn)知層面最為經(jīng)濟(jì)的利益平衡分析框架,承認(rèn)AIGC獲得作品資格的可能性并不會(huì)過度妨礙公眾自由。
能否將人工智能生成物作為著作權(quán)法的權(quán)利客體,既是對(duì)法律基礎(chǔ)問題的闡釋,同時(shí)也是對(duì)產(chǎn)業(yè)導(dǎo)向指引以及行業(yè)發(fā)展激勵(lì)等司法政策的理解。由于目前并無立法或政策明確規(guī)定人工智能生成物的客體性質(zhì),對(duì)生成式人工智能產(chǎn)生的法律問題,仍在個(gè)案中具體審理判斷,著作權(quán)法仍然是必須考慮的重要法律依據(jù)??紤]現(xiàn)階段人工智能發(fā)展水平,按照最新的“AI文生圖”案判決,人工智能本身不具備自由意志進(jìn)而認(rèn)定人工智能生成物因用戶提供提示詞的作用而屬于人的創(chuàng)作,可以構(gòu)成作品。
(二)人工智能生成物客體性質(zhì)差異對(duì)著作權(quán)權(quán)利主體的影響
當(dāng)前國(guó)內(nèi)司法實(shí)踐中既有認(rèn)定人工智能生成物為作品的判決(如“AI文生圖”案),也有不認(rèn)定人工智能生成物為作品的判決(如菲林訴百度公司案)。對(duì)于作品著作權(quán)人等權(quán)利主體而言,前述兩種裁判觀點(diǎn)是否影響其權(quán)利客體被人工智能服務(wù)提供者用于數(shù)據(jù)訓(xùn)練活動(dòng),同樣值得討論。
一方面,不論人工智能生成物是否被認(rèn)定為作品或其他受著作權(quán)法保護(hù)的客體,其中所體現(xiàn)的他人權(quán)利客體不因人工智能生成物本身被認(rèn)定的客體性質(zhì)而變化。仍假設(shè)《春風(fēng)送來了溫柔》一圖中的人物肖像來自某攝影師的攝影作品,那么即使《春風(fēng)送來了溫柔》一圖因系人工智能生成過程缺乏人的創(chuàng)作而不被認(rèn)定為作品,但其中體現(xiàn)攝影師作品內(nèi)容的部分仍可受到著作權(quán)法保護(hù)。
另一方面,對(duì)人工智能生成物客體性質(zhì)的認(rèn)定差異,直接影響被用于數(shù)據(jù)訓(xùn)練權(quán)利客體的權(quán)利人如何選擇維權(quán)對(duì)象。如果人工智能生成物不構(gòu)成作品等受保護(hù)的著作權(quán)客體,前述假設(shè)情景下的攝影師主張維權(quán)的對(duì)象僅有人工智能服務(wù)提供者。如果人工智能生成物構(gòu)成作品等受保護(hù)的著作權(quán)客體,那么攝影師不僅可以向人工智能服務(wù)提供者提起維權(quán)訴訟,而且在用戶將人工智能生成物通過信息網(wǎng)絡(luò)傳播等實(shí)施了相關(guān)使用作品行為的情況下,攝影師還能向包括用戶在內(nèi)的作品權(quán)利人提起維權(quán)訴訟。另外,在騰訊公司訴盈訊公司案中,人工智能服務(wù)提供者和用戶合一,就無所謂區(qū)別對(duì)待不同行為主體的問題。
四、小結(jié)
2017年,國(guó)務(wù)院印發(fā)《關(guān)于新一代人工智能發(fā)展規(guī)劃》,明確提出人工智能發(fā)展進(jìn)入新階段,將人工智能發(fā)展列入國(guó)家戰(zhàn)略的層面進(jìn)行系統(tǒng)化布局,人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),是新一輪產(chǎn)業(yè)革命的核心驅(qū)動(dòng)力。此后我國(guó)的人工智能進(jìn)行快速發(fā)展階段,其中人工智能數(shù)據(jù)訓(xùn)練的成效屬于人工智能發(fā)展進(jìn)程的關(guān)鍵因素之一。用于數(shù)據(jù)訓(xùn)練的數(shù)據(jù)集合中包含互聯(lián)網(wǎng)上海量數(shù)據(jù),比如網(wǎng)絡(luò)文本、書籍、新聞、社交媒體內(nèi)容、學(xué)術(shù)論文等,通常包括了大量他人享有著作權(quán)的權(quán)利客體。這些他人享有權(quán)利的數(shù)據(jù)是權(quán)利人通過數(shù)十年努力積累而成,人工智能的發(fā)展并不能忽視基于這些成果所形成的權(quán)利,而應(yīng)在現(xiàn)有法律框架下合法取得數(shù)據(jù)并進(jìn)行數(shù)據(jù)訓(xùn)練,以此獲得人工智能高效、持續(xù)、良性發(fā)展。
(作者系香港理工大學(xué)博士,北京知識(shí)產(chǎn)權(quán)法研究會(huì)副會(huì)長(zhǎng)兼執(zhí)行秘書長(zhǎng),北京市融泰律師事務(wù)所主任)