国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

生成式人工智能數(shù)據(jù)訓(xùn)練的合理使用規(guī)則研究

2024-10-21 00:00:00曹新明范曄
中國(guó)版權(quán) 2024年4期

摘要:生成式人工智能數(shù)據(jù)訓(xùn)練過程涉及對(duì)作品、資料、文獻(xiàn)等數(shù)據(jù)的獲取和利用,可能引發(fā)版權(quán)侵權(quán)。為避免版權(quán)侵權(quán),人工智能開發(fā)者或者事前獲得授權(quán)許可,或者依法獲得侵權(quán)豁免。然而,傳統(tǒng)許可模式在實(shí)踐中難以支撐海量數(shù)據(jù)學(xué)習(xí)模式的需要;法定許可方案也面臨交易成本和管理成本高昂的問題。以博弈論視角進(jìn)行分析得出,合理使用是配置作品數(shù)據(jù)資源的較優(yōu)路徑,也是協(xié)調(diào)著作權(quán)人和人工智能開發(fā)者利益沖突的理性選擇。對(duì)此,建議以《著作權(quán)法》第二十四條第一款第(十三)項(xiàng)的“兜底條款”為接口,在《著作權(quán)法實(shí)施條例》中引入生成式人工智能數(shù)據(jù)訓(xùn)練的合理使用專門例外。該條款應(yīng)適當(dāng)放寬適用條件,通過“三步檢驗(yàn)法”的后兩步進(jìn)行限制,以此增加適用的彈性。

關(guān)鍵詞:生成式人工智能;數(shù)據(jù)訓(xùn)練;合理使用;版權(quán);博弈論

一、問題的提出

近年來,以ChatGPT為代表的生成式人工智能(Generative Artifcial Intelligence,以下簡(jiǎn)稱GenAI)被廣泛應(yīng)用于各類創(chuàng)作場(chǎng)景中,其創(chuàng)作能力和交互能力的提升依賴于大語言模型的訓(xùn)練,海量數(shù)據(jù)輸入是形成理想的訓(xùn)練效果的基礎(chǔ),也是人工智能技術(shù)升級(jí)迭代的必由之路。在所需的海量數(shù)據(jù)中,作品數(shù)據(jù)作為高質(zhì)量的數(shù)據(jù)資源,具有較大的算法訓(xùn)練價(jià)值,其中就包括處于權(quán)利保護(hù)期的版權(quán)作品。根據(jù)《著作權(quán)法》一般原理,除了合理使用和法定許可的特定情形外,任何人使用他人作品應(yīng)當(dāng)獲得授權(quán)許可并支付報(bào)酬,否則屬于侵犯版權(quán)的行為。2023年國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合頒布的《生成式人工智能服務(wù)管理暫行辦法》第七條規(guī)定,生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開展數(shù)據(jù)訓(xùn)練處理活動(dòng),使用具有合法來源的數(shù)據(jù),不得侵害他人依法享有的知識(shí)產(chǎn)權(quán)。然而,為海量數(shù)據(jù)獲取權(quán)利人的授權(quán)并不現(xiàn)實(shí),“事前授權(quán)”模式的高成本與訓(xùn)練數(shù)據(jù)的海量特征之間形成張力。正是由于高許可成本和作品數(shù)據(jù)海量需求之間的沖突,導(dǎo)致版權(quán)糾紛頻發(fā)。如在程序員們?cè)VGitHub和OpenAI公司案中,原告指控被告未經(jīng)許可使用其代碼用于訓(xùn)練Codex程序,構(gòu)成版權(quán)侵權(quán);在美國(guó)藝術(shù)家群體訴Midjourney公司案中,原告聲稱被告未經(jīng)版權(quán)人許可擅自爬取數(shù)十億張圖像用于模型訓(xùn)練,構(gòu)成版權(quán)侵權(quán);在Getty圖片社訴Stability AI案中,原告控訴被告擅自從Getty圖片庫(kù)中復(fù)制超過1200萬張圖片以及圖文配對(duì)信息用于模型訓(xùn)練,侵犯其版權(quán);在《紐約時(shí)報(bào)》訴微軟和OpenAI案中,原告主張被告未經(jīng)許可將報(bào)刊上的數(shù)百萬篇文章用于訓(xùn)練ChatGPT的行為構(gòu)成版權(quán)侵權(quán);在AlterNet等新聞媒體訴OpenAI案中,原告指控被告在訓(xùn)練ChatGPT的過程中,未經(jīng)許可使用其新聞作品,違反《數(shù)字千年版權(quán)法》。在“全球AIGC平臺(tái)著作權(quán)侵權(quán)第一案”中,我國(guó)法院認(rèn)定某平臺(tái)因其提供的AIGC服務(wù)在用戶輸入指令后生成了侵害原告奧特曼形象的作品,構(gòu)成侵權(quán)。相關(guān)案件頻發(fā),促使GenAI數(shù)據(jù)訓(xùn)練的版權(quán)合法性問題成為全球關(guān)注的焦點(diǎn)。

針對(duì)該問題,國(guó)內(nèi)學(xué)者大多主張調(diào)整合理使用規(guī)則,以比較法研究為基點(diǎn),提出借鑒歐盟《數(shù)字單一市場(chǎng)版權(quán)指令》(以下簡(jiǎn)稱《DSM指令》)“文本與數(shù)據(jù)挖掘”專門例外規(guī)則,或借鑒日本《著作權(quán)法》中的“計(jì)算機(jī)信息分析”合理使用條款,或采用美國(guó)靈活開放的合理使用模式。也有部分觀點(diǎn)提出法定許可方案,少數(shù)觀點(diǎn)提出遵循授權(quán)許可模式??梢?,我國(guó)學(xué)界對(duì)解決該問題提出了各種可能的選擇,但尚未達(dá)成共識(shí)。有鑒于此,本文首先明確GenAI數(shù)據(jù)訓(xùn)練的具體過程及其侵權(quán)風(fēng)險(xiǎn),繼而針對(duì)授權(quán)許可、法定許可以及合理使用方案的適用障礙進(jìn)行詳細(xì)的闡述,并以博弈論視角分析相關(guān)利益主體的策略選擇,得出采用合理使用制度可能是較為合理的選擇。最后,以《著作權(quán)法實(shí)施條例》(以下簡(jiǎn)稱《實(shí)施條例》)修改為契機(jī),對(duì)GenAI數(shù)據(jù)訓(xùn)練的合理使用條款進(jìn)行設(shè)計(jì),以期對(duì)相關(guān)立法的完善提供參考。

二、GenAI數(shù)據(jù)訓(xùn)練的版權(quán)侵權(quán)風(fēng)險(xiǎn)

為了明晰GenAI數(shù)據(jù)訓(xùn)練過程中哪些作品使用行為涉及版權(quán)侵權(quán),以及侵犯哪些權(quán)能,有必要對(duì)GenAI數(shù)據(jù)訓(xùn)練的技術(shù)原理進(jìn)行剖析,總結(jié)出誘發(fā)侵權(quán)風(fēng)險(xiǎn)的原因,并明確具體的侵權(quán)情形。

(一)GenAI數(shù)據(jù)訓(xùn)練實(shí)例

知識(shí)、數(shù)據(jù)、算力和算法是建構(gòu)GenAI的四個(gè)關(guān)鍵要素,其中數(shù)據(jù)是關(guān)鍵核心要素。GenAI數(shù)據(jù)訓(xùn)練其實(shí)就是機(jī)器學(xué)習(xí)的過程,通過對(duì)大量數(shù)據(jù)進(jìn)行分析建模,在掌握人類語言的基本規(guī)律后,理解用戶指令并自主創(chuàng)建新內(nèi)容。為了辨明此過程中哪些行為可能涉嫌侵犯版權(quán),具體侵犯什么權(quán)能,需對(duì)其技術(shù)原理進(jìn)行剖析。

以ChatGPT為例,其主體架構(gòu)遵從“語料體系+預(yù)訓(xùn)練+微調(diào)”的基本模式。語料體系是模型的基礎(chǔ),包括預(yù)訓(xùn)練語料與微調(diào)語料兩個(gè)部分。前者是從期刊、百科、論壇等渠道收集并經(jīng)過初步清理后形成的海量無標(biāo)注文本數(shù)據(jù);后者是從開源代碼庫(kù)爬取、專家標(biāo)注以及用戶提交等方式收集加工的高質(zhì)量有標(biāo)注的文本數(shù)據(jù)。這些文本數(shù)據(jù)為ChatGPT學(xué)習(xí)過程提供了堅(jiān)實(shí)的語料基礎(chǔ),是保證其技術(shù)應(yīng)用和升級(jí)的關(guān)鍵要素之一。ChatGPT對(duì)海量數(shù)據(jù)進(jìn)行大規(guī)模生成式預(yù)訓(xùn)練的過程采用自回歸的訓(xùn)練策略,訓(xùn)練順序按一般語言文字的順序從左向右進(jìn)行,訓(xùn)練內(nèi)容為基于序列中當(dāng)前的元素來預(yù)測(cè)下一個(gè)元素。通過大量訓(xùn)練可形成規(guī)模達(dá)千億乃至萬億級(jí)別的參數(shù),從而確保大語言模型對(duì)人類語言的理解和文本生成能力。在預(yù)訓(xùn)練之后,結(jié)合特定任務(wù)和專業(yè)知識(shí)庫(kù)進(jìn)行微調(diào)模型訓(xùn)練。在這個(gè)過程中,通過對(duì)高質(zhì)量有標(biāo)注的文本數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,不斷調(diào)整自身參數(shù),保證其產(chǎn)出與人類認(rèn)知、需求和價(jià)值觀一致,提升人機(jī)對(duì)話的順暢性以及生成內(nèi)容的準(zhǔn)確性。數(shù)據(jù)貫穿機(jī)器學(xué)習(xí)的始末,被稱為大語言模型的核心驅(qū)動(dòng)力,其質(zhì)量和容量不單單影響其生成能力的強(qiáng)弱,更決定了模型運(yùn)行的成敗。

GenAI數(shù)據(jù)訓(xùn)練的整個(gè)過程大體上可以分為數(shù)據(jù)輸入、模型訓(xùn)練和結(jié)果輸出三個(gè)階段。在數(shù)據(jù)輸入階段,主要的工作是獲取數(shù)據(jù)并進(jìn)行轉(zhuǎn)碼處理。獲取的數(shù)據(jù)不僅需要大量的作品、資料等,而且需要大量示例信息,比如文本與圖像、視頻的對(duì)應(yīng)關(guān)系等。在Getty Images v.Stability AI案中,原告就指出Stability AI不僅擅自復(fù)制其圖像作品,而且利用了數(shù)十億個(gè)詳細(xì)的文圖配對(duì)信息,這樣的信息對(duì)于模型訓(xùn)練至關(guān)重要。數(shù)據(jù)收集、處理完畢后,將其輸入計(jì)算機(jī)進(jìn)行模型訓(xùn)練。以現(xiàn)下較火爆的“文生圖”和“文生視頻”軟件為例,其在訓(xùn)練階段廣泛應(yīng)用了擴(kuò)散模型,擴(kuò)散原理是“先增噪后降噪”,模擬一個(gè)從有序到無序再到有序的過程。具體來說,先給現(xiàn)有圖像逐步施加高斯噪聲,直到圖像被完全破壞,然后再去噪還原圖像。在這個(gè)過程中不斷優(yōu)化自身參數(shù),以通過用戶指令生成符合“文本與圖像對(duì)應(yīng)”的內(nèi)容。在輸出階段,模型基于對(duì)訓(xùn)練數(shù)據(jù)的提取和處理,通過理解用戶指令形成學(xué)習(xí)結(jié)果并予以輸出。值得注意的是,GenAI并不以文本數(shù)據(jù)的“復(fù)制”或“重新組合”為目標(biāo),而是在訓(xùn)練過程中,將文本數(shù)據(jù)轉(zhuǎn)換為計(jì)算機(jī)模型的最小單元,在學(xué)習(xí)最小單元之間的關(guān)系后,基于對(duì)指令的理解,重新生成內(nèi)容,因此通常來說輸出的形式與原作品可能具有相似性但并不完全相同。

(二)GenAI數(shù)據(jù)訓(xùn)練的版權(quán)侵權(quán)緣由

第一,作品數(shù)據(jù)的使用貫穿GenAI數(shù)據(jù)訓(xùn)練的全過程。在數(shù)據(jù)輸入階段,獲取的海量數(shù)據(jù)涵蓋公共領(lǐng)域的數(shù)據(jù)以及受版權(quán)保護(hù)的作品。前者包括超過權(quán)利保護(hù)期的作品、官方文件和事實(shí)信息等,可以為社會(huì)公眾自由使用;后者指向尚處于權(quán)利保護(hù)期的版權(quán)作品,若未經(jīng)許可擅自使用就可能導(dǎo)致侵權(quán)。訓(xùn)練數(shù)據(jù)可能涵蓋的版權(quán)有兩個(gè)層次:一是訓(xùn)練數(shù)據(jù)集中單個(gè)作品的版權(quán);二是訓(xùn)練數(shù)據(jù)集作為整體匯編作品的版權(quán)。獲取作品數(shù)據(jù)后,需對(duì)其進(jìn)行轉(zhuǎn)碼操作以形成適合機(jī)器閱讀的標(biāo)準(zhǔn)格式語料。在轉(zhuǎn)碼環(huán)節(jié)以作品形態(tài)區(qū)分兩種情形:一是非數(shù)字作品,應(yīng)先進(jìn)行數(shù)字化再進(jìn)行轉(zhuǎn)碼;二是已數(shù)字化的作品,直接進(jìn)行轉(zhuǎn)碼。兩種情形下,都涉及作品的復(fù)制權(quán)。數(shù)據(jù)的獲取和處理行為,是對(duì)作品的合法使用還是侵權(quán)使用,決定了GenAI數(shù)據(jù)訓(xùn)練的整個(gè)過程是否正當(dāng)。在模型訓(xùn)練階段,對(duì)作品數(shù)據(jù)的學(xué)習(xí)和分析,是從大量表達(dá)中提取人類語言的基本規(guī)律和特征,再將其應(yīng)用到具體場(chǎng)景中,學(xué)習(xí)的是作品的“表達(dá)形式”而非“思想”。在結(jié)果輸出階段,能夠生成具有作品外觀的形式,與原作品構(gòu)成實(shí)質(zhì)性相似的,就可能侵犯版權(quán)。綜上,數(shù)據(jù)輸入階段需獲取和使用受版權(quán)保護(hù)的作品,模型訓(xùn)練階段是對(duì)作品“表達(dá)”的學(xué)習(xí),輸出結(jié)果也是具有作品外觀的形式,因此GenAI數(shù)據(jù)訓(xùn)練全過程都與作品利用有關(guān),導(dǎo)致產(chǎn)生版權(quán)侵權(quán)風(fēng)險(xiǎn)。

第二,對(duì)作品數(shù)據(jù)的“作品性使用”,使GenAI數(shù)據(jù)訓(xùn)練面臨版權(quán)侵權(quán)風(fēng)險(xiǎn)。作品的使用貫穿GenAI學(xué)習(xí)訓(xùn)練的全過程,但針對(duì)知識(shí)產(chǎn)權(quán)對(duì)象的使用行為,并非均落入專有權(quán)的保護(hù)范圍,專有權(quán)只能規(guī)制“知識(shí)產(chǎn)權(quán)法律意義上的使用”。因此,有學(xué)者借鑒商標(biāo)法領(lǐng)域的“商標(biāo)性使用”概念,將對(duì)作品的使用行為區(qū)分為“作品性使用”和“非作品性使用”,只有前者才可能屬于侵犯版權(quán)的使用行為。GenAI本質(zhì)是AIGC,是在學(xué)習(xí)海量作品的“表達(dá)”的基礎(chǔ)上,不斷訓(xùn)練“創(chuàng)作”能力,從而智能化生成特定內(nèi)容,對(duì)作品的使用應(yīng)當(dāng)認(rèn)為屬于“作品性使用”。有學(xué)者以是否具有表達(dá)性內(nèi)容的輸出為標(biāo)準(zhǔn),將機(jī)器學(xué)習(xí)分為“表達(dá)型”和“非表達(dá)型”兩種。非表達(dá)型機(jī)器學(xué)習(xí)雖然在訓(xùn)練過程中復(fù)制、存儲(chǔ)、匯編了作品數(shù)據(jù),但不以使用作品的表達(dá)性內(nèi)容為目的,通常是對(duì)事實(shí)信息的采集和分析,并且也無表達(dá)性內(nèi)容的輸出,因此不受版權(quán)專有權(quán)控制,不構(gòu)成侵權(quán)。如人臉識(shí)別技術(shù),該技術(shù)對(duì)照片的采集和訓(xùn)練旨在實(shí)現(xiàn)身份驗(yàn)證和安全監(jiān)控等功能,并不包含用于人工智能訓(xùn)練的原始照片的任何表達(dá)性內(nèi)容,屬于非表達(dá)型機(jī)器學(xué)習(xí)。而GenAI對(duì)作品數(shù)據(jù)的使用并非針對(duì)原作品的事實(shí)信息,而是原創(chuàng)性表達(dá),其輸出的結(jié)果也并非實(shí)現(xiàn)目的性或功能性轉(zhuǎn)換,而是形成了與原作品有關(guān)聯(lián)的表達(dá)形式。在此意義上,可以認(rèn)為GenAI數(shù)據(jù)訓(xùn)練屬于“表達(dá)型”機(jī)器學(xué)習(xí),對(duì)作品的使用屬于“作品性使用”,因此可能構(gòu)成對(duì)版權(quán)的侵犯。

(三)GenAI數(shù)據(jù)訓(xùn)練的版權(quán)侵權(quán)情形

GenAI數(shù)據(jù)訓(xùn)練的版權(quán)法律后果,實(shí)際上分別由數(shù)據(jù)輸入階段和結(jié)果輸出階段所吸收。在數(shù)據(jù)輸入階段,對(duì)作品的轉(zhuǎn)碼以及在監(jiān)督學(xué)習(xí)的情況下人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)記、整理和匯總的行為,可能涉及作品的復(fù)制權(quán)、翻譯權(quán)、改編權(quán)和匯編權(quán)。對(duì)作品數(shù)據(jù)進(jìn)行轉(zhuǎn)碼的過程是以“機(jī)器語言”重現(xiàn)作品,對(duì)作品的標(biāo)記、整理和匯總也涉及對(duì)作品的全文復(fù)制,因此可能侵犯復(fù)制權(quán)。但這些行為不會(huì)侵犯權(quán)利人的翻譯權(quán)、改編權(quán)和匯編權(quán)。原因在于:第一,將作品轉(zhuǎn)碼為機(jī)器語言,并非“翻譯”行為,機(jī)器語言也并非“語言文字”的一種,因此與翻譯權(quán)無關(guān);第二,轉(zhuǎn)碼和標(biāo)記行為不涉及任何獨(dú)創(chuàng)性的表達(dá),也未對(duì)作品內(nèi)容進(jìn)行改動(dòng),故而不會(huì)侵犯改編權(quán);第三,對(duì)作品數(shù)據(jù)的整理和匯總僅作為訓(xùn)練數(shù)據(jù)使用而不對(duì)外發(fā)布,不會(huì)侵犯匯編權(quán)。同樣地,上述行為也不會(huì)侵犯權(quán)利人的修改權(quán)和保護(hù)作品完整權(quán)。修改權(quán)和保護(hù)作品完整權(quán)屬于“著作人身權(quán)”,在于保護(hù)作品不被擅自修改或歪曲篡改,以保證作者本意與作品意思的同一性。因此,構(gòu)成侵權(quán)的前提在于修改后的內(nèi)容與原作產(chǎn)生聯(lián)結(jié),使讀者從作品聯(lián)系上作者的性格、思想和情感。然而,轉(zhuǎn)碼和標(biāo)注等行為既未對(duì)作品的內(nèi)容進(jìn)行實(shí)質(zhì)改動(dòng),又未將操作后的作品進(jìn)行傳播,故而無關(guān)作品的修改權(quán)和保護(hù)作品完整權(quán)。

在模型訓(xùn)練階段,對(duì)作品表達(dá)形式的利用可能涉及翻譯、改編和匯編等行為,若訓(xùn)練數(shù)據(jù)是以非法方式獲取的,那么上述作品使用行為當(dāng)然構(gòu)成侵權(quán),但若訓(xùn)練數(shù)據(jù)是以合法方式獲取的則應(yīng)結(jié)合輸出的結(jié)果予以分析。在輸出階段,生成的表達(dá)形式具有三種情形:一是全新作品;二是與原作品相同或相似的表達(dá);三是保留原作品基本表達(dá)的具有獨(dú)創(chuàng)性的作品。第一種情形不構(gòu)成侵權(quán);第二種情形下,若生成與原作品完全相同的表達(dá),或者構(gòu)成“實(shí)質(zhì)性相似”,則可能侵犯復(fù)制權(quán);第三種情形可能涉及對(duì)改編權(quán)的侵犯。如果GenAI開發(fā)者為了進(jìn)行機(jī)器學(xué)習(xí),或者為了實(shí)現(xiàn)研究結(jié)果的可驗(yàn)證性,將數(shù)據(jù)或文本上傳至互聯(lián)網(wǎng),可能涉嫌侵犯廣播權(quán)或信息網(wǎng)絡(luò)傳播權(quán)。若將機(jī)器學(xué)習(xí)的數(shù)據(jù)分析結(jié)果在互聯(lián)網(wǎng)上進(jìn)行傳播,也可能導(dǎo)致廣播權(quán)或信息網(wǎng)絡(luò)傳播權(quán)侵權(quán)。

三、GenAI數(shù)據(jù)訓(xùn)練的版權(quán)合法性障礙

由上文分析可知,GenAI數(shù)據(jù)訓(xùn)練行為可能侵犯復(fù)制權(quán)、信息網(wǎng)絡(luò)傳播權(quán)等權(quán)利。為消解版權(quán)侵權(quán)風(fēng)險(xiǎn),可以選擇事前獲取作品的授權(quán)許可或者運(yùn)用法定許可和合理使用條款依法獲得侵權(quán)豁免。但這三種選擇均具有實(shí)現(xiàn)和適用的障礙。

(一)GenAI數(shù)據(jù)訓(xùn)練授權(quán)許可模式實(shí)現(xiàn)之障礙

在當(dāng)前的法律框架下,使用他人受版權(quán)保護(hù)的作品,應(yīng)當(dāng)事前獲得授權(quán)許可并支付報(bào)酬。然而,訓(xùn)練數(shù)據(jù)的海量特征與授權(quán)許可模式的高成本之間形成張力,傳統(tǒng)的授權(quán)模式在實(shí)踐中難以支撐海量數(shù)據(jù)學(xué)習(xí)模式的需要。首先,授權(quán)許可模式雖然充分尊重私主體的意思自治,但由于市場(chǎng)主體的有限理性以及契約不完備的固有困境,獲取授權(quán)往往需要經(jīng)過反復(fù)的利益談判才能達(dá)成,這導(dǎo)致交易流程繁瑣,數(shù)據(jù)獲取效率低下。其次,遵循授權(quán)許可模式,使數(shù)據(jù)交易成本過高,可能導(dǎo)致市場(chǎng)失靈。若對(duì)機(jī)器學(xué)習(xí)所需的海量作品一一尋求許可,不僅需要精準(zhǔn)識(shí)別作品的來源并確定權(quán)屬,而且需要就許可費(fèi)和授權(quán)范圍進(jìn)行多輪磋商,識(shí)別成本和談判成本較為高昂。在完美的市場(chǎng)上,如果在后使用作品產(chǎn)生的價(jià)值遠(yuǎn)高于許可成本,那么由市場(chǎng)機(jī)制發(fā)揮作用即可。但GenAI數(shù)據(jù)訓(xùn)練卻以較高的交易成本疊加較低的預(yù)期收益,這就導(dǎo)致了作品許可市場(chǎng)的失靈。此外,部分著作權(quán)人對(duì)GenAI使用其作品具有抵抗和排斥的心理,造成了更大的磋商障礙。他們一方面擔(dān)心人工智能技術(shù)的快速發(fā)展可能會(huì)影響自己的職業(yè)從而采取抵制態(tài)度,另一方面擔(dān)心人工智能創(chuàng)作能力的逐漸增強(qiáng),會(huì)使人類越來越依賴機(jī)器而導(dǎo)致創(chuàng)作能力逐漸退化。

當(dāng)前,GenAI開發(fā)者可以通過與互聯(lián)網(wǎng)平臺(tái)和數(shù)據(jù)庫(kù)服務(wù)商交易一站式獲取數(shù)據(jù),在一定程度上提升了授權(quán)許可的效率,似乎可以有效降低作品的交易成本。但由于缺少作品絕對(duì)集中的網(wǎng)絡(luò)服務(wù)商,并且一攬子許可容易產(chǎn)生潛在的訴訟風(fēng)險(xiǎn),導(dǎo)致交易成本高昂的問題仍難以克服。具體而言,無論是從互聯(lián)網(wǎng)平臺(tái)、公開網(wǎng)頁或是數(shù)據(jù)庫(kù)獲得作品,都無法避免與著作權(quán)人進(jìn)行額外、分散、逐一地協(xié)商,談判和執(zhí)行成本居高不下。一些互聯(lián)網(wǎng)平臺(tái)通過用戶服務(wù)協(xié)議集中了用戶發(fā)布的內(nèi)容,并獲得對(duì)該內(nèi)容進(jìn)行免費(fèi)使用、非獨(dú)家和分許可的權(quán)利。GenAI開發(fā)者可以直接與互聯(lián)網(wǎng)平臺(tái)進(jìn)行談判,獲得授權(quán)后從平臺(tái)批量下載數(shù)據(jù)。但是用戶在服務(wù)協(xié)議中同意平臺(tái)免費(fèi)使用和分許可自己發(fā)布的內(nèi)容,應(yīng)當(dāng)限于為維持自身運(yùn)營(yíng)以及提升服務(wù)質(zhì)量等目的而進(jìn)行的使用。將這些內(nèi)容許可給其他服務(wù)提供者可能超出用戶對(duì)服務(wù)協(xié)議的預(yù)期,潛在的侵權(quán)風(fēng)險(xiǎn)致使GenAI開發(fā)者無法掠過著作權(quán)人。對(duì)于數(shù)據(jù)庫(kù)而言,分為兩種情形:一是未經(jīng)著作權(quán)人授權(quán)將作品數(shù)據(jù)一攬子許可給GenAI開發(fā)者的,若不額外與著作權(quán)人逐一協(xié)商,使用作品仍具有侵權(quán)風(fēng)險(xiǎn);二是數(shù)據(jù)庫(kù)受到著作權(quán)人共同委托的,獲取作品數(shù)據(jù)集無須再向權(quán)利人獲取許可,但由于委托數(shù)據(jù)庫(kù)代理許可事宜的未必包含全部相關(guān)權(quán)利人,侵權(quán)風(fēng)險(xiǎn)仍然存在。即便順利達(dá)成大規(guī)模的作品數(shù)據(jù)交易,高昂的許可使用費(fèi)也是壓在GenAI開發(fā)者肩上的“一座大山”。

(二)GenAI數(shù)據(jù)訓(xùn)練法定許可方案運(yùn)用之障礙

為了解決作品許可市場(chǎng)失靈的問題,實(shí)現(xiàn)技術(shù)發(fā)展和文化創(chuàng)新的平衡,有學(xué)者提出運(yùn)用法定許可制度,規(guī)定GenAI開發(fā)者可以不事先獲取權(quán)利人的許可直接使用該作品,僅須向權(quán)利人支付合理報(bào)酬。這是通過立法預(yù)設(shè)交易條件替代私主體協(xié)商的方案,以弱化權(quán)利排他性的方式有效降低交易成本。滿足法定條件的,即可跳過協(xié)商環(huán)節(jié),以法律規(guī)定的特定方式使用作品,既保證了著作權(quán)人從市場(chǎng)中獲取經(jīng)濟(jì)收益,又能避免逐一許可,提升數(shù)據(jù)獲取效率。這一主張具有一定的意義,但是將GenAI數(shù)據(jù)訓(xùn)練行為增設(shè)為一項(xiàng)新的法定許可使用情形,并不符合法定許可制度的立法價(jià)值,同時(shí)仍然難以跨越高成本的障礙。

首先,在擴(kuò)大法定許可范疇時(shí),應(yīng)當(dāng)從制度的立法價(jià)值出發(fā),避免想當(dāng)然地利用該制度扭轉(zhuǎn)作品許可市場(chǎng)的失靈。當(dāng)前主張運(yùn)用法定許可方案的觀點(diǎn),僅以法定許可產(chǎn)生的正向效應(yīng)為論證基礎(chǔ),并未充分考慮GenAI數(shù)據(jù)訓(xùn)練行為與該制度的契合性。通過追溯美國(guó)版權(quán)法定許可制度的立法定位,發(fā)現(xiàn)其立法價(jià)值是在新的作品傳播方式和傳播主體出現(xiàn)時(shí),用以調(diào)和新舊產(chǎn)業(yè)主體之間的利益分配的權(quán)宜之計(jì)。以錄音制品的法定許可為例,起初音樂作品僅以樂譜的方式進(jìn)行復(fù)制和發(fā)行,與圖書共同隸屬出版產(chǎn)業(yè)。隨著音樂作品新傳播載體的普及,音樂產(chǎn)業(yè)由樂譜發(fā)行向錄音制品發(fā)行轉(zhuǎn)型,由此出現(xiàn)了新的傳播主體“錄音制品制作者”。為了調(diào)和音樂作品傳統(tǒng)出版者和錄音制品制作者的利益分配矛盾,同時(shí)避免已取得授權(quán)的主體獲得壟斷地位,立法者賦予使用者在法律框架內(nèi)平等錄制音樂作品的權(quán)利。這種基于產(chǎn)業(yè)利益協(xié)調(diào)的立法價(jià)值,被定位為私人授權(quán)許可的補(bǔ)充,其適用被視為一種臨時(shí)性、妥協(xié)性的制度工具,因此在立法設(shè)計(jì)上并未簡(jiǎn)化許可程序,反而增加嚴(yán)格的適用條件。我國(guó)法定許可制度具有較強(qiáng)的公共屬性,其基本目標(biāo)是促進(jìn)作品的傳播,實(shí)現(xiàn)著作權(quán)人、傳播者以及公眾之間的利益平衡。針對(duì)GenAI數(shù)據(jù)訓(xùn)練行為,運(yùn)用法定許可方案的確能夠調(diào)和著作權(quán)人和人工智能開發(fā)者之間的利益沖突。但是反過來,為GenAI數(shù)據(jù)訓(xùn)練行為設(shè)定法定許可規(guī)則卻難以實(shí)現(xiàn)促進(jìn)作品傳播、保證公眾及時(shí)獲取作品等公共利益目標(biāo)。原因是:第一,GenAI缺乏傳播作品的經(jīng)濟(jì)誘因,其商業(yè)模式在于通過對(duì)大量作品的學(xué)習(xí)為公眾提供生成內(nèi)容服務(wù),生成的作品甚至與原作品形成市場(chǎng)競(jìng)爭(zhēng)關(guān)系;第二,社會(huì)公眾并不依賴GenAI數(shù)據(jù)訓(xùn)練獲取作品,公眾所享受的乃是技術(shù)進(jìn)步帶來的作品創(chuàng)造力的提升。

其次,運(yùn)用法定許可使用方案雖提升了獲取作品的效率,但并未解決交易成本高昂的問題。第一,由于訓(xùn)練數(shù)據(jù)所需作品數(shù)量眾多,所需支付的法定許可使用費(fèi)用依舊高昂。作為理性的經(jīng)濟(jì)主體,當(dāng)投資遠(yuǎn)高于回報(bào)時(shí),GenAI開發(fā)者必定望而卻步。在這種情況下,開發(fā)者可能放棄對(duì)GenAI技術(shù)的研發(fā)和應(yīng)用,但更可能以承擔(dān)侵權(quán)風(fēng)險(xiǎn)為代價(jià)來換取技術(shù)的發(fā)展和應(yīng)用。因?yàn)閷?duì)作品數(shù)據(jù)的使用通常比較隱蔽,權(quán)利人也較難舉證證明。如此對(duì)于解決數(shù)據(jù)訓(xùn)練的合法性問題并無半分增益。第二,法定許可定價(jià)難以適應(yīng)市場(chǎng)的靈活多變。法定許可主要通過定價(jià)權(quán)的轉(zhuǎn)移,來實(shí)現(xiàn)財(cái)產(chǎn)權(quán)排他性的弱化。但無論定價(jià)權(quán)是通過代表談判的方式協(xié)商再經(jīng)由版權(quán)主管部門批準(zhǔn),還是直接由版權(quán)主管部門確定,都難以克服法定價(jià)格機(jī)制的固有缺陷。定價(jià)靈活性的缺乏不僅可能阻礙作品價(jià)值的實(shí)現(xiàn),而且限制了市場(chǎng)有效率的競(jìng)爭(zhēng)行為。第三,法定許可費(fèi)的收取和管理工作將耗費(fèi)巨大的成本。其一,法定許可的推行建立在對(duì)使用的作品數(shù)據(jù)進(jìn)行充分公開的基礎(chǔ)上;其二,要對(duì)數(shù)以萬計(jì)的作品進(jìn)行權(quán)屬明晰以及分發(fā)許可費(fèi);其三,管理機(jī)構(gòu)可能還需要代替權(quán)利人進(jìn)行維權(quán)和應(yīng)訴。上述過程,需要耗費(fèi)巨大的人力、物力和財(cái)力,在扣除這些成本后,剩下的部分可能不足以實(shí)現(xiàn)對(duì)著作權(quán)人的激勵(lì)。總的來說,運(yùn)用法定許可方案可能使社會(huì)整體福利呈現(xiàn)凈損失。

(三)GenAI數(shù)據(jù)訓(xùn)練合理使用條款適用之障礙

為促進(jìn)技術(shù)發(fā)展,讓GenAI開發(fā)者利用作品成為可能,將數(shù)據(jù)訓(xùn)練行為納入版權(quán)合理使用制度也是一個(gè)選擇。當(dāng)前各國(guó)的立法政策也傾向于采用合理使用制度解決GenAI數(shù)據(jù)訓(xùn)練的合法性問題,如歐盟設(shè)定“文本與數(shù)據(jù)挖掘”的專門例外,日本規(guī)定“提供新的知識(shí)信息”的合理使用情形等。

我國(guó)《著作權(quán)法》規(guī)定的合理使用情形并不包括GenAI數(shù)據(jù)訓(xùn)練行為,只能試圖通過解釋論的立場(chǎng)將其解釋為合理使用的特定情形之一。與GenAI訓(xùn)練數(shù)據(jù)相關(guān)聯(lián)的合理使用情形主要有:個(gè)人使用、適當(dāng)引用、科學(xué)研究的少量復(fù)制使用等。對(duì)于“個(gè)人使用”情形,使用作品的目的是“個(gè)人學(xué)習(xí)、研究和欣賞”,但這里的“個(gè)人”通常限于“自然人”,不能包括法人與非法人組織,更不能囊括人工智能系統(tǒng)。從歐盟《DSM指令》將“文本與數(shù)據(jù)挖掘”的主體限于“研究機(jī)構(gòu)”和“文化遺產(chǎn)機(jī)構(gòu)”可知,“個(gè)人”無法成為數(shù)據(jù)挖掘主體,“個(gè)人使用”也無法解釋為包括GenAI數(shù)據(jù)訓(xùn)練行為;對(duì)于“適當(dāng)引用”情形,首先要求對(duì)作品的使用是“適當(dāng)”的,其次使用的目的在于“為介紹評(píng)論某一作品或者說明某一問題”,但數(shù)據(jù)訓(xùn)練過程對(duì)作品的使用并非“引用”行為,也突破了“適當(dāng)”的限制,故而無法適用;對(duì)于“科學(xué)研究的少量復(fù)制使用”,雖然GenAI對(duì)作品數(shù)據(jù)的分析、處理可以視為科學(xué)研究行為,但是作為合理使用的科學(xué)研究,不僅存在主體限制(限于公立學(xué)校、科研院所等),而且存在數(shù)量限制(少量復(fù)制),因此GenAI數(shù)據(jù)訓(xùn)練行為也難以使用該情形進(jìn)行抗辯。綜上,無法將GenAI數(shù)據(jù)訓(xùn)練行為解釋為我國(guó)《著作權(quán)法》規(guī)定的特定合理使用情形,原則上應(yīng)構(gòu)成侵害版權(quán)的行為。雖然我國(guó)法院在實(shí)踐中吸收了美國(guó)合理使用的四要素標(biāo)準(zhǔn),并在系列案件中突破了《著作權(quán)法》的封閉式規(guī)定。但這樣的突破實(shí)際上是于法無據(jù)的,同時(shí)也造成了司法適用標(biāo)準(zhǔn)的混亂。此外,為解決GenAI數(shù)據(jù)訓(xùn)練的合法性問題而增設(shè)合理使用專門條款,受到過度偏向技術(shù)進(jìn)步而忽略著作權(quán)人利益的批評(píng)。配置作品數(shù)據(jù)資源的方案選擇,不僅需要衡量立法技術(shù),還需充分考慮各方利益訴求。

四、博弈視角下GenAI數(shù)據(jù)訓(xùn)練相關(guān)利益主體的沖突和協(xié)調(diào)

GenAI數(shù)據(jù)訓(xùn)練的版權(quán)合法性爭(zhēng)議,反映了著作權(quán)人(創(chuàng)作者)和GenAI開發(fā)者(使用者)的利益沖突。借用博弈論分析工具,能夠更好地研判博弈參與者的策略選擇,以探尋最優(yōu)的解決方案。

(一)博弈論適用策略效用

博弈論是研究存在利益沖突與合作的主體在互動(dòng)中作出理性選擇的一種分析方法。其總體邏輯是,博弈參與者在掌握博弈規(guī)則(包括行為、時(shí)間和信息)的基礎(chǔ)上,以自身利益最大化為目標(biāo)作出決策選擇,在先決策會(huì)對(duì)在后決策產(chǎn)生影響,從而產(chǎn)生動(dòng)態(tài)的決策改進(jìn)。博弈參與者被假設(shè)為“理性人”,在進(jìn)行決策時(shí),能夠根據(jù)所掌握的信息以及其他參與者的決策實(shí)現(xiàn)目的最大化,把自身核心利益當(dāng)作努力追求的最終目標(biāo)。博弈論分析方法綜合考慮了各博弈參與者的預(yù)期和實(shí)際行為,其效用在解釋具有競(jìng)爭(zhēng)性或利益沖突現(xiàn)象中尤其顯著。

著作權(quán)人與GenAI開發(fā)者之間的矛盾源于經(jīng)濟(jì)利益沖突:GenAI開發(fā)者使用作品不僅不向著作權(quán)人尋求許可,而且生成的內(nèi)容還可能影響原作品的市場(chǎng)利益。因此,著作權(quán)人希望維持對(duì)作品的嚴(yán)格控制,他人使用作品的必須獲得許可并支付報(bào)酬;而GenAI開發(fā)者希望可以通過合理使用制度,以最低成本獲取海量數(shù)據(jù)資源。二者作為理性人均以追求自身利益最大化為目標(biāo),其策略選擇不僅回應(yīng)自身需求,而且受到相互之間行為決策的影響。比如,當(dāng)著作權(quán)人不愿意放棄許可權(quán)或獲酬權(quán)時(shí),GenAI開發(fā)者受制于過高的交易成本,要么選擇放棄技術(shù)的升級(jí)應(yīng)用,要么只能選擇承擔(dān)侵權(quán)風(fēng)險(xiǎn)。這種以追求自身利益最大化為目的,并且策略又相互影響的過程,符合博弈論的基本分析框架。鑒于GenAI的技術(shù)水平、數(shù)據(jù)訓(xùn)練規(guī)模、法律和政策導(dǎo)向以及市場(chǎng)現(xiàn)存作品等信息在一定程度上均是可公開獲取的,博弈參與者的決策可以基于博弈信息以及其他利益相關(guān)主體的行為作出適當(dāng)調(diào)整。博弈論適用的效用體現(xiàn)在:一是通過博弈分析,研判創(chuàng)作者、使用者以及社會(huì)公眾在不同制度環(huán)境下作出的策略選擇,可以清晰地得出不同的制度設(shè)計(jì)對(duì)于參與者群體策略選擇的影響,從而衡量制度的激勵(lì)功能是否充分實(shí)現(xiàn);二是基于博弈論分析框架,分析各利益主體可能作出的理性行為決策,有助于形成最優(yōu)策略組合下的納什均衡。

(二)著作權(quán)人與人工智能開發(fā)者的博弈

從博弈論的視角出發(fā),能為著作權(quán)人和GenAI開發(fā)者利益沖突的解決提供新的思路。在經(jīng)典模型“囚徒困境”中,兩名共謀犯均以追求個(gè)人利益最大化為目標(biāo),從而都作出“招供”的策略選擇,但在該嚴(yán)格占優(yōu)策略均衡下,雙方卻又陷入了對(duì)彼此來說都不利的局面。囚徒陷入困境的原因在于,一方從不招供轉(zhuǎn)變?yōu)檎泄瑐€(gè)人能夠獲得減刑。但同時(shí)會(huì)增加同伙的刑期,這是該囚徒施加于同伙的負(fù)外部性。而在“獵鹿博弈”中,合作會(huì)成為多數(shù)情況下的選擇。兩個(gè)博弈模型最大的區(qū)別就在于:“獵鹿博弈”模型中,雙方都選擇合作具有可預(yù)期性,從而形成穩(wěn)定而持續(xù)的狀態(tài);而在“囚徒困境”中,由于無法溝通且缺乏信任,導(dǎo)致難以形成穩(wěn)定的狀態(tài)?!扒敉嚼Ь场彼l(fā)的集體理性和個(gè)體理性對(duì)立是人們?cè)谏鐣?huì)合作中不可避免的實(shí)際問題。著作權(quán)人與GenAI開發(fā)者之間的利益博弈實(shí)際上就是“囚徒困境”的表現(xiàn),若博弈雙方均以自身利益最大化為目標(biāo)進(jìn)行決策選擇,最終將形成對(duì)彼此都不利的局面。但是,著作權(quán)人與GenAI開發(fā)者之間的博弈可以建立在協(xié)商的基礎(chǔ)之上,屬于動(dòng)態(tài)博弈過程,當(dāng)二者在經(jīng)歷多次以“個(gè)人效用”為核心的策略后,發(fā)現(xiàn)還可能具有雙贏的局面,這比嚴(yán)格占優(yōu)策略所形成的局面更佳,那么二者就會(huì)在之后的博弈過程中嘗試互建信任,驅(qū)使雙方都選擇合作策略。若假設(shè)博弈次數(shù)是無限的,商業(yè)往來也是無限的,那么二者的策略都將選擇持續(xù)的合作,由此形成納什均衡。

GenAI數(shù)據(jù)訓(xùn)練的合法性爭(zhēng)議背后承載了人格利益、財(cái)產(chǎn)利益以及社會(huì)公共利益,不同利益之間的沖突和博弈,折射出“版權(quán)嚴(yán)格保護(hù)”與“作品自由使用”之間的緊張關(guān)系、“私人利益”與“公共利益”之間的權(quán)衡關(guān)系。在博弈參與者利益沖突的過程中,往往需要進(jìn)行協(xié)調(diào)和妥協(xié),以實(shí)現(xiàn)資源配置效益的最大化。對(duì)于著作權(quán)人而言,在保證合法權(quán)益(尤其是獲酬權(quán))的情況下,實(shí)際上并不排斥作品被使用。其可能的擔(dān)心之處在十,作品被用于訓(xùn)練后生成的內(nèi)容對(duì)原作品的市場(chǎng)利益產(chǎn)生影響或?qū)υ髌肥袌?chǎng)產(chǎn)生替代作用。如在美國(guó)國(guó)會(huì)聽證會(huì)上,藝術(shù)家卡拉,奧爾蒂斯(Karla Ortiz)認(rèn)為,藝術(shù)作品一經(jīng)訓(xùn)練就無法被機(jī)器遺忘,藝術(shù)家們被迫與建立在自己作品基礎(chǔ)上的人工智能模型競(jìng)爭(zhēng),對(duì)他們的權(quán)益產(chǎn)生很大的損害。但同時(shí),GenAI服務(wù)能力的提升也會(huì)使創(chuàng)作者受益。創(chuàng)作者運(yùn)用人工智能技術(shù)進(jìn)行創(chuàng)作活動(dòng),能夠降低生產(chǎn)成本,提升創(chuàng)作效率和產(chǎn)量,從而獲得更多的市場(chǎng)利益,以此沖抵帶來的負(fù)面影響。對(duì)于GenAI開發(fā)者來說,其希望在合法合規(guī)的前提下,以較低的成本獲取大量作品;對(duì)于社會(huì)公眾而言,其既是GenAI技術(shù)的受益者同時(shí)也是創(chuàng)作者,不僅希望能獲得更好的內(nèi)容生成服務(wù),而且也希望生成的作品受到保護(hù)。這三方利益的調(diào)和以著作權(quán)人和GenAI開發(fā)者利益協(xié)調(diào)為前提,二者存在共贏的可能。在著作權(quán)人與GenAI開發(fā)者無法通過協(xié)商形成最優(yōu)策略時(shí),還可以通過法律法規(guī)對(duì)博弈的方式進(jìn)行改變,從而達(dá)到帕累托最優(yōu)。

(三)可能的博弈策略研析

當(dāng)前,解決GenAI訓(xùn)練數(shù)據(jù)版權(quán)合法性問題的方案主要有:授權(quán)許可、法定許可和合理使用。從價(jià)值衡量來說,方案的選擇需平衡“版權(quán)保護(hù)”“作品利用”和“技術(shù)進(jìn)步”三項(xiàng)價(jià)值。上述三種方案,版權(quán)保護(hù)依次減弱,技術(shù)進(jìn)步的促進(jìn)逐漸增強(qiáng)。相較于授權(quán)許可方案,法定許可和合理使用都更加偏向技術(shù)進(jìn)步,專有權(quán)效力被弱化;而授權(quán)許可模式是對(duì)版權(quán)的嚴(yán)格保護(hù),但是限制了對(duì)作品的利用,不利于GenAI技術(shù)的進(jìn)步。

在博弈過程中,若遵循授權(quán)許可方案,GenAI開發(fā)者將面臨兩種策略選擇:一是只使用部分具有合法來源的數(shù)據(jù)進(jìn)行訓(xùn)練,犧牲GenAI服務(wù)的質(zhì)量;二是依舊使用海量數(shù)據(jù),但以承受侵權(quán)風(fēng)險(xiǎn)支撐技術(shù)的應(yīng)用和升級(jí),背負(fù)作品數(shù)據(jù)非法使用的“原罪”。在進(jìn)行風(fēng)險(xiǎn)和收益分析時(shí),若技術(shù)升級(jí)應(yīng)用所實(shí)現(xiàn)的價(jià)值遠(yuǎn)高于承受侵權(quán)風(fēng)險(xiǎn)所帶來的成本,那么作為理性主體的GenAI開發(fā)者必定會(huì)選擇第二種策略。對(duì)于著作權(quán)人來說,拒絕自身作品被GenAI開發(fā)者使用的,只能通過起訴維護(hù)權(quán)利,但需要承擔(dān)訴訟成本和時(shí)間成本,對(duì)于個(gè)體而言并不具有與人工智能公司抗衡的能力,理性的著作權(quán)人通常只能選擇息事寧人。

對(duì)于法定許可方案而言,雖然對(duì)各方利益均有兼顧,但根據(jù)上文分析可知,其在技術(shù)支撐、法律規(guī)制和實(shí)施保證等方面實(shí)現(xiàn)難度過高,并非收益最大的方案。而對(duì)于合理使用方案,其不足之處在于過度偏向GenAI開發(fā)者,而可能有損著作權(quán)人的利益。但實(shí)際上大多數(shù)的機(jī)器學(xué)習(xí)行為并不會(huì)損害著作權(quán)人的市場(chǎng)利益,可以預(yù)見的是,隨著GenAI開發(fā)者對(duì)過濾技術(shù)的使用,不斷提升防御誘導(dǎo)式提問的能力,輸出與原作品實(shí)質(zhì)性相同的情形逐漸減少。有觀點(diǎn)認(rèn)為,GenAI模仿了某位作者的“風(fēng)格”,將造成對(duì)作品市場(chǎng)利益的實(shí)質(zhì)性損害。但《著作權(quán)法》并不保護(hù)“風(fēng)格”,上述情形雖然可能會(huì)影響原作者的市場(chǎng)利益,但卻不是著作權(quán)法解決的問題。在博弈的過程中,已有作品數(shù)據(jù)的數(shù)量和質(zhì)量是影響博弈策略的一個(gè)重要方面。當(dāng)存在大量?jī)?yōu)秀的作品數(shù)據(jù)時(shí),作品的合理使用對(duì)各方都有利;但當(dāng)此類作品數(shù)據(jù)稀缺時(shí),合理使用就可能損害創(chuàng)作者的利益。為更好地兼顧著作權(quán)人的利益,歐盟《DSM指令》為權(quán)利人設(shè)定了“選擇退出”機(jī)制。但以理性人的角度分析,合理使用并未將著作權(quán)人置于利益分享的范圍內(nèi),若權(quán)利人選擇退出無須承擔(dān)額外的成本,反而可以試圖獲取許可收益,那么著作權(quán)人可能都將傾向于選擇退出。

如前所述,解決GenAI訓(xùn)練數(shù)據(jù)合法性的策略涉及三項(xiàng)價(jià)值。但從不同角度分析,價(jià)值側(cè)重有所不同。從產(chǎn)業(yè)政策角度來看,合理使用制度可以減輕技術(shù)研發(fā)負(fù)擔(dān),促進(jìn)產(chǎn)業(yè)發(fā)展,若要求逐一許可將承擔(dān)過高成本,可能造成“公地悲劇”。從全球制度競(jìng)爭(zhēng)的視角來看,歐盟、日本、美國(guó)均規(guī)定了關(guān)于GenAI數(shù)據(jù)訓(xùn)練或嚴(yán)或?qū)挼陌鏅?quán)舉措,為應(yīng)對(duì)人工智能制度競(jìng)爭(zhēng)浪潮,我國(guó)也有必要采取合理使用制度以營(yíng)造良好的人工智能產(chǎn)業(yè)發(fā)展環(huán)境。因此,在博弈視角下,合理使用制度是解決著作權(quán)人和GenAI開發(fā)者利益沖突的較優(yōu)選擇。

五、GenAI數(shù)據(jù)訓(xùn)練的版權(quán)合理使用條款設(shè)計(jì)

合理使用是配置作品數(shù)據(jù)資源的較優(yōu)路徑,也是協(xié)調(diào)著作權(quán)人和GenAI開發(fā)者利益沖突的理性選擇。但是難以通過解釋路徑將GenAI數(shù)據(jù)訓(xùn)練行為納入現(xiàn)有的合理使用情形;若是適用由美國(guó)判例法發(fā)展而來的“轉(zhuǎn)換性使用”規(guī)則,可能存在適用范圍過于寬泛,司法適用標(biāo)準(zhǔn)不一的問題。因此,通過立法以體系性規(guī)范為基礎(chǔ)將GenAI數(shù)據(jù)訓(xùn)練行為明確為特定的合理使用情形,不失為一種選擇。2020年我國(guó)《著作權(quán)法》第三次修改引人“三步檢驗(yàn)法”,并新增“法律、行政法規(guī)規(guī)定的其他情形”這一兜底條款,為GenAI數(shù)據(jù)訓(xùn)練行為納入合理使用范疇提供了制度空間??梢浴秾?shí)施條例》的修改為契機(jī),增設(shè)GenAI數(shù)據(jù)訓(xùn)練的合理使用情形。

(一)《實(shí)施條例》引入GenAI數(shù)據(jù)訓(xùn)練合理使用條款的價(jià)值考量

首先,延續(xù)《著作權(quán)法》“寬進(jìn)寬出”的分析框架,明確GenAI數(shù)據(jù)訓(xùn)練行為受到版權(quán)專有權(quán)控制,并適當(dāng)放寬合理使用的標(biāo)準(zhǔn)。有觀點(diǎn)提出,數(shù)據(jù)訓(xùn)練行為應(yīng)當(dāng)界定為“非作品使用行為”,將其排除在版權(quán)權(quán)利范圍之外,這種做法優(yōu)+“先進(jìn)后出”的合理使用方案。也有觀點(diǎn)區(qū)分不同階段,認(rèn)為數(shù)據(jù)輸入和訓(xùn)練階段對(duì)作品的使用不落人版權(quán)專有權(quán)控制范圍。以上觀點(diǎn)有待商榷。若嚴(yán)格設(shè)定著作權(quán)法的準(zhǔn)入門檻,將GenAI使用作品的行為均定義為“非作品性使用”,將計(jì)算機(jī)的“臨時(shí)復(fù)制”排除出“復(fù)制權(quán)”的控制范圍,可能導(dǎo)致大量信息成果無法適用版權(quán)的分析框架。版權(quán)分析框架相較于其他創(chuàng)新性利益分析框架的優(yōu)勢(shì)在于,前者采取放寬準(zhǔn)入的方式以應(yīng)對(duì)海量信息成果帶來的界權(quán)挑戰(zhàn)。若過分限縮受《著作權(quán)法》控制的行為范圍,對(duì)海量信息成果進(jìn)行“事前界權(quán)”,可能導(dǎo)致整體社會(huì)成本的提升,錯(cuò)誤地拒絕保護(hù)更可能挫傷創(chuàng)新熱情。值得注意的是,將GenAI數(shù)據(jù)訓(xùn)練行為納入《著作權(quán)法》的分析框架,也并不意味著讓大量利用作品的行為承擔(dān)侵權(quán)后果。通過合理使用規(guī)則,能夠在后端提供恰當(dāng)?shù)摹俺隹凇?,?duì)無損于社會(huì)利益和著作權(quán)人合法權(quán)益的行為以及在市場(chǎng)失靈情形下的作品利用行為予以免責(zé)。如此,既能發(fā)揮《著作權(quán)法》“事后界權(quán)”的優(yōu)勢(shì),對(duì)非典型作品使用行為予以足夠的關(guān)注,又能有效降低社會(huì)成本,維持《著作權(quán)法》的激勵(lì)功能。

其次,以利益平衡原則作為GenAI數(shù)據(jù)訓(xùn)練合理使用情形的價(jià)值指引原則。GenAI數(shù)據(jù)訓(xùn)練的合法性爭(zhēng)議突出表現(xiàn)在著作權(quán)人和GenAI開發(fā)者的利益沖突。由上文分析可知,兼顧各方利益是破局的關(guān)鍵。合理使用制度旨在維系著作權(quán)人與其他參與性主體(傳播者、使用者等)之間的利益平衡關(guān)系。隨著傳播技術(shù)的發(fā)展和數(shù)字環(huán)境下新作品使用方式的出現(xiàn),在版權(quán)專有權(quán)效力得以延伸時(shí),也應(yīng)保障合理使用范圍得到必要的擴(kuò)展。實(shí)現(xiàn)“促進(jìn)社會(huì)主義文化和科學(xué)事業(yè)的發(fā)展與繁榮”的立法目標(biāo),不僅需要保護(hù)版權(quán)人的利益,而且要關(guān)注社會(huì)公眾的利益。公眾作為作品的使用者是《著作權(quán)法》上不可或缺的主體,保證公眾對(duì)作品的接觸、欣賞和學(xué)習(xí)是實(shí)現(xiàn)版權(quán)立法目標(biāo)的重要環(huán)節(jié)。GenAI開發(fā)者亦屬于“公眾”中的一員,引入GenAI數(shù)據(jù)訓(xùn)練合理使用條款,擴(kuò)大訓(xùn)練數(shù)據(jù)的獲取范圍,有助于避免產(chǎn)生算法偏見,提升生成內(nèi)容服務(wù)的能力和水平,助力文化繁榮。

最后,對(duì)引入的GenAI數(shù)據(jù)訓(xùn)練合理使用條款進(jìn)行適當(dāng)概括,賦予法官一定程度的自由裁量權(quán)?!吨鳈?quán)法》第三次修改引入“三步檢驗(yàn)法”并新增“法律、行政法規(guī)規(guī)定的其他情形”這一兜底條款,但實(shí)際上對(duì)于合理使用依舊采取從嚴(yán)認(rèn)定的原則,既要滿足特定情形,又要接受一般條款的檢驗(yàn)。這次修改雖通過增加兜底條款,提升了合理使用認(rèn)定在一定程度上的靈活性,但是現(xiàn)行規(guī)定的12種情形,不僅在數(shù)量上遠(yuǎn)少于歐洲大陸法系國(guó)家著作權(quán)法規(guī)定的例外情形,而且寄希望于通過第13種情形不斷增加權(quán)利限制的情形并不現(xiàn)實(shí)。原因在于,《實(shí)施條例》等行政法規(guī)修改頻次較低,為配合《著作權(quán)法》實(shí)施修訂后短期內(nèi)再次修訂的幾率并不大。因此,在此次《實(shí)施條例》修訂引入GenAI數(shù)據(jù)訓(xùn)練合理使用條款時(shí),對(duì)該條款的設(shè)計(jì)不應(yīng)再設(shè)置過多的“限制條件”,應(yīng)對(duì)其進(jìn)行適當(dāng)?shù)母爬?,讓其接受一般條款的進(jìn)一步限定,從而留給法官一定的裁量空間,方能更好地應(yīng)對(duì)實(shí)踐需求。

(二)《實(shí)施條例》引入GenAI數(shù)據(jù)訓(xùn)練合理使用條款的專門例外

為了解決作品許可市場(chǎng)失靈現(xiàn)象,促進(jìn)GenAI相關(guān)產(chǎn)業(yè)的發(fā)展,協(xié)調(diào)著作權(quán)人和GenAI開發(fā)者的利益沖突,應(yīng)當(dāng)在《實(shí)施條例》中引人GenAI數(shù)據(jù)訓(xùn)練合理使用條款的專門例外。

首先,就適用主體而言,我國(guó)應(yīng)選擇不嚴(yán)格限定適用主體的立法模式。歐盟《DSM指令》第3條規(guī)定了“文本與數(shù)據(jù)挖掘”的強(qiáng)制性例外,適用于“研究機(jī)構(gòu)”和“文化遺產(chǎn)機(jī)構(gòu)”兩類主體。歐盟對(duì)適用主體的明確,雖然可以增強(qiáng)規(guī)則適用的預(yù)期,但因限定主體導(dǎo)致適用范圍過于狹窄而遭受批評(píng)。日本《著作權(quán)法》中“提供新的知識(shí)和信息”條款未限定適用主體。我國(guó)立法應(yīng)選擇不限定適用主體的做法。原因在于兩個(gè)方面。其一,在GenAI技術(shù)應(yīng)用中使用作品數(shù)據(jù)的主體,不僅包括高校、科研院所等教育和科研機(jī)構(gòu),而且包括社會(huì)機(jī)構(gòu)和企業(yè)。企業(yè)作為提供CenAI服務(wù)的重要主體,不能忽略;此外,很多企業(yè)也成立了科研機(jī)構(gòu),若如歐盟一般將主體限定為研究機(jī)構(gòu),可能導(dǎo)致實(shí)踐中區(qū)分困難的情形。其二,不嚴(yán)格限定適用的主體,能使該條款具備一定的彈性空間。我國(guó)合理使用制度采用“三步檢驗(yàn)法”,除屬于法定情形外,還需要接受一般條款的進(jìn)一步限制。也就是說,在對(duì)作品進(jìn)行商業(yè)性使用時(shí),可能會(huì)因?yàn)橛绊懥嗽撟髌返恼J褂没虿缓侠淼負(fù)p害著作權(quán)人的合法權(quán)益,而不構(gòu)成合理使用。利用一般條款進(jìn)行限制,可以賦予法官一定程度的自由裁量權(quán),相對(duì)主體限定模式將更為科學(xué),也更加合理地平衡了科學(xué)研究、產(chǎn)業(yè)發(fā)展和著作權(quán)人的合法權(quán)益。

其次,就適用條件而言,我國(guó)不應(yīng)以非營(yíng)利性目的作為適用條件。日本《著作權(quán)法》中“非享受性使用條款”適用于不涉及對(duì)作品思想或情感表達(dá)享受的情形,未排除以商業(yè)目的使用作品的行為;美國(guó)“四要素標(biāo)準(zhǔn)”雖然關(guān)注“作品使用目的與性質(zhì)”,相較于非商業(yè)使用目的而言,商業(yè)性合理使用的認(rèn)定可能需要更加正當(dāng)?shù)睦碛?,但“轉(zhuǎn)換性使用”并不絕對(duì)排斥商業(yè)性合理使用。我國(guó)立法也不應(yīng)以非營(yíng)利性目的作為適用條件。原因在于以下幾個(gè)方面。一是相對(duì)于作品使用者獲得的經(jīng)濟(jì)利益而言,著作權(quán)法更應(yīng)注重所取得的社會(huì)利益。GenAI產(chǎn)業(yè)的發(fā)展關(guān)系國(guó)家戰(zhàn)略,技術(shù)的應(yīng)用和發(fā)展能夠產(chǎn)生較大的社會(huì)效益,即便GenAI開發(fā)者具有直接或間接的商業(yè)利益驅(qū)動(dòng),也無法掩蓋其帶來的社會(huì)效益,適當(dāng)犧牲著作權(quán)人的利益符合對(duì)價(jià)原則。二是為GenAI數(shù)據(jù)訓(xùn)練使用作品大多出于商業(yè)目的,需要付出巨大的成本,雖然不排除為了公益目的而進(jìn)行投資的情況,但毫無疑問,投資者所追求的是人工智能技術(shù)的應(yīng)用價(jià)值和商業(yè)效益。若排除商業(yè)目的的合理使用,該條款所產(chǎn)生的實(shí)際效用將微乎其微。三是我國(guó)合理使用制度并不排斥商業(yè)性合理使用。諸如“適當(dāng)引用”等情形并未明確“非營(yíng)利目的”,在司法實(shí)踐中,也有法院認(rèn)為對(duì)作品進(jìn)行“適當(dāng)引用”既可以是公益性的也可以是商業(yè)性的。如上文不限定適用主體的分析一般,放寬適用條件,通過一般條款進(jìn)行限制,在實(shí)踐中將具有更強(qiáng)的適用性。

最后,就適用行為而言,應(yīng)盡可能囊括GenAI數(shù)據(jù)訓(xùn)練過程中涉及的作品使用行為。如上文分析可知,在GenAI數(shù)據(jù)訓(xùn)練過程中可能涉及對(duì)作品的復(fù)制、改編、廣播和信息網(wǎng)絡(luò)傳播等行為。歐盟《DSM指令》僅將“文本與數(shù)據(jù)挖掘”的適用行為規(guī)定為“復(fù)制和提取”,無法囊括GenAI數(shù)據(jù)訓(xùn)練所涉及的作品使用行為。2018年日本《著作權(quán)法》修訂,將侵權(quán)豁免的行為進(jìn)行了擴(kuò)大,刪除了信息分析結(jié)果利用行為的限制條件,不局限于“記錄”或“改編”,更改后的條款允許將信息分析結(jié)果進(jìn)行發(fā)布、轉(zhuǎn)讓和公共傳播。我國(guó)可以考慮借鑒日本的做法,為GenAI數(shù)據(jù)訓(xùn)練提供更為寬松的環(huán)境,將該條款適用的行為規(guī)定為復(fù)制、改編和向公眾傳播。

綜上,本文建議在《實(shí)施條例》中引入GenAI數(shù)據(jù)訓(xùn)練的合理使用條款,將其設(shè)計(jì)為:“為生成式人工智能訓(xùn)練數(shù)據(jù),復(fù)制、存儲(chǔ)、改編他人已發(fā)表的作品以及將數(shù)據(jù)訓(xùn)練成果向公眾提供?!?/p>

六、結(jié)語

GenAI技術(shù)的應(yīng)用和升級(jí)以海量數(shù)據(jù)的“投喂”為基礎(chǔ)。為破除GenAI數(shù)據(jù)訓(xùn)練的合法性障礙,域外多個(gè)國(guó)家和地區(qū)或引入專門例外規(guī)則,或通過司法實(shí)踐對(duì)該問題進(jìn)行靈活處理。我國(guó)也應(yīng)積極采取行動(dòng),為數(shù)據(jù)訓(xùn)練合法性問題提供解決路徑。著作權(quán)人和GenAI開發(fā)者之間的沖突并非不可調(diào)和,兼顧各方利益是破局的前提,相互信任是合作共贏的基礎(chǔ)。通過對(duì)不同方案下博弈參與者的策略選擇進(jìn)行分析,發(fā)現(xiàn)合理使用是協(xié)調(diào)二者利益沖突的理性選擇。從產(chǎn)業(yè)政策角度來看,合理使用制度能夠?yàn)榧夹g(shù)研發(fā)和應(yīng)用減負(fù),促進(jìn)GenAI產(chǎn)業(yè)發(fā)展;從全球制度競(jìng)爭(zhēng)的視角來看,為應(yīng)對(duì)人工智能制度的競(jìng)爭(zhēng)浪潮,我國(guó)有必要積極采取措施,完善合理使用制度以適應(yīng)人工智能產(chǎn)業(yè)發(fā)展。因此,我國(guó)應(yīng)在《實(shí)施條例》修改之際,引入“生成式人工智能數(shù)據(jù)訓(xùn)練”合理使用的專門例外,解決當(dāng)下作品許可市場(chǎng)的失靈現(xiàn)象,協(xié)調(diào)相關(guān)利益主體的分歧與沖突,促進(jìn)技術(shù)創(chuàng)新、文化繁榮與社會(huì)發(fā)展。

(作者曹新明系中南財(cái)經(jīng)政法大學(xué)知識(shí)產(chǎn)權(quán)研究中心教授、博士生導(dǎo)師;范曄系中南財(cái)經(jīng)政法大學(xué)知識(shí)產(chǎn)權(quán)研究中心博士研究生)

本文系教育部人文社會(huì)科學(xué)重點(diǎn)研究基地重大項(xiàng)目“建立科學(xué)高效的專利無效抗辯制度研究”(項(xiàng)目編號(hào):22JJD820028)的階段性成果。

灌云县| 绥德县| 华安县| 德州市| 广丰县| 福贡县| 宿州市| 闵行区| 叶城县| 改则县| 南乐县| 西宁市| 鄂伦春自治旗| 承德市| 沛县| 武川县| 海伦市| 兴城市| 随州市| 阜康市| 关岭| 广南县| 平果县| 景德镇市| 台州市| 南陵县| 二连浩特市| 锡林浩特市| 塘沽区| 江津市| 宜兴市| 锦屏县| 武宁县| 广南县| 南靖县| 保亭| 台东县| 方城县| 大渡口区| 镇沅| 汉阴县|