陳 諾 楊 興
(中國人民大學(xué) 法學(xué)院,北京 100872;廣東金融學(xué)院 法學(xué)院,廣東 廣州 510521)
在機(jī)器學(xué)習(xí)中,傳統(tǒng)的預(yù)先規(guī)劃操作流程被一種自主學(xué)習(xí)的機(jī)制替代,使得機(jī)器能夠從數(shù)據(jù)中自主學(xué)習(xí)和提取模式、規(guī)律和知識(shí)。與傳統(tǒng)的計(jì)算機(jī)學(xué)習(xí)不同,機(jī)器學(xué)習(xí)更加靈活和自主,不再需要人工干預(yù)來確定學(xué)習(xí)對(duì)象和特征,而是通過算法進(jìn)行自動(dòng)的特征選擇和模型構(gòu)建。①孫陽:《人工智能的合理使用之辯》,《海峽法學(xué)》2018年第3期。機(jī)器學(xué)習(xí)也具備自我完善和優(yōu)化的機(jī)制,通過不斷與環(huán)境進(jìn)行交互和反饋,機(jī)器能夠根據(jù)反饋信息自主調(diào)整和改進(jìn)自身的學(xué)習(xí)算法和模型,以適應(yīng)不斷變化的需求和環(huán)境。這種自我完善機(jī)制使得機(jī)器學(xué)習(xí)具備了持續(xù)學(xué)習(xí)和不斷演化的能力,能夠更好地適應(yīng)復(fù)雜和多變的任務(wù)和環(huán)境。②Sean Semmler and Zeeve Rose,“Artificial Intelligence,Application Today and Implications Tomorrow”,Duke Law& Technology Review,(2017):85.
機(jī)器學(xué)習(xí)概念涵蓋廣泛,學(xué)界、業(yè)界對(duì)其定義也不甚相同,本文所探討的機(jī)器學(xué)習(xí)是指推進(jìn)機(jī)器智能化活動(dòng)的關(guān)鍵支撐技術(shù),它從海量的數(shù)據(jù)中獲取新的知識(shí)或技能,同時(shí)完善自身功能。機(jī)器學(xué)習(xí)的過程包括廣泛地收集訓(xùn)練數(shù)據(jù),而后又通過“電子復(fù)制”的方式將它們輸入計(jì)算機(jī)系統(tǒng)中形成訓(xùn)練數(shù)據(jù)集,以便于對(duì)它們展開分析以及結(jié)果生成。近些年,人臉識(shí)別、語音識(shí)別、購物推薦、文本生成、健康醫(yī)療等領(lǐng)域背后無不是機(jī)器學(xué)習(xí)技術(shù)快速發(fā)展的身影。
與人類學(xué)習(xí)類似,機(jī)器學(xué)習(xí)也面臨學(xué)習(xí)材料以及學(xué)習(xí)資源的問題。模型的建立,還有進(jìn)一步的算法優(yōu)化都需要大量的作品作為訓(xùn)練資源,而這些資料中往往包括受著作權(quán)法保護(hù)的作品,包括文學(xué)、攝影、影視、美術(shù)、音樂以及計(jì)算機(jī)軟件等作品。如全球知名圖片提供商Getty Images 起訴熱門人工智能繪畫工具Stable Diffusion 的開發(fā)者Stability AI。Getty Images 聲稱Stability AI 未經(jīng)“許可”以及提供“補(bǔ)償”,復(fù)制了Getty Images數(shù)十億個(gè)文本和圖像用以訓(xùn)練模型,并對(duì)其進(jìn)行編碼和解碼,侵犯其復(fù)制權(quán)。并且Stability AI 在未經(jīng)Getty Images 授權(quán)的情況下復(fù)制Getty Images 的版權(quán)作品創(chuàng)作衍生作品,侵犯了美國著作權(quán)法①美國著作權(quán)法第106 節(jié)內(nèi)容規(guī)定了作者所享有的5 項(xiàng)權(quán)利,即復(fù)制權(quán)(right to reproduce)、發(fā)行權(quán)(right to distribute)、演繹權(quán)(right to prepare derivative works)、公開表演權(quán)(right to publicly perform)和展示權(quán)(right to display)。下作者的復(fù)制權(quán)、發(fā)行權(quán)、演繹權(quán)等權(quán)利。此外,還有三位藝術(shù)家對(duì)綜合藝術(shù)平臺(tái)DEVIANT ART 提起了訴訟。在起訴書中,原告認(rèn)為被告在可以獲得但沒有獲得原告的許可下,用原告的圖像訓(xùn)練人工智能或其他計(jì)算機(jī)程序、算法或其他功能預(yù)測引擎并創(chuàng)建基于該作品的衍生作品,侵犯了原告的復(fù)制、發(fā)行、傳播等權(quán)利。②Getty Images 訴Stable Diffusion 起訴狀,https://stablediffusionlitigation.com/pdf/00201/1-1-stable-diffusion-complaint.pdf,最后訪問時(shí)間:2023年11月11日。
目前在數(shù)據(jù)輸入活動(dòng)中常見的收集作品的方式為,通過“爬蟲協(xié)議”爬取網(wǎng)站數(shù)據(jù),未經(jīng)許可抓取數(shù)據(jù)庫數(shù)據(jù),或者未經(jīng)許可將作品數(shù)字化并形成數(shù)據(jù)集③劉友華、魏遠(yuǎn)山:《機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)問題及其解決》,《華東政法大學(xué)學(xué)報(bào)》2019年第2期。,在此過程中,可能涉及侵犯作品的復(fù)制權(quán),因?yàn)樽髌沸枰皇占头治?。這些收集的活動(dòng)往往涉及著作權(quán)人的“復(fù)制權(quán)”,同時(shí)在2020年的我國著作權(quán)法修改中,復(fù)制權(quán)中引入了“數(shù)字化”方式,導(dǎo)致了更多的作品收集行為可能被納入復(fù)制權(quán)的范疇。其次,在作品收集之后,需要對(duì)作品進(jìn)行加工、整理、匯編等操作。如果這些操作的結(jié)果構(gòu)成著作權(quán)法意義上的新作品,可能涉及侵犯改編權(quán)和匯編權(quán)。此外,如果需要將文字作品翻譯成不同的語言,可能涉及翻譯權(quán)的問題。最后,在生成與提供最后結(jié)果階段,公司需要通過互聯(lián)網(wǎng)傳輸數(shù)據(jù)或改編后的作品,或者將其上傳到云端。從著作權(quán)法的角度來看,這可能涉及侵犯向公眾傳播權(quán),包括信息網(wǎng)絡(luò)傳播權(quán)和廣播權(quán)??偠灾?,機(jī)器學(xué)習(xí)會(huì)無可避免地對(duì)數(shù)據(jù)進(jìn)行拷貝、翻譯、篡改、重新編寫等行為,可能涉及著作權(quán)人的復(fù)制、發(fā)行、演繹等權(quán)利,抑或是構(gòu)成了《中華人民共和國著作權(quán)法》第五十二、五十三條所規(guī)定的侵權(quán)行為,由此引發(fā)侵權(quán)爭議。
著作權(quán)法旨在鼓勵(lì)文學(xué)創(chuàng)作和傳承,給予著作權(quán)人相當(dāng)程度的專有權(quán)以鼓勵(lì)創(chuàng)作。而著作權(quán)人獲得的專有權(quán)和機(jī)器學(xué)習(xí)具有相當(dāng)程度的矛盾沖突。分析既有研究成果,可以發(fā)現(xiàn)當(dāng)前對(duì)于機(jī)器學(xué)習(xí)與著作權(quán)合理使用制度的討論存在兩個(gè)方面的問題。第一,對(duì)于機(jī)器學(xué)習(xí)使用作品的特點(diǎn)有所忽略,從而造成評(píng)價(jià)機(jī)器學(xué)習(xí)與保護(hù)著作權(quán)人權(quán)利沖突之間存在較大區(qū)別。第二,對(duì)于如何將機(jī)器學(xué)習(xí)中對(duì)作品的使用納入現(xiàn)行著作權(quán)法之中,是法定許可還是合理使用制度存在爭議?;谇笆鰡栴},本文希望借助機(jī)器學(xué)習(xí)使用作品的特點(diǎn)說明為何需要將其納入著作權(quán)限制與例外。同時(shí)本文將討論“法定許可”與“合理使用”的制度選擇不同,希望對(duì)保護(hù)著作權(quán)人的權(quán)利和促進(jìn)機(jī)器學(xué)習(xí)技術(shù)發(fā)展間的利益平衡有所助益。
首先需要明確的是,應(yīng)當(dāng)對(duì)機(jī)器學(xué)習(xí)使用作品這一行為進(jìn)行法律上的規(guī)制與處理,并且需要為機(jī)器學(xué)習(xí)創(chuàng)設(shè)著作權(quán)的限制與例外。目前機(jī)器學(xué)習(xí)與著作權(quán)的沖突體現(xiàn)在實(shí)踐中是著作權(quán)人與機(jī)器學(xué)習(xí)公司的矛盾,體現(xiàn)在法律上是著作權(quán)人的權(quán)利保護(hù)與促進(jìn)技術(shù)發(fā)展的矛盾。相對(duì)于人類有限的認(rèn)知能力,機(jī)器學(xué)習(xí)的能力是無限的。程序可以不斷地自我設(shè)定目標(biāo),實(shí)現(xiàn)成長進(jìn)化,于是機(jī)器通過學(xué)習(xí)具備了超越設(shè)計(jì)者本人的智能,也具備了在各個(gè)領(lǐng)域戰(zhàn)勝人類的實(shí)力。其不但可以識(shí)別人臉、文字、語音、場景,還可以理解語義、自主創(chuàng)作。但我國現(xiàn)行的著作權(quán)法卻更偏向于嚴(yán)格保護(hù)作品,并規(guī)定了版權(quán)使用者都需要為使用作品征得授權(quán)人的許可并支付報(bào)酬,否則作品就會(huì)陷入侵權(quán)的狀況。然而機(jī)器學(xué)習(xí)技術(shù)的研發(fā)者則需要有大量的訓(xùn)練數(shù)據(jù),按照目前我國著作權(quán)法的規(guī)定,研發(fā)人員如果使用受著作權(quán)法保護(hù)的作品,需要在獲取訓(xùn)練數(shù)據(jù)前征得著作權(quán)人許可。而如果研究公司未獲得授權(quán)或未提供報(bào)酬,依現(xiàn)行的司法規(guī)定,作品權(quán)利人可以向機(jī)器學(xué)習(xí)研發(fā)公司提起法律索賠,雖然每部作品的索賠費(fèi)用不一定都非常高昂,但這樣龐大的作品基數(shù)所產(chǎn)生的天價(jià)索賠也并非普通公司所能承擔(dān)的,更別提由此而產(chǎn)生的巨大司法成本和社會(huì)成本。
所以,現(xiàn)有知識(shí)產(chǎn)權(quán)法律體系有必要作出回應(yīng),以調(diào)適科技發(fā)展與著作權(quán)保護(hù)的矛盾,應(yīng)對(duì)新型科技挑戰(zhàn),平衡各方權(quán)益。接下來,本文將主要從機(jī)器學(xué)習(xí)特點(diǎn)三個(gè)方面,即低密度化、創(chuàng)造性強(qiáng)、算法偏見,考察論證應(yīng)當(dāng)為機(jī)器學(xué)習(xí)創(chuàng)設(shè)著作權(quán)的限制與例外。
機(jī)器學(xué)習(xí)利用作品的方式多種多樣,具體取決于應(yīng)用場景和任務(wù)要求。機(jī)器學(xué)習(xí)可以利用已有的作品數(shù)據(jù)來訓(xùn)練模型,從而對(duì)未知的作品進(jìn)行分類或預(yù)測。例如,根據(jù)文本內(nèi)容進(jìn)行情感分析,對(duì)音頻數(shù)據(jù)進(jìn)行語音識(shí)別,對(duì)圖像進(jìn)行目標(biāo)分類等。這種能力讓機(jī)器學(xué)習(xí)能夠在大規(guī)模作品數(shù)據(jù)中發(fā)現(xiàn)模式和趨勢,從而進(jìn)行準(zhǔn)確的分類和預(yù)測。同時(shí)機(jī)器學(xué)習(xí)可以從大量作品中提取有用的信息和摘要。通過對(duì)作品數(shù)據(jù)的分析和模擬,機(jī)器學(xué)習(xí)可以自動(dòng)提取關(guān)鍵詞、主題、摘要或總結(jié),從而幫助用戶快速了解和瀏覽大規(guī)模的作品內(nèi)容。機(jī)器學(xué)習(xí)也可以利用作品數(shù)據(jù)來評(píng)估模型的性能,并進(jìn)行優(yōu)化和改進(jìn)。通過對(duì)已有作品的分析和比較,機(jī)器學(xué)習(xí)可以衡量模型的準(zhǔn)確性、效率和創(chuàng)造性等指標(biāo),并幫助優(yōu)化模型的表現(xiàn)。總的來說,機(jī)器學(xué)習(xí)通過對(duì)作品數(shù)據(jù)的學(xué)習(xí)和分析,可以進(jìn)行分類、預(yù)測、生成、提取、總結(jié)、評(píng)估和改進(jìn)等多種操作,從而實(shí)現(xiàn)對(duì)作品的利用和增值。
但在機(jī)器學(xué)習(xí)中,數(shù)據(jù)的規(guī)模和多樣性對(duì)于取得良好的模型性能至關(guān)重要。對(duì)于機(jī)器學(xué)習(xí)公司而言,單個(gè)數(shù)據(jù)對(duì)其收益的貢獻(xiàn)微乎其微,只有通過收集大量作品數(shù)據(jù)并進(jìn)行大規(guī)模的分析和運(yùn)算,機(jī)器學(xué)習(xí)技術(shù)才能發(fā)揮其真正的作用。這種低密度化的特點(diǎn)要求機(jī)器學(xué)習(xí)公司采取全面的數(shù)據(jù)收集策略,包括數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注等環(huán)節(jié)。數(shù)據(jù)收集的過程可能涉及與不同數(shù)據(jù)來源的協(xié)商和合作,以確保數(shù)據(jù)的完整性和質(zhì)量。同時(shí),數(shù)據(jù)的規(guī)模也直接影響到機(jī)器學(xué)習(xí)算法的復(fù)雜性和模型訓(xùn)練的時(shí)間成本。較大規(guī)模的數(shù)據(jù)集可以提供更全面的樣本分布,以及更豐富的模式和特征信息,從而可以訓(xùn)練出更準(zhǔn)確的模型。除了數(shù)據(jù)規(guī)模,數(shù)據(jù)的多樣性也對(duì)機(jī)器學(xué)習(xí)的效果和創(chuàng)造力產(chǎn)生重要影響。多樣化的數(shù)據(jù)可以幫助機(jī)器學(xué)習(xí)模型更好地適應(yīng)不同場景和樣本,提升泛能力和創(chuàng)造潛力。只有通過收集和運(yùn)用海量作品,機(jī)器學(xué)習(xí)技術(shù)才能實(shí)現(xiàn)其真正的潛力。
著作權(quán)法的主要目的是保護(hù)原創(chuàng)作品的創(chuàng)作者并鼓勵(lì)他們進(jìn)行創(chuàng)作。它賦予作品的創(chuàng)作者一定的權(quán)利,例如復(fù)制、分發(fā)、展示和修改作品的權(quán)利。這些權(quán)利在一定程度上鼓勵(lì)了創(chuàng)作者進(jìn)行創(chuàng)新和創(chuàng)造性的表達(dá)。機(jī)器學(xué)習(xí)作為一種創(chuàng)作工具或輔助工具,可以通過分析和處理大量數(shù)據(jù)生成新的作品,從這個(gè)角度來說,機(jī)器學(xué)習(xí)與著作權(quán)法的目的是一致的,都是為了鼓勵(lì)創(chuàng)作。
同時(shí),創(chuàng)造活動(dòng)是一種推陳出新的歷史過程,新的創(chuàng)作活動(dòng)往往受益于前人的啟迪。到了今天,學(xué)習(xí)主體發(fā)生了變化,但不可辯爭的是,機(jī)器學(xué)習(xí)的能力也是人類智慧發(fā)展的延續(xù)和輔助。近些年來機(jī)器學(xué)習(xí)所呈現(xiàn)出的巨大潛力超乎想象,其不僅可以在分析輸入作品的基礎(chǔ)之上進(jìn)行創(chuàng)作,也可以超越人類的智慧,發(fā)現(xiàn)作品的規(guī)律并進(jìn)行創(chuàng)作。如果說監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)是在人的智能引導(dǎo)下進(jìn)行模型的訓(xùn)練,無監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)則是在去除分類、標(biāo)簽的要求后,就能夠直接根據(jù)所標(biāo)注的數(shù)據(jù)進(jìn)行訓(xùn)練,進(jìn)而自主地確定在數(shù)據(jù)集中出現(xiàn)的規(guī)則,與人進(jìn)行創(chuàng)作無異。機(jī)器本身也成為創(chuàng)作的主體,成為輔助人類創(chuàng)作的重要工具,這與著作權(quán)法鼓勵(lì)創(chuàng)新創(chuàng)作的目的也一致,同時(shí)也就要求法律為其提供相應(yīng)的保障。
機(jī)器學(xué)習(xí)算法通常通過大量的數(shù)據(jù)進(jìn)行訓(xùn)練,以學(xué)習(xí)數(shù)據(jù)中的模式和規(guī)律。然而,如果訓(xùn)練數(shù)據(jù)本身具有偏見或不完整,那么算法生成的結(jié)果也可能具有相應(yīng)的偏見。例如,一個(gè)以男性為主的訓(xùn)練數(shù)據(jù)集可能會(huì)導(dǎo)致算法在生成結(jié)果時(shí)偏向于男性的觀點(diǎn)和偏好,而忽略女性的需求和權(quán)益。同時(shí)如果數(shù)據(jù)采樣方式不具有代表性,或者存在一些系統(tǒng)性的偏差,那么算法在訓(xùn)練過程中可能會(huì)受到這些偏見的影響。例如,在音樂創(chuàng)作領(lǐng)域,如果數(shù)據(jù)采樣傾向于某一地區(qū)的音樂,那么音樂風(fēng)格便會(huì)受到限制。
機(jī)器學(xué)習(xí)技術(shù)目前面臨的一大瓶頸便是數(shù)據(jù)的質(zhì)量不高以及如何解決算法偏見的問題。如果訓(xùn)練數(shù)據(jù)不充分或者帶有偏見,那么機(jī)器學(xué)習(xí)會(huì)加劇這種片面所帶來的問題。由此可見,數(shù)據(jù)質(zhì)量的好壞直接關(guān)系人工智能作品的好壞。正如前文已述,在獲取優(yōu)秀作品數(shù)據(jù)集方面,著作權(quán)制度的限制可能導(dǎo)致幾個(gè)問題。首先,由于著作權(quán)保護(hù),許多優(yōu)秀的作品可能無法被自由獲取和使用,這使得構(gòu)建全面、豐富的數(shù)據(jù)集變得困難。其次,由于數(shù)據(jù)集的構(gòu)建往往需要多個(gè)作品的整合,涉及多個(gè)著作權(quán)人的許可和合作,這也加大了收集作品的復(fù)雜度和法律風(fēng)險(xiǎn)。進(jìn)而使得人工智能開發(fā)者必須采用“法律限制較少但帶有偏見的數(shù)據(jù)集”來訓(xùn)練,這也是造成作者計(jì)算結(jié)果具有偏見的主要原因。①Amanda Levendowski,“How Copyright Law Can Fix‘Artificial Intelligence’s Implicit Bias Problem,”Washington Law Review,(2018):589.所以高質(zhì)量的訓(xùn)練數(shù)據(jù)集可以很大程度影響機(jī)器學(xué)習(xí)的效果,減少算法偏見。
隨著新技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)涉及的流程可能越來越復(fù)雜,牽涉的行為也越來越多,傳統(tǒng)的單項(xiàng)行為進(jìn)一步復(fù)雜化,成為具有更多流程的行為。在數(shù)據(jù)輸入、創(chuàng)建數(shù)據(jù)集以及訓(xùn)練數(shù)據(jù)的過程中,涉及的第三方著作權(quán)也會(huì)增多。從上述討論中,我們可以看到,為機(jī)器學(xué)習(xí)創(chuàng)設(shè)著作權(quán)的例外是機(jī)器學(xué)習(xí)特點(diǎn)所決定的,接下來我們應(yīng)當(dāng)討論如何設(shè)計(jì)該項(xiàng)著作權(quán)的例外。
在現(xiàn)代社會(huì)中,因?yàn)榇嬖谥鳈?quán)約束與反約束等現(xiàn)象,以及存在著創(chuàng)作者、使用者雙方在行使權(quán)利中一定的程序沖突,為促進(jìn)文學(xué)藝術(shù)事業(yè)發(fā)展、保障作者及其他主體權(quán)利、促進(jìn)社會(huì)公平,就必須統(tǒng)籌兼顧,平衡并協(xié)調(diào)一切可能彼此沖突的因素。通過比較不同的機(jī)器學(xué)習(xí)使用作品集的風(fēng)險(xiǎn)化解路徑,我們才能夠推動(dòng)機(jī)器學(xué)習(xí)技術(shù)的進(jìn)展,并使之對(duì)著作權(quán)人的影響減至最低。
現(xiàn)行著作權(quán)法框架下,有三種使用尚在保護(hù)期內(nèi)的作品的合法途徑,包括授權(quán)許可、法定許可與合理使用。針對(duì)這三種制度,為應(yīng)對(duì)機(jī)器學(xué)習(xí)使用作品的需求,學(xué)者們有不同的選擇取向,并且每位學(xué)者對(duì)一種制度所能涵蓋的機(jī)器學(xué)習(xí)具體范圍給出了自己的定義。有學(xué)者認(rèn)為機(jī)器學(xué)習(xí)去收集分散的權(quán)利成本過于高昂,因此應(yīng)當(dāng)允許機(jī)器學(xué)習(xí)援引著作權(quán)合理使用制度。有學(xué)者僅僅支持將為科學(xué)研究目的而進(jìn)行的文本與數(shù)據(jù)挖掘的機(jī)器學(xué)習(xí)行為納入合理使用制度。①張惠彬、肖啟賢:《人工智能時(shí)代文本與數(shù)據(jù)挖掘的版權(quán)豁免規(guī)則建構(gòu)》,《科技與法律(中英文)》2021 年第6期。有學(xué)者主張借鑒美國版權(quán)法體系下靈活、開放的合理使用制度②林秀芹:《人工智能時(shí)代著作權(quán)合理使用制度的重塑》,《法學(xué)研究》2021年第6期。,以應(yīng)對(duì)未來可能出現(xiàn)的新技術(shù),根據(jù)個(gè)案判斷是否構(gòu)成合理使用。宣喆提議,在不排斥商業(yè)化合理使用目的基礎(chǔ)上,開展對(duì)人工智能創(chuàng)意知識(shí)產(chǎn)權(quán)領(lǐng)域內(nèi)合理使用的制度構(gòu)建。③宣喆:《論分類保護(hù)視角下人工智能創(chuàng)作的著作權(quán)合理使用》,《出版發(fā)行研究》2022年第3期。另一部分學(xué)者從最大程度保護(hù)著作權(quán)人的角度提出應(yīng)當(dāng)用“法定許可制度”滿足機(jī)器學(xué)習(xí)使用作品的需要。即機(jī)器學(xué)習(xí)系統(tǒng)沒有產(chǎn)生新的版權(quán)作品,只是用了數(shù)據(jù)集來訓(xùn)練技術(shù),不夠具有轉(zhuǎn)化性。并且機(jī)器學(xué)習(xí)的過程中復(fù)制了作品,因而侵犯了著作權(quán)人的專有權(quán),對(duì)于版權(quán)作品的復(fù)制不能認(rèn)為構(gòu)成著作權(quán)合理使用制度,應(yīng)當(dāng)采取“法定許可”的解決之道④高陽、胡丹陽:《機(jī)器學(xué)習(xí)對(duì)著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對(duì)》,《電子知識(shí)產(chǎn)權(quán)》2020年第10期。。此外,也有意見認(rèn)為通過成品征收補(bǔ)償金制度可以解決機(jī)器學(xué)習(xí)與作品保護(hù)制度之間的矛盾問題。⑤高陽、胡丹陽:《機(jī)器學(xué)習(xí)對(duì)著作權(quán)合理使用制度的挑戰(zhàn)與應(yīng)對(duì)》,《電子知識(shí)產(chǎn)權(quán)》2020年第10期。可以總結(jié)得出:部分學(xué)者認(rèn)為機(jī)器學(xué)習(xí)的過程侵犯了著作權(quán)人專有權(quán),應(yīng)當(dāng)通過法定許可制度保護(hù)著作權(quán)人的利益;部分學(xué)者認(rèn)為把機(jī)器學(xué)習(xí)納入合理使用制度將幫助技術(shù)自由發(fā)展,同時(shí)也滿足著作權(quán)法中鼓勵(lì)創(chuàng)新的目的。而由于機(jī)器學(xué)習(xí)使用作品的低密度化以及部分作品無權(quán)利主體等特點(diǎn),授權(quán)許可無法實(shí)現(xiàn)。
筆者認(rèn)為,從制度角度來看,法定許可與合理使用通常都被視為對(duì)著作權(quán)的限制。其區(qū)別可總結(jié)為,合理使用既無須征求著作權(quán)人同意,也無須支付著作權(quán)人相應(yīng)報(bào)酬,而法定許可使用則雖無須征求著作權(quán)人同意,但需要支付著作權(quán)人相應(yīng)報(bào)酬。所以接下來本文將討論機(jī)器學(xué)習(xí)對(duì)著作權(quán)人產(chǎn)生的影響以及是否需要對(duì)著作權(quán)人進(jìn)行補(bǔ)償,從而確定選擇合理使用制度還是法定許可制度。
機(jī)器學(xué)習(xí)能夠運(yùn)用的領(lǐng)域包括如音樂生成、文本生成、圖像生成這些容易引起著作權(quán)人反感的表達(dá)型領(lǐng)域,以及在圖像識(shí)別、論文查重、代碼錯(cuò)誤識(shí)別等非表達(dá)型領(lǐng)域。目前已有的討論大多為非表達(dá)型的機(jī)器學(xué)習(xí)做出了肯定的答案,即構(gòu)成轉(zhuǎn)換性的合理使用,但對(duì)于表達(dá)型領(lǐng)域的機(jī)器學(xué)習(xí),還暫時(shí)沒有定論。接下來本文將主要針對(duì)表達(dá)型領(lǐng)域的機(jī)器學(xué)習(xí)對(duì)著作權(quán)人的影響進(jìn)行深入討論。
過去的文獻(xiàn)認(rèn)為表達(dá)型的機(jī)器學(xué)習(xí)使用作品將無需經(jīng)過版權(quán)人的授權(quán),也無需向版權(quán)人付費(fèi),將使得版權(quán)人無法控制對(duì)自己作品的使用。機(jī)器學(xué)習(xí)基于原作品獨(dú)創(chuàng)性表達(dá)生成的新創(chuàng)作物有可能取代原作品,侵占原作品版權(quán)人的市場,對(duì)著作權(quán)人造成負(fù)面影響。在判斷是否會(huì)對(duì)著作權(quán)人產(chǎn)生影響時(shí),中國部分法院曾嘗試在維持合理使用制度必要限度的前提下,對(duì)著作權(quán)侵權(quán)糾紛中合理使用的抗辯理由進(jìn)行適當(dāng)?shù)膹椥哉J(rèn)定,適當(dāng)考慮利用行為的目的、所利用部分與整體在數(shù)量上的比例、被利用作品的性質(zhì)、對(duì)潛在市場的影響等要素。這主要借鑒了美國的四要素檢測法,本文也將重點(diǎn)考察機(jī)器學(xué)習(xí)利用行為的目的以及被告對(duì)潛在市場的影響以及機(jī)器學(xué)習(xí)特點(diǎn),并將考察結(jié)果用于分析表達(dá)型機(jī)器學(xué)習(xí)對(duì)于著作權(quán)人的影響以及是否應(yīng)當(dāng)對(duì)著作權(quán)人進(jìn)行補(bǔ)償。
首先是機(jī)器學(xué)習(xí)利用行為的目的。有學(xué)者認(rèn)為商業(yè)目的有時(shí)會(huì)弱化合理使用的色彩,但鑒于商業(yè)機(jī)構(gòu)所能真正承擔(dān)相關(guān)數(shù)據(jù)挖掘成本的強(qiáng)大實(shí)力,和目前科研機(jī)構(gòu)與商業(yè)機(jī)構(gòu)合作開發(fā)的趨勢,商業(yè)目的在評(píng)定合理使用目的的正當(dāng)與否所持比重較小。是否是具有生產(chǎn)性或者不同于原來的使用目的和方式、是否提供額外價(jià)值,才是用來評(píng)價(jià)機(jī)器學(xué)習(xí)使用目的正當(dāng)更為重要的標(biāo)準(zhǔn)。美國法院認(rèn)為,判斷某種情況是否構(gòu)成合理使用的一個(gè)標(biāo)準(zhǔn)是:是否構(gòu)成轉(zhuǎn)換性使用。在此種情況下,合理使用的其他要素考慮占比將會(huì)降低。這種轉(zhuǎn)換性體現(xiàn)在新創(chuàng)作的作品是否在原作品的基礎(chǔ)上,以具有創(chuàng)造性的或者不同的特征來優(yōu)化原作品的表達(dá)、內(nèi)容和信息。在我國司法實(shí)踐中,也存在借鑒創(chuàng)新性轉(zhuǎn)化來判斷合理使用行為。在王某與北京谷某信息技術(shù)有限公司案中,法院認(rèn)為被告通過片段的方式展現(xiàn)圖書,是為了提供相關(guān)圖書檢索服務(wù)以及便利用戶。該種服務(wù)區(qū)別于平時(shí)的服務(wù),是一種轉(zhuǎn)換性的使用,因而不構(gòu)成侵權(quán)。由此可見,轉(zhuǎn)換性規(guī)則的運(yùn)用,可以解決商業(yè)性使用作品的行為能否構(gòu)成合理使用之難題。以Chatgpt 為例,在訓(xùn)練其系統(tǒng)時(shí),作品的中間復(fù)制是“非表達(dá)性的”。最終過程的目的是創(chuàng)造一個(gè)有用的生成式人工智能系統(tǒng),這與人類消費(fèi)作品時(shí)的目的有很大的不同,機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練顯然是具有高度變革性的。可以說Chatgpt 以其文本創(chuàng)造性輸出的方式改變了原作,所以不應(yīng)當(dāng)被認(rèn)為是侵犯了原著作權(quán)人權(quán)利。
其次是對(duì)著作權(quán)人潛在市場的影響。一個(gè)典型的案例便是機(jī)器翻譯與翻譯作品、譯者語料之間可能存在的著作權(quán)沖突以及相互市場的影響。目前機(jī)器翻譯通過不斷提升優(yōu)化自身的底層技術(shù),從原來的主要采用詞典翻譯和規(guī)則翻譯,到利用大規(guī)模的語料庫和統(tǒng)計(jì)算法進(jìn)行翻譯,到目前神經(jīng)網(wǎng)絡(luò)翻譯階段,利用深度學(xué)習(xí)算法進(jìn)行翻譯。機(jī)器翻譯的質(zhì)量伴隨著技術(shù)的發(fā)展不斷提升,機(jī)器翻譯把譯者從機(jī)械、枯燥的翻譯工作中解放出來,讓譯者從事更富有創(chuàng)造性的工作。從這個(gè)角度可以說,機(jī)器學(xué)習(xí)非但沒有搶占原著作權(quán)人的市場,著作權(quán)人反而可以受益于機(jī)器學(xué)習(xí)相關(guān)技術(shù)的進(jìn)步,在基礎(chǔ)的工作中節(jié)省精力,提升自己的效率。
最后,為機(jī)器學(xué)習(xí)創(chuàng)立合理使用類型并非對(duì)著作權(quán)人毫無保護(hù)。今天的大多數(shù)版權(quán)侵權(quán)分析也內(nèi)含對(duì)機(jī)器學(xué)習(xí)技術(shù)的分析。比如YouTube 的侵權(quán)比對(duì)系統(tǒng),YouTube 允許版權(quán)所有者向YouTube的內(nèi)容ID 系統(tǒng)提交作品。當(dāng)一件作品被上傳到Y(jié)ouTube 時(shí),它將與內(nèi)容ID 數(shù)據(jù)庫進(jìn)行比較,如果該過程中使用作品,分析作品的行為被認(rèn)定為侵權(quán),將不利于保護(hù)著作權(quán)人的權(quán)益。
同時(shí),機(jī)器學(xué)習(xí)最大的特征是需要使用海量的作品。支付單件作品的成本或許不高,但海量作品累積起來所形成的作品使用費(fèi)卻很高昂,由此導(dǎo)致機(jī)器學(xué)習(xí)的成本巨大。支付高額的作品許可使用費(fèi)所增加的成本最終也會(huì)反映到產(chǎn)品的售價(jià)上來。目前的機(jī)器學(xué)習(xí)技術(shù)尚處在發(fā)展初期,專業(yè)的作品授權(quán)市場還沒有建立,事先取得授權(quán)的方式存在交易成本昂貴且無法有效消解偏見的問題。雖然法定許可制度能夠在一定程度上保障著作人的權(quán)益,但其后續(xù)配套措施的落地還面臨一定的困難,法定許可中的報(bào)酬的分配也是個(gè)困難的工作,有效執(zhí)行也面臨非常大的阻礙。①劉友華、魏遠(yuǎn)山:《機(jī)器學(xué)習(xí)的著作權(quán)侵權(quán)問題及其解決》,《華東政法大學(xué)學(xué)報(bào)》2019年第2期。
正如前面所述,機(jī)器學(xué)習(xí)的低密度的特點(diǎn)給著作權(quán)的傳統(tǒng)許可方式帶來了巨大挑戰(zhàn):法定許可的最大缺陷在于其無法解決市場失靈問題,同時(shí)法定許可因其仍需要與著作權(quán)人協(xié)商許可費(fèi),從根本上無法達(dá)到提升機(jī)器學(xué)習(xí)效率的目的。反觀合理使用制度,其可以消弭因市場失靈而出現(xiàn)的著作權(quán)人與作品使用者之間為了版權(quán)作品的使用進(jìn)行協(xié)商的時(shí)刻。減少交易費(fèi)用,提供經(jīng)濟(jì)學(xué)上合理性的解釋。在沒有合理使用的前提下,使用著作權(quán)人的作品將受到一定限制,而此時(shí)引入合理使用規(guī)則就能夠從最大程度上解決交易成本過高的問題。在這一過程中,整個(gè)市場在著作權(quán)作品上的資源分配與共享也獲得了實(shí)現(xiàn),也避免了訴訟爆炸及嚴(yán)重遏制機(jī)器學(xué)習(xí)科技進(jìn)步的情況。①王文敏:《人工智能對(duì)著作權(quán)限制與例外規(guī)則的挑戰(zhàn)與應(yīng)對(duì)》,《法律適用》2022年第11期。因此,相比于法定許可制度,合理使用制度更加適合為機(jī)器學(xué)習(xí)提供合法性依據(jù),使用方式得當(dāng)也不會(huì)損害著作權(quán)人的權(quán)利。
為機(jī)器學(xué)習(xí)創(chuàng)設(shè)合理使用類型并非代表著對(duì)所有機(jī)器學(xué)習(xí)使用情形都予以保護(hù)。目前我國立法仍然會(huì)從三步檢驗(yàn)法以及司法解釋的角度保護(hù)著作權(quán)人的合法權(quán)益。從立法角度來看,考慮到我國著作權(quán)法短時(shí)間內(nèi)修改的可能性較小,如果需要為機(jī)器學(xué)習(xí)創(chuàng)設(shè)著作權(quán)法中的特例,則需要對(duì)《計(jì)算機(jī)軟件保護(hù)條例》《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》和《著作權(quán)法實(shí)施條例》等法律文件進(jìn)行修改來增設(shè)權(quán)利類型。因此,在修改《著作權(quán)法實(shí)施條例》時(shí)引入專門的機(jī)器學(xué)習(xí)例外條款是最好的解決辦法。修改立法也有助于司法機(jī)關(guān)對(duì)機(jī)器學(xué)習(xí)樹立明確的態(tài)度,最大程度促進(jìn)技術(shù)的發(fā)展?!吨鳈?quán)法實(shí)施條例》是行政法規(guī),如果在其修訂草案中明確增設(shè)機(jī)器學(xué)習(xí)的合理使用情形,將有利于保障著作權(quán)例外情形下的穩(wěn)定性。通過為機(jī)器學(xué)習(xí)制定新的行政立法,來達(dá)到合理或適當(dāng)使用以增進(jìn)社會(huì)利益的目的,沒有超越著作權(quán)人能夠預(yù)見的情形。
值得注意的是合理使用制度是一種對(duì)抗專有權(quán)利的制度,允許使用者在滿足條件的情況下對(duì)受版權(quán)保護(hù)的作品進(jìn)行復(fù)制、傳播等形式的利用,但并不為使用者提供免費(fèi)獲取作品的渠道。在歐盟國家和英國的版權(quán)例外規(guī)定中,也將“合法獲取”作為適用要件之一,以確保相關(guān)數(shù)據(jù)庫擁有合法訪問權(quán)限。②萬勇:《人工智能時(shí)代著作權(quán)法合理使用制度的困境與出路》,《社會(huì)科學(xué)輯刊》2021年第5期。我國立法時(shí)也應(yīng)該引入“合法獲取”作為機(jī)器學(xué)習(xí)合理使用的要件。這樣做可以確保使用者在進(jìn)行復(fù)制、傳播和利用數(shù)據(jù)時(shí)具備合法獲取這些數(shù)據(jù)的前提。
同時(shí),我國著作權(quán)法第二十四條明確規(guī)定,合理使用范圍內(nèi),不得影響該作品的正常使用,不得不合理地?fù)p害著作權(quán)人的合法權(quán)益。即使將機(jī)器學(xué)習(xí)納入著作權(quán)合理使用的范圍,也需要通過三步檢驗(yàn)法對(duì)技術(shù)公司使用作品的行為進(jìn)行判斷,以避免對(duì)著作權(quán)人造成損害。將機(jī)器學(xué)習(xí)納入著作權(quán)合理使用的范圍仍然需要判斷該種使用行為是否對(duì)著作權(quán)人造成了經(jīng)濟(jì)利益損害,產(chǎn)生了替代性的結(jié)果,繼而判斷使用作品行為是否構(gòu)成合理使用。將機(jī)器學(xué)習(xí)技術(shù)納入合理使用范圍并不是意味著技術(shù)可以不加限制地侵害著作權(quán)人的利益,而是需要根據(jù)具體個(gè)案考察對(duì)于原著作權(quán)人的影響。
同時(shí)為應(yīng)對(duì)實(shí)踐的需要,目前也需要考慮從法律解釋的角度入手,盡量將部分情形納入現(xiàn)有的合理使用立法文本之內(nèi)。例如從我國著作權(quán)法中關(guān)于合理使用的法律、行政法規(guī)中規(guī)定“其他情形”進(jìn)行詞義空間的擴(kuò)大,從而使機(jī)器學(xué)習(xí)“有法可依”。
目前我國著作權(quán)法第二十四條列舉的“合理使用”的情形中,并沒有明文規(guī)定機(jī)器學(xué)習(xí)這一項(xiàng),所以機(jī)器學(xué)習(xí)不能直接適用知識(shí)產(chǎn)權(quán)的例外規(guī)定。按照我國目前對(duì)著作權(quán)法第二十四條第(一)項(xiàng)的規(guī)定,“合理使用”制度主體要件為“個(gè)人學(xué)習(xí)、研究”。但機(jī)器學(xué)習(xí)的主體通常為公司。如果是公司的科研人員,其機(jī)器學(xué)習(xí)行為也很難僅限于“學(xué)習(xí)、研究”等非商業(yè)目的。但是如果通過對(duì)營利性主體所進(jìn)行的“科研”做擴(kuò)大解釋,可能可以作為機(jī)器學(xué)習(xí)中的作品使用行為應(yīng)急之策。如若部分使用機(jī)器學(xué)習(xí)的公司提供了基礎(chǔ)性技術(shù),如通過人臉識(shí)別技術(shù)為安全、國防等領(lǐng)域提供保障,可以作為其進(jìn)行人臉學(xué)習(xí)研究的合法性依據(jù)。
同時(shí)根據(jù)我國目前的《著作權(quán)法》第二十四條第(二)項(xiàng)的規(guī)定,“為介紹評(píng)論某一作品或者說明某一問題,在作品中適當(dāng)引用他人已經(jīng)發(fā)表的作品”,可以不經(jīng)著作權(quán)人許可亦無須支付報(bào)酬。根據(jù)法條文本內(nèi)容,機(jī)器學(xué)習(xí)使用數(shù)據(jù)的目的如果是評(píng)論與說明,可以考慮通過此條為自身行為提供合法依據(jù)。但在機(jī)器學(xué)習(xí)中使用數(shù)據(jù)時(shí),需要遵守“適當(dāng)引用”的原則,即對(duì)于已有作品的使用必須符合一定的適當(dāng)性要件,避免對(duì)著作權(quán)人的利益造成損害。適當(dāng)引用的要求包括以下幾個(gè)方面。首先,被引用部分不能構(gòu)成被引作品的主要部分或?qū)嵸|(zhì)部分,即引用作品與被引作品應(yīng)具有明顯的區(qū)別。這是為了確保引用作品不成為作品的“競爭者”,對(duì)著作權(quán)人的創(chuàng)作權(quán)益產(chǎn)生不利影響。其次,引用的數(shù)量應(yīng)適度,不能超過合理的范圍。這意味著在機(jī)器學(xué)習(xí)中使用數(shù)據(jù)時(shí),需要適度地引用著作權(quán)作品的內(nèi)容,以避免超過適當(dāng)?shù)囊梅秶W詈?,引用的方式和目的?yīng)當(dāng)符合合理的學(xué)術(shù)研究或創(chuàng)新需求,而不是為了商業(yè)化或直接替代原作品。
同時(shí)我國著作權(quán)法第二十四條第(六)項(xiàng)和第(八)項(xiàng)規(guī)定,以科學(xué)技術(shù)發(fā)展或是以文化遺產(chǎn)機(jī)構(gòu)收藏為目的而利用作品的行為,都可能具有對(duì)計(jì)算機(jī)學(xué)習(xí)技術(shù)適用“合理使用”的余地。該情況下的科研機(jī)構(gòu)如若也使用機(jī)器學(xué)習(xí)技術(shù),可以從該角度為其提供合法依據(jù)。
機(jī)器學(xué)習(xí)使用作品的情形也可以在滿足三步檢驗(yàn)法的角度下被解釋為合理使用的情形。司法實(shí)踐可以對(duì)我國著作權(quán)法第二十四條“法律、行政法規(guī)規(guī)定”等相關(guān)規(guī)定作出整體性解釋。使之不僅包括法律規(guī)定合理使用情況下的具體條款,也包括在法律規(guī)范功能原則下的規(guī)定應(yīng)符合國際公約中的“特定、特殊情形”的具體條款。事實(shí)上,我國司法實(shí)踐早已突破了上述三步檢驗(yàn)法的第一個(gè)環(huán)節(jié)中的限制,將部分行為視為合理使用,比如出于教學(xué)目的拍攝電影、為拍賣目的展示圖冊(cè),以及網(wǎng)頁“快照”的使用行為。如若立法無法及時(shí)滿足實(shí)踐的需要,則可以考慮從法律解釋的角度入手,盡量將部分情形納入現(xiàn)有的合理使用立法文本之內(nèi),借此為合理使用制度創(chuàng)造更多空間。
既然目前的技術(shù)發(fā)展和現(xiàn)有的法律制度存在沖突,為保障技術(shù)發(fā)展以及法律的適應(yīng)性,我們討論當(dāng)前話題仍然是有意義的。本文在第一部分明確了目前著作權(quán)法、著作權(quán)人與利用作品進(jìn)行機(jī)器學(xué)習(xí)的科技公司主體之間的矛盾,在第二部分通過探討是否應(yīng)當(dāng)通過著作權(quán)例外來解決此矛盾,以及在第三部分探討具體運(yùn)用著作權(quán)哪一種例外解決矛盾,并分析了不同手段可能帶來的潛在優(yōu)勢與劣勢,以及為機(jī)器學(xué)習(xí)設(shè)定合理使用類型和司法解釋如何為機(jī)器學(xué)習(xí)掃平障礙進(jìn)行了說明。
從域外的立法情況來看,為了便利機(jī)器學(xué)習(xí)和運(yùn)用大數(shù)據(jù)分析,多國政府也曾多次修訂了其著作權(quán)法。比如日本在2018 年修訂著作權(quán)法后,將機(jī)器利用信息的研究領(lǐng)域范圍從“計(jì)算機(jī)信息分析”拓展為所有“提供新的知識(shí)和信息”領(lǐng)域。修訂后的法規(guī)擴(kuò)大了侵權(quán)豁免的商業(yè)行為范圍,為盈利性活動(dòng)也留下了適當(dāng)空間。另外,為減少上面所列出的條款帶來的法律使用空間僵化,日本引入了柔性合理使用條款,具體為:日本著作權(quán)法第30 條之四非享受性使用條款、第47 條之四計(jì)算機(jī)附隨性使用條款以及第47 條之五信息處理輕微利用條款。①鄭重:《日本著作權(quán)法柔性合理使用條款及其啟示》,《知識(shí)產(chǎn)權(quán)》2022年第1期。2014 年的英國版權(quán)法、2016 年的法國著作權(quán)法、2017 年的意大利著作權(quán)法都規(guī)定可以對(duì)版權(quán)產(chǎn)品實(shí)施復(fù)制,雖然僅限于非商業(yè)性的研究目的。2016 年歐盟委員會(huì)制定的版權(quán)指令草案,明確了文本數(shù)據(jù)保存、挖掘方面的版權(quán)例外,適用對(duì)象主要是社會(huì)公益組織和科研機(jī)構(gòu),以非商業(yè)性目的作為潛在語境,也體現(xiàn)出了歐洲各國對(duì)謹(jǐn)慎立法的態(tài)度。2019 年,由歐盟委員會(huì)所制定的《單一數(shù)字市場版權(quán)指令》(Directive on Copyright in the Digital Singles Market,下稱《DSM 指令》)采取分類處理的辦法,即例外情形區(qū)分以科學(xué)研究為目的的文本與數(shù)據(jù)挖掘和不限目的的文本與數(shù)據(jù)挖掘?!禗SM 指令》為科學(xué)研究中的文本與數(shù)據(jù)挖掘提供了更大的自由度。①張惠彬、肖啟賢:《人工智能時(shí)代文本與數(shù)據(jù)挖掘的版權(quán)豁免規(guī)則建構(gòu)》,《科技與法律(中英文)》2021 年第6期。美國的最高法院也有裁決,認(rèn)為利用作品、使用數(shù)據(jù)的行為一旦能夠取得相應(yīng)的社會(huì)公益效果,能夠經(jīng)由合理使用而得以規(guī)范。②張潤、李勁松:《利益平衡視角下人工智能編創(chuàng)使用行為的法律定性與保護(hù)路徑研究》,《出版發(fā)行研究》2020 年11期。我們看到各國從“文本挖掘”,到“文本與數(shù)據(jù)挖掘”再到“提供新的知識(shí)和信息”,法律所允許的機(jī)器學(xué)習(xí)的材料與范圍在不斷擴(kuò)大,除文本外,藝術(shù)作品也逐漸成為機(jī)器學(xué)習(xí)的內(nèi)容,未來有可能涵蓋更多的作品類型。
盡管各國立法目前對(duì)于機(jī)器學(xué)習(xí)自由使用作品都較為保守,但各國對(duì)于著作權(quán)例外可能帶來的價(jià)值是有所認(rèn)識(shí)的,這就體現(xiàn)在前述不斷修改的立法中。同時(shí)各國也認(rèn)識(shí)到,機(jī)器學(xué)習(xí)技術(shù)所蘊(yùn)含的重大社會(huì)意義,可以利用該項(xiàng)技術(shù)為國家經(jīng)濟(jì)與社會(huì)的發(fā)展服務(wù),例如歐洲經(jīng)濟(jì)委員會(huì)曾表示:“伴隨著數(shù)字革命,機(jī)器學(xué)習(xí)已經(jīng)成為日常生活的一部分。目前數(shù)據(jù)體量的不斷擴(kuò)大,以及機(jī)器學(xué)習(xí)對(duì)于數(shù)據(jù)的依賴更深,對(duì)于數(shù)據(jù)廣度的要求也不斷加深?!雹勐?lián)合國歐洲經(jīng)濟(jì)委員會(huì):機(jī)器學(xué)習(xí)為生成現(xiàn)代、高效的統(tǒng)計(jì)數(shù)據(jù)鋪平道路,https://news.un.org/zh/story/2021/04/1082222,最后訪問時(shí)間:2023年11月11日。這也說明機(jī)器學(xué)習(xí)的應(yīng)用的確為社會(huì)發(fā)展帶來了機(jī)遇。柏林一家智庫墨卡托中國研究所的政治學(xué)家Kristin Shi-Kupfer表示,如果中國不能在機(jī)器學(xué)習(xí)方面取得真正的突破性研究進(jìn)展,中國在人工智能領(lǐng)域很難取得突破性成果。④Sarah O'Meara:《中國的人工智能是否會(huì)在2030年領(lǐng)先世界》,https://news.sisuer.cn/wp-content/uploads/2020/06/Will-China-lead-the-world-in-AI-by-2030.pdf,最后訪問時(shí)間:2023年11月11日。這也從側(cè)面說明機(jī)器學(xué)習(xí)可以為各個(gè)領(lǐng)域的發(fā)展提供強(qiáng)大的數(shù)據(jù)分析和模式識(shí)別能力,有助于挖掘和利用海量數(shù)據(jù)中有價(jià)值的信息,推動(dòng)科學(xué)研究和創(chuàng)新發(fā)展,如果中國重視機(jī)器學(xué)習(xí)技術(shù),就將對(duì)中國人工智能領(lǐng)域起到積極推動(dòng)作用。
可以設(shè)想,在中國機(jī)器學(xué)習(xí)科技高速成長的時(shí)期,我國法學(xué)界終將無法避免對(duì)機(jī)器學(xué)習(xí)的拷貝作品、分析作品、輸出表達(dá)等活動(dòng)進(jìn)行價(jià)值評(píng)判。如果認(rèn)為機(jī)器學(xué)習(xí)不構(gòu)成合理使用,就會(huì)導(dǎo)致很多正在開展人工智能研究項(xiàng)目的個(gè)人或者組織(尤其是企業(yè))為大量使用著作付費(fèi),或者將獲得保護(hù)的著作全部清理出數(shù)據(jù)庫,這就大大增加了我國本土企業(yè)開發(fā)機(jī)器學(xué)習(xí)技術(shù)的成本,也妨礙了我國機(jī)器學(xué)習(xí)技術(shù)的正常發(fā)展。若將其定義為合理使用,則能夠?yàn)槲覈娜斯ぶ悄茴I(lǐng)域的發(fā)展以及第四次信息技術(shù)工業(yè)革命中所涉及的整個(gè)產(chǎn)業(yè)提供一定的競爭性優(yōu)勢,⑤張金平:《人工智能作品合理使用困境及其解決》,《環(huán)球法律評(píng)論》2019年第3期。是著作權(quán)制度中平衡著作權(quán)人、社會(huì)公共利益和使用者利益的有效措施。希望通過本文的討論,能夠促進(jìn)這項(xiàng)制度的完成,為機(jī)器學(xué)習(xí)使用作品和數(shù)據(jù)提供法律依據(jù),減少成本,促進(jìn)新型行業(yè)的發(fā)展。