張惠彬 肖啟賢
摘? ? 要:科學(xué)研究自由是我國(guó)《憲法》所賦予的基本權(quán)利,該項(xiàng)權(quán)利保障了科研人員從事科學(xué)研究不受非必要的限制,從而有利于促進(jìn)科學(xué)技術(shù)的發(fā)展。人工智能時(shí)代,文本與數(shù)據(jù)挖掘作為一種基礎(chǔ)性的科學(xué)研究方法,已成為科學(xué)研究自由的新范式。從我國(guó)法律體系上來(lái)看,文本與數(shù)據(jù)挖掘受到版權(quán)法律制度的嚴(yán)重制約,存在巨大的版權(quán)侵權(quán)風(fēng)險(xiǎn)?;砻饪茖W(xué)研究中實(shí)施文本與數(shù)據(jù)挖掘的版權(quán)責(zé)任是各國(guó)版權(quán)法律制度發(fā)展的趨勢(shì)。我國(guó)第三次《著作權(quán)法》的修改雖對(duì)合理使用制度加以完善,并一定程度上考慮了科學(xué)研究發(fā)展的需要,但總體上仍無(wú)法滿足人工智能時(shí)代的需求。借鑒歐盟《數(shù)字化單一市場(chǎng)版權(quán)指令(2019)》第三條的規(guī)定,增設(shè)“以科學(xué)研究為目的的文本與數(shù)據(jù)挖掘合理使用”,對(duì)于保障人工智能時(shí)代的科學(xué)研究自由,實(shí)現(xiàn)科技自立自強(qiáng)和人工智能戰(zhàn)略具有重要意義。
關(guān)鍵詞:文本與數(shù)據(jù)挖掘;科學(xué)研究自由;合理使用;著作權(quán)法修改
中圖分類號(hào):D 923.8? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? ? ? 文章編號(hào):2096?9783(2021)06?0074?11
引? 言
新冠肺炎疫情暴發(fā)后,全球都在尋找科學(xué)抗疫之路。在疫情數(shù)據(jù)監(jiān)控、病毒機(jī)理分析、防控措施等方面,文本與數(shù)據(jù)挖掘(Text and Data Mining,簡(jiǎn)稱TDM)成為抗疫的重要工具,為打贏抗疫之戰(zhàn)提供了有力保障。自人工智能技術(shù)興起后,TDM對(duì)于提高科研效率、加速科學(xué)發(fā)現(xiàn)、支撐科研創(chuàng)新、促進(jìn)經(jīng)濟(jì)增長(zhǎng)越來(lái)越重要[1]。使用TDM開(kāi)展科學(xué)研究的自由已經(jīng)成為人工智能時(shí)代科學(xué)研究自由的應(yīng)有之義。然而,TDM過(guò)程中所涉及的文本與數(shù)據(jù)的提取、復(fù)制與傳輸?shù)拳h(huán)節(jié)大部分為版權(quán)法所限制,在我國(guó)著作權(quán)法語(yǔ)境下面臨嚴(yán)重的侵權(quán)風(fēng)險(xiǎn)。主張版權(quán)遭受侵害的當(dāng)事人能否伸張權(quán)利?抑或是科研人員得以在“科研自由”的憲法保護(hù)傘下免其版權(quán)責(zé)任1?從國(guó)際層面來(lái)看,為科學(xué)研究中使用TDM的行為設(shè)立版權(quán)例外,豁免其版權(quán)侵權(quán)責(zé)任,已成為各個(gè)國(guó)家和地區(qū)的普遍做法。2019年3月,歐盟通過(guò)了《數(shù)字化單一市場(chǎng)版權(quán)指令(2019)》(以下簡(jiǎn)稱《DSM指令》),在歐盟層面引入了TDM版權(quán)例外制度?!禗SM指令》是當(dāng)前全球數(shù)字版權(quán)領(lǐng)域影響最廣泛的立法成果。2020年11月,我國(guó)《著作權(quán)法》第三次修改對(duì)合理使用制度進(jìn)行了完善,但在保障人工智能時(shí)代科學(xué)研究中TDM技術(shù)的自由使用方面仍然十分不足。有鑒于此,本文在充分考察人工智能時(shí)代TDM在科學(xué)研究領(lǐng)域的重要作用的基礎(chǔ)上,通過(guò)規(guī)范分析的方法對(duì)我國(guó)《著作權(quán)法》修改后,科學(xué)研究中TDM的版權(quán)風(fēng)險(xiǎn)進(jìn)行解構(gòu);通過(guò)比較法研究的方式,解析歐盟《DSM指令》的具體做法,檢視我國(guó)《著作權(quán)法》第三次修改的不足,并提出相應(yīng)的完善之策。一、TDM已成為人工智能時(shí)代科學(xué)研究自由的新樣式
(一)TDM是人工智能時(shí)代科學(xué)研究的新手段
人工智能2時(shí)代是繼網(wǎng)絡(luò)時(shí)代、大數(shù)據(jù)時(shí)代之后,人類所面臨的技術(shù)和社會(huì)變革最為深刻的時(shí)代[2]。其不僅從科學(xué)研究成果上為人類社會(huì)帶來(lái)了多種可能性,也從科學(xué)研究的過(guò)程中體現(xiàn)了與過(guò)去完全不同的思維,引發(fā)了科學(xué)研究方法的創(chuàng)新。人工智能時(shí)代,TDM成為科學(xué)研究的重要手段。其以大量的資料為基礎(chǔ),通過(guò)算法的設(shè)置實(shí)現(xiàn)自動(dòng)分析并生成有用的知識(shí),將人類從無(wú)窮無(wú)盡的文本和數(shù)據(jù)中解放出來(lái)。
現(xiàn)代人工智能的核心技術(shù)是基于數(shù)據(jù)的機(jī)器學(xué)習(xí),即從觀測(cè)數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,并利用這些規(guī)律對(duì)未來(lái)數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)的技術(shù)[3]。大數(shù)據(jù)、機(jī)器學(xué)習(xí)等人工智能理論與成果的應(yīng)用,極大推動(dòng)了TDM技術(shù)的發(fā)展。用數(shù)據(jù)庫(kù)管理系統(tǒng)來(lái)存儲(chǔ)數(shù)據(jù),用機(jī)器學(xué)習(xí)的方法來(lái)分析數(shù)據(jù),挖掘數(shù)據(jù)背后的知識(shí),這兩者的結(jié)合促成了數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Databases,KDD)的產(chǎn)生,而數(shù)據(jù)挖掘3是知識(shí)發(fā)現(xiàn)最核心的部分[4]。雖然經(jīng)典的TDM和機(jī)器學(xué)習(xí)并非完全相同,但兩者均使用相同的關(guān)鍵算法來(lái)發(fā)現(xiàn)數(shù)據(jù)中的模式[5]。國(guó)外學(xué)者普遍認(rèn)為:“TDM是機(jī)器和深度學(xué)習(xí)的基石,如果沒(méi)有利用計(jì)算機(jī)分析大量數(shù)據(jù)并使用認(rèn)知技術(shù)來(lái)發(fā)展學(xué)習(xí)模式的能力,人工智能是不可能存在的”[6]。吳漢東教授亦指出:“文本和數(shù)據(jù)挖掘,可視為從另一角度對(duì)人工智能技術(shù)過(guò)程的表述”[7]。因此,TDM既得益于人工智能技術(shù)的發(fā)展,同時(shí)也成為人工智能時(shí)代最為基本的技術(shù)手段之一。
《DSM指令》將TDM定義為:“任何旨在分析數(shù)字形式的文本和數(shù)據(jù),以便生成包括但不限于模型、趨勢(shì)、相關(guān)性等信息的自動(dòng)分析技術(shù)”[8]。簡(jiǎn)言之,TDM幾乎包含了所有使用計(jì)算機(jī)來(lái)進(jìn)行信息索引、分析、評(píng)估和解釋的活動(dòng)[9]。TDM一般均存在四個(gè)技術(shù)步驟:
第一步,信息的獲取。TDM的對(duì)象是數(shù)字形式的文本或數(shù)據(jù),其獲取的途徑包括但不限于使用爬蟲(chóng)等方式從網(wǎng)上直接抓取或通過(guò)應(yīng)用程序接口(API)獲取。在該步驟中,所獲取的信息可能被復(fù)制并儲(chǔ)存在服務(wù)器中。第二步,目標(biāo)數(shù)據(jù)集的創(chuàng)建。TDM的實(shí)施者將對(duì)獲取的信息進(jìn)行預(yù)處理以剔除不必要的信息或?qū)π畔⑦M(jìn)行標(biāo)準(zhǔn)化處理。并非所有的信息均可直接進(jìn)行TDM,如自然語(yǔ)言文本通常需要轉(zhuǎn)化成可為計(jì)算機(jī)處理的結(jié)構(gòu)性數(shù)據(jù)。經(jīng)過(guò)處理的文本或數(shù)據(jù)將形成一個(gè)新的目標(biāo)數(shù)據(jù)集,用于開(kāi)展數(shù)據(jù)挖掘。第三步,數(shù)據(jù)挖掘。研究者利用載有挖掘程序的計(jì)算機(jī)對(duì)數(shù)據(jù)集進(jìn)行分析,以生成所需要的模型、趨勢(shì)、相關(guān)性等知識(shí)。第四步,挖掘結(jié)果及發(fā)布。這一步驟取決于TDM實(shí)施者的研究目的,如通過(guò)期刊論文、專著或內(nèi)部文獻(xiàn)等形式將挖掘結(jié)果進(jìn)行公布。
從以上步驟中可以看出,TDM與傳統(tǒng)的科學(xué)研究方法最大的不同之處在于其實(shí)現(xiàn)了信息的“機(jī)器閱讀”,甚至改變了人類作為知識(shí)創(chuàng)造唯一主體的局面。人工智能時(shí)代,人類社會(huì)所產(chǎn)生的信息將難以計(jì)數(shù),大數(shù)據(jù)驅(qū)動(dòng)知識(shí)學(xué)習(xí)已經(jīng)成為一種必然的趨勢(shì)。因此,有學(xué)者認(rèn)為,“數(shù)據(jù)挖掘這種新時(shí)代的科學(xué)新工具讓我們實(shí)現(xiàn)了用數(shù)據(jù)化手段測(cè)度人類行為和人類社會(huì),再次改變了人類探索世界的方法”[10]。從目前的趨勢(shì)來(lái)看,這一說(shuō)法并非夸大之詞。在計(jì)算語(yǔ)言學(xué)領(lǐng)域,使用TDM的研究項(xiàng)目約占25%~30%;在提高生物醫(yī)學(xué)發(fā)現(xiàn)的效率、優(yōu)化自然資源的管理和使用等方面,TDM也同樣收效良好[5]。TDM已經(jīng)成為人工智能時(shí)代不可或缺的科學(xué)研究方式。
(二)TDM在我國(guó)科學(xué)研究中的應(yīng)用現(xiàn)狀
我國(guó)當(dāng)前在人工智能技術(shù)的研發(fā)、應(yīng)用和產(chǎn)業(yè)發(fā)展方面具有較大的優(yōu)勢(shì),相關(guān)領(lǐng)域的論文發(fā)表數(shù)量、專利擁有量以及部分領(lǐng)域的核心關(guān)鍵技術(shù)均處于世界前列。人工智能成為我國(guó)經(jīng)濟(jì)發(fā)展的新引擎,在國(guó)家自主創(chuàng)新戰(zhàn)略體系和國(guó)際競(jìng)爭(zhēng)中扮演著重要的角色。人工智能時(shí)代的到來(lái),TDM成為我國(guó)各領(lǐng)域科研工作中最為廣泛使用的基礎(chǔ)性研究方法之一。以TDM在抗擊新冠肺炎疫情中的應(yīng)用為例,我們大致可以一窺其在我國(guó)科研工作中的重要意義。
2019年末,新冠肺炎疫情暴發(fā)后,清華大學(xué)AMiner團(tuán)隊(duì)聯(lián)合多個(gè)科研團(tuán)體在其科技大數(shù)據(jù)挖掘服務(wù)平臺(tái)基礎(chǔ)上研發(fā)上線“知識(shí)疫圖”系統(tǒng)。該系統(tǒng)匯集了包括疫情、科研、知識(shí)、媒體、政策等300余項(xiàng)與新冠肺炎有關(guān)的數(shù)據(jù)資源,開(kāi)發(fā)了新冠肺炎開(kāi)放數(shù)據(jù)集、疫情智能駕駛艙、高關(guān)注學(xué)者分析、新冠肺炎學(xué)術(shù)成果時(shí)間線,以及新冠肺炎期間用戶在線社交行為研究等功能模塊[11]。其中,新冠肺炎開(kāi)放數(shù)據(jù)集為TDM的實(shí)施提供了重要的基礎(chǔ);學(xué)術(shù)成果時(shí)間線對(duì)大量的論文文獻(xiàn)以及從新聞媒體、社交平臺(tái)等渠道提取的大量信息進(jìn)行文本與數(shù)據(jù)挖掘,并以時(shí)間軸的形式集中呈現(xiàn)其中的學(xué)術(shù)觀點(diǎn)、熱點(diǎn)事件等;高關(guān)注學(xué)者分析則對(duì)包括鐘南山、李蘭娟等國(guó)內(nèi)外重要學(xué)者的學(xué)術(shù)領(lǐng)域、學(xué)術(shù)水平等信息進(jìn)行挖掘,為研究人員和公眾提供相關(guān)的知識(shí);用戶在線社交行為研究則以微信大數(shù)據(jù)等為基礎(chǔ)實(shí)現(xiàn)對(duì)用戶疫情期間心理狀況的自動(dòng)分析;在疫情趨勢(shì)預(yù)測(cè)等方面TDM也作出了重要的貢獻(xiàn)。另有學(xué)者利用TDM等技術(shù)構(gòu)建疫情追溯數(shù)據(jù)模型,以實(shí)現(xiàn)短時(shí)間內(nèi)對(duì)高風(fēng)險(xiǎn)人群和地區(qū)的精準(zhǔn)定位[12];通過(guò)對(duì)微博文本進(jìn)行TDM來(lái)研究疫情心理時(shí)空距離對(duì)公眾情緒的影響等[13]。
此外,TDM技術(shù)在金融、交通、公共衛(wèi)生、文本分析、傳統(tǒng)醫(yī)藥研究、社會(huì)輿情分析、市場(chǎng)決策等領(lǐng)域也擁有廣闊的應(yīng)用前景和眾多成功案例。有學(xué)者更斷言,“在人工處理數(shù)據(jù)洪流已經(jīng)變得不可行且過(guò)于昂貴的當(dāng)下,效率與耗費(fèi)在客觀上促使TDM成為必須行動(dòng)的項(xiàng)目”[14]。隨著5G時(shí)代的到來(lái),人類將進(jìn)一步被信息的洪流所淹沒(méi),TDM所具有的意義將更加凸顯。因此,TDM并非僅僅是一個(gè)新穎的科學(xué)概念,其已經(jīng)成為現(xiàn)實(shí)中普遍存在的科學(xué)研究手段,并深刻影響我國(guó)科技、經(jīng)濟(jì)以及社會(huì)發(fā)展的進(jìn)程。
(三)人工智能時(shí)代科學(xué)研究自由的新樣式
從各國(guó)的情形來(lái)看,TDM均非絕對(duì)無(wú)限制之自由,其最主要的限制來(lái)自各國(guó)版權(quán)法律。TDM作為一種科學(xué)研究方法,必須以大量的文本(如數(shù)字圖書(shū)、網(wǎng)絡(luò)中的文章、期刊等)或數(shù)據(jù)(數(shù)據(jù)庫(kù)或其他形式的數(shù)據(jù)資源)為基礎(chǔ)。其在挖掘過(guò)程中通常涉及到對(duì)受版權(quán)法保護(hù)的文本或數(shù)據(jù)的復(fù)制、發(fā)行、改編、翻譯等行為。沒(méi)有版權(quán)人的授權(quán),此類行為均涉嫌侵害他人版權(quán)權(quán)利。尤其是在涉及商業(yè)使用時(shí),TDM可能會(huì)對(duì)版權(quán)人的利益造成一定的損害。因此,TDM的使用雖然十分重要并且廣泛,但并非是沒(méi)有限制的任意使用。
科學(xué)研究自由是《中華人民共和國(guó)憲法》(以下簡(jiǎn)稱《憲法》)所保障的一項(xiàng)公民基本權(quán)利,其也為《中華人民共和國(guó)科學(xué)技術(shù)進(jìn)步法》和《中華人民共和國(guó)高等教育法》所明文規(guī)定4。學(xué)者認(rèn)為,我國(guó)《憲法》語(yǔ)境下的科學(xué)研究自由應(yīng)當(dāng)包含“研究自由”與“教學(xué)自由”。所謂研究自由是指研究者不受非法的限制和拘束,而選擇研究對(duì)象、目的、方法、場(chǎng)所、時(shí)間的自由,以及發(fā)表研究成果的自由[15]。從TDM的過(guò)程來(lái)看,其主要關(guān)涉科學(xué)研究方法的自由以及發(fā)表研究成果的自由。具體而言,則存在以下兩個(gè)方面的考慮:其一,TDM作為一種新的研究方法,研究人員是否有不受限制而使用的權(quán)利?其二,TDM所產(chǎn)生的研究成果是否能夠自由發(fā)表?由于TDM與人工智能的密切關(guān)系,以上兩個(gè)問(wèn)題的答案均深刻影響著人工智能時(shí)代國(guó)家科學(xué)技術(shù)的進(jìn)步以及綜合力量提升。
TDM已經(jīng)成為科學(xué)研究自由的新樣式。從科學(xué)研究自由的內(nèi)涵上考察,TDM作為人工智能時(shí)代科研人員開(kāi)展研究所必備的手段,其屬于科學(xué)研究方法自由之列。而發(fā)表利用TDM所產(chǎn)生的研究成果則自然屬于發(fā)表研究成果的自由。將TDM歸于科學(xué)研究自由之列,深層次的原因則在于科學(xué)研究自由所具有的集體性價(jià)值導(dǎo)向。有學(xué)者指出:“知識(shí)創(chuàng)新、科技進(jìn)步是需要學(xué)術(shù)自由5作為法治保障的,所以學(xué)術(shù)自由的集體性價(jià)值,也就是對(duì)于提高國(guó)家的國(guó)際競(jìng)爭(zhēng)力的作用和價(jià)值,已經(jīng)超過(guò)以往的任何時(shí)代”[15]。歐盟《DSM指令》在序言中指出,隨著研究越來(lái)越多在數(shù)字技術(shù)的協(xié)助下進(jìn)行,除非采取步驟解決TDM方面的法律不確定性(筆者注:主要是指版權(quán)侵權(quán)的風(fēng)險(xiǎn)),否則歐盟作為一個(gè)研究區(qū)域的競(jìng)爭(zhēng)地位將受到影響。歐盟豁免科學(xué)研究中TDM版權(quán)責(zé)任的初衷即在于TDM在促進(jìn)知識(shí)創(chuàng)新和科技進(jìn)步方面所體現(xiàn)的集體性價(jià)值。
從實(shí)踐層面看,TDM作為一種科學(xué)研究自由已經(jīng)為大多數(shù)發(fā)達(dá)國(guó)家所認(rèn)可。美國(guó)作為人工智能技術(shù)和產(chǎn)業(yè)最發(fā)達(dá)的國(guó)家,其版權(quán)法為TDM在科學(xué)研究中的使用提供了充足的空間。美國(guó)版權(quán)法第107條規(guī)定的合理使用原則所固有的靈活性,使法官在面對(duì)糾紛時(shí)能自為判斷TDM的使用是否符合公平理念。在“作家協(xié)會(huì)訴HathiTrust”案以及“作家協(xié)會(huì)訴谷歌公司”案等案件中,美國(guó)法院均認(rèn)為TDM構(gòu)成合理使用,從而不構(gòu)成侵權(quán)[1]。在《DSM指令》生效兩年內(nèi),歐盟所有成員國(guó)均需將指令內(nèi)容轉(zhuǎn)化為其國(guó)內(nèi)法律。因此,歐盟境內(nèi)將普遍承認(rèn)TDM屬于科學(xué)研究自由的范疇。此外,日本也早在2009年即確立了TDM版權(quán)例外,是全球最早開(kāi)展該立法的國(guó)家6。由此觀之,TDM作為一種科學(xué)研究自由,其不僅具有理論上的依據(jù),也是國(guó)際版權(quán)立法的趨勢(shì)。
二、科學(xué)研究中應(yīng)用TDM的版權(quán)風(fēng)險(xiǎn)
任何自由均非絕對(duì),科學(xué)研究自由其本身也受到憲法和法律的外在限制。根據(jù)《憲法》第五十一條的規(guī)定:“中華人民共和國(guó)公民在行使自由和權(quán)利的時(shí)候,不得損害國(guó)家的、社會(huì)的、集體的利益和其他公民的合法的自由和權(quán)利”。TDM作為一種人工智能時(shí)代的科學(xué)研究自由樣式,在理論上具有其合理性。然而,從我國(guó)法律體系上來(lái)看,其受到版權(quán)法律制度的嚴(yán)重制約。
(一)TDM版權(quán)風(fēng)險(xiǎn)解構(gòu)
TDM之所以存在版權(quán)風(fēng)險(xiǎn),原因在于挖掘的對(duì)象往往是受版權(quán)法保護(hù)的作品。《中華人民共和國(guó)著作權(quán)法》(以下簡(jiǎn)稱《著作權(quán)法》)第三條規(guī)定了九種法定作品類型,其中包括文字作品、美術(shù)作品、攝影作品、視聽(tīng)作品、圖形作品、計(jì)算機(jī)軟件作品等在內(nèi)的作品類型均可以作為TDM的對(duì)象。此外,根據(jù)“匯編作品”的規(guī)定,即使是不構(gòu)成作品的數(shù)據(jù)以及其他內(nèi)容的集合,只要其選擇和編排具有獨(dú)創(chuàng)性,則該匯編而成的集合也可以作為匯編作品而受到保護(hù)。目前,科學(xué)研究中常見(jiàn)的TDM對(duì)象(如網(wǎng)頁(yè)內(nèi)容、期刊文章、數(shù)字圖書(shū)等)絕大多數(shù)都是版權(quán)法所保護(hù)的客體。
從TDM的過(guò)程來(lái)看,其所涉及的版權(quán)權(quán)利類型眾多?!吨鳈?quán)法》第十條明確了著作權(quán)人可排他利用作品的各種行為類型,也即著作權(quán)人的專有權(quán)利范圍。其中包括對(duì)作品的復(fù)制、修改、發(fā)行、信息網(wǎng)絡(luò)傳播、改編、翻譯等權(quán)利。TDM的第一步需要獲取各種文本和數(shù)據(jù)信息,用于創(chuàng)建目標(biāo)數(shù)據(jù)集。該過(guò)程一般需要對(duì)目標(biāo)信息進(jìn)行復(fù)制并保存,從而涉嫌侵犯復(fù)制權(quán)。目標(biāo)數(shù)據(jù)集的創(chuàng)建包含了信息的預(yù)處理過(guò)程,包括對(duì)信息進(jìn)行翻譯、刪改、整理、匯總、格式轉(zhuǎn)換等步驟。這一過(guò)程則有侵害他人翻譯權(quán)、改編權(quán)以及匯編權(quán)的可能。而在挖掘過(guò)程中,同樣也涉及信息的復(fù)制。挖掘形成的研究成果的發(fā)布或者具體利用則會(huì)引起侵害信息網(wǎng)絡(luò)傳播權(quán)、改編權(quán)等問(wèn)題。因此,TDM在科學(xué)研究中的運(yùn)用具有極大的侵權(quán)風(fēng)險(xiǎn),容易引起版權(quán)糾紛?!肮雀钄?shù)字圖書(shū)館”系列案件是學(xué)界公認(rèn)的與TDM相關(guān)的著作權(quán)糾紛之一。該案件的起因在于谷歌公司與多家圖書(shū)館合作將館藏書(shū)籍進(jìn)行掃描和數(shù)字化,并將數(shù)字化的圖書(shū)匯編為一個(gè)巨大的數(shù)據(jù)庫(kù)作為其數(shù)字圖書(shū)項(xiàng)目的一個(gè)部分。谷歌公司以此為基礎(chǔ)向用戶提供檢索服務(wù),用戶可以檢索到包含檢索詞的內(nèi)容片段(無(wú)法閱讀全文),并可對(duì)檢索詞的出現(xiàn)頻率進(jìn)行分析。此外,該項(xiàng)目也為文本與數(shù)據(jù)挖掘、相關(guān)算法開(kāi)發(fā)等提供了極大支持。截至2014年,谷歌公司已經(jīng)對(duì)超過(guò)2千萬(wàn)本圖書(shū)進(jìn)行了掃描和數(shù)字化。然而,由于谷歌并未獲得版權(quán)人的授權(quán),從2005年起,其遭到了來(lái)自作家協(xié)會(huì)以及個(gè)人作者的起訴。該系列糾紛在美國(guó)持續(xù)了超過(guò)10年的時(shí)間,直到2016年美國(guó)法院最終認(rèn)定谷歌的行為屬于合理使用[16]。而在我國(guó)發(fā)生的,與“谷歌數(shù)字圖書(shū)館”項(xiàng)目相關(guān)的案件“王莘訴北京谷翔信息技術(shù)有限公司、谷歌公司”案中,法院認(rèn)為“片段式”為他人提供檢索構(gòu)成合理使用,而“全文掃描”原告作品的行為則構(gòu)成對(duì)原告復(fù)制權(quán)的侵犯7。在TDM項(xiàng)目中,對(duì)作品的全文復(fù)制是常見(jiàn)的操作。因此,相對(duì)于美國(guó),TDM的實(shí)施在我國(guó)具有更大的版權(quán)侵權(quán)風(fēng)險(xiǎn)。
(二)合理使用制度無(wú)法提供適當(dāng)?shù)幕砻?/p>
雖然科學(xué)研究自由會(huì)受到版權(quán)的制約,但并非沒(méi)有別的出路。《憲法》本身即確立了一種二元限制的結(jié)構(gòu),即以私人權(quán)利為代表的個(gè)體性自由主張與以科學(xué)研究自由為代表的集體性自由主張之間構(gòu)成相互制約、相互平衡的二元結(jié)構(gòu)?!扒罢邽榇_保作者對(duì)其創(chuàng)作的作品的權(quán)利奠定了憲法基礎(chǔ),后者則保障了后續(xù)作者和其他使用人對(duì)他人作品利用的權(quán)利?!盵17]此外,促進(jìn)科學(xué)事業(yè)的發(fā)展也是我國(guó)《著作權(quán)法》的重要立法目的。因此,版權(quán)人的權(quán)利在一定程度上也應(yīng)當(dāng)受到科學(xué)研究自由的制衡。這一點(diǎn)最直接的體現(xiàn)則為“合理使用”制度。我國(guó)現(xiàn)行《著作權(quán)法》第四節(jié)為“權(quán)利的限制”,其中第二十四條規(guī)定了兩種與科學(xué)研究自由相關(guān)的合理使用,即“為個(gè)人學(xué)習(xí)、研究或者欣賞,使用他人已經(jīng)發(fā)表的作品”“為學(xué)校課堂教學(xué)或者科學(xué)研究,翻譯、改編、匯編、播放或者少量復(fù)制已經(jīng)發(fā)表的作品,供教學(xué)或者科研人員使用,但不得出版發(fā)行”。符合上述規(guī)定的作品使用行為因構(gòu)成合理使用而可以不經(jīng)著作權(quán)人許可并無(wú)需支付報(bào)酬。
現(xiàn)行合理使用制度難以滿足科學(xué)研究中TDM的需要。首先,《著作權(quán)法》第三次修改中雖然在法定的合理使用類型之后增加了兜底條款,即“(十三)法律、行政法規(guī)規(guī)定的其他情形”8,但這并不意味著我國(guó)合理使用制度從封閉式立法轉(zhuǎn)變?yōu)殚_(kāi)放式立法,法官仍不得自為創(chuàng)設(shè)新的合理使用類型。而目前的其他法律、行政法規(guī)中并無(wú)任何關(guān)于TDM合理使用的規(guī)定。其次,此次《著作權(quán)法》修改增加了為學(xué)校課堂教學(xué)或者科學(xué)研究合理使用9的行為類型,即增加了“改編、匯編、播放”三種行為。顯而易見(jiàn)的是,立法者已經(jīng)認(rèn)識(shí)到當(dāng)前課堂教學(xué)或科學(xué)研究中對(duì)作品使用的需要已不僅僅是翻譯和少量復(fù)制。僅就TDM而言,就包括了復(fù)制、翻譯、改編、匯編等眾多作品使用行為。只是這一修改雖有其進(jìn)步之處,但仍然難以為科學(xué)研究中的TDM提供豁免。因?yàn)樵擁?xiàng)合理使用不僅存在主體限制——限于公共性質(zhì)的學(xué)校、科研院所等,也存在復(fù)制數(shù)量的限制——僅限于“少量復(fù)制”。TDM既已成為人工智能時(shí)代廣泛運(yùn)用的科學(xué)研究方法,其使用者自然不限于學(xué)校和科研院所,而就其挖掘過(guò)程來(lái)看,則需要對(duì)作品大量乃至于全部復(fù)制。再者,為個(gè)人學(xué)習(xí)、研究或欣賞的合理使用雖無(wú)方式與數(shù)量的限制,但其僅限于“個(gè)人”主體。當(dāng)前的科學(xué)研究工作基本上已告別了個(gè)人單打獨(dú)斗的模式,而人工智能作為當(dāng)前最為復(fù)雜的科學(xué)研究領(lǐng)域之一,更是如此。因此有學(xué)者感嘆:“在此國(guó)際大背景下,文本數(shù)據(jù)挖掘的例外規(guī)定在我國(guó)著作權(quán)法中卻付之闕如”[7]。此不免為我國(guó)第三次《著作權(quán)法》修改之失。
三、豁免科學(xué)研究中TDM版權(quán)責(zé)任的歐盟經(jīng)驗(yàn)
2019年3月26日,《DSM指令》以348票贊成、274票反對(duì)、36票棄權(quán)的結(jié)果在歐洲議會(huì)獲得通過(guò)。該指令旨在于歐盟內(nèi)部創(chuàng)設(shè)一個(gè)協(xié)調(diào)一致、高水平的版權(quán)保護(hù)體系,以促進(jìn)歐盟境內(nèi)的創(chuàng)新,激勵(lì)投資和新內(nèi)容的生產(chǎn),避免在數(shù)字環(huán)境中歐盟內(nèi)部市場(chǎng)的分裂。文本與數(shù)據(jù)挖掘的版權(quán)例外作為此次歐盟立法的焦點(diǎn)之一,被規(guī)定在《DSM指令》第二章“使例外和限制適應(yīng)數(shù)字和跨境環(huán)境的措施”中。
(一)立法背景
1.TDM面臨極大的法律不確定性
在歐盟原有的法律框架之中,實(shí)施TDM的確存在極大的版權(quán)風(fēng)險(xiǎn),但其亦有可能為既有的各種版權(quán)例外所豁免?!禗SM指令》在序言第(8)項(xiàng)中指出:在某些情況下,TDM可能涉及受版權(quán)保護(hù)的行為、受數(shù)據(jù)庫(kù)權(quán)利保護(hù)的行為,或者兼而有之,特別是作品或其他內(nèi)容的復(fù)制、從數(shù)據(jù)庫(kù)中提取內(nèi)容等行為。具體而言,TDM可能侵犯歐盟《信息社會(huì)版權(quán)指令》(Directive 2001/29/EC)所規(guī)定的復(fù)制權(quán),與《數(shù)據(jù)庫(kù)指令》(Directive 1996/9/EC)所規(guī)定的數(shù)據(jù)庫(kù)特別權(quán)利等。但在以上兩部指令中,同時(shí)也規(guī)定了可能適用于TDM的版權(quán)例外,包括臨時(shí)復(fù)制例外10和科學(xué)研究例外11。然而,臨時(shí)復(fù)制例外的適用具有較為苛刻的條件,包括要求復(fù)制是臨時(shí)的、附帶的,是技術(shù)過(guò)程中不可或缺的組成部分,且不具有獨(dú)立的經(jīng)濟(jì)價(jià)值等。而就科學(xué)研究例外的情形來(lái)看,歐盟各成員國(guó)在這項(xiàng)例外是否適用于TDM上存在不一致的規(guī)定,且歐盟法律將該項(xiàng)例外限于“非商業(yè)目的”并需要注明來(lái)源和作者姓名(除非證明是不可能的)[18]。因此,TDM在歐盟即使存在合理使用的可能,但依然具有極大的不確定性,嚴(yán)重影響了該項(xiàng)技術(shù)的使用。
2.跨國(guó)科研合作受到阻礙
《DSM指令》的目的之一即在于在歐盟各國(guó)之間建立統(tǒng)一的數(shù)字版權(quán)制度,以促進(jìn)區(qū)域內(nèi)的版權(quán)交易與合作。歐洲委員會(huì)的報(bào)告則指出:“歐盟版權(quán)規(guī)則的不成體系在例外方面尤為明顯,在大多數(shù)情況下,歐盟法律規(guī)定的例外情況是成員國(guó)可選擇執(zhí)行的”[19]。而就文本與數(shù)據(jù)挖掘版權(quán)例外制度而言,在《DSM指令》出臺(tái)之前,歐盟各成員國(guó)之間的立法并不同步。從立法時(shí)間來(lái)看,英國(guó)早在2014年即引入了該項(xiàng)版權(quán)例外制度,法國(guó)、德國(guó)等則相繼開(kāi)展了相關(guān)立法。從立法內(nèi)容來(lái)看,各個(gè)國(guó)家既存的規(guī)定之間也并不一致[20]。另一方面,科學(xué)研究例外并不具有強(qiáng)制性,歐盟各國(guó)版權(quán)法律并非必須作出規(guī)定。因此,該項(xiàng)例外在歐盟各成員國(guó)中的執(zhí)行情況具有較大的差異性。各成員國(guó)之間的法律差異嚴(yán)重影響了跨境科研合作。
3.合同及技術(shù)措施阻礙TDM的使用
即使TDM符合了上述臨時(shí)復(fù)制例外或科學(xué)研究例外的條件,也不意味著科研機(jī)構(gòu)能夠順利實(shí)施該技術(shù)。因?yàn)樵讷@取供挖掘的信息時(shí),授權(quán)人往往可以通過(guò)合同條款禁止被授權(quán)人進(jìn)行TDM,或者設(shè)置諸多限制。即使是依據(jù)版權(quán)法可以自由利用的信息(如超過(guò)版權(quán)時(shí)效的作品),信息的提供者也一樣可以通過(guò)合同條款禁止實(shí)施挖掘行為。此外,技術(shù)措施的運(yùn)用也具有同樣的效果。因此,歐盟議會(huì)的報(bào)告指出,“合同和技術(shù)措施的結(jié)合經(jīng)常被用于為從事TDM項(xiàng)目的研究者設(shè)置不可逾越的障礙”[18]。
(二)歐盟TDM版權(quán)例外的具體內(nèi)容
《DSM指令》采“雙軌制”的做法,即區(qū)分以科學(xué)研究為目的的文本與數(shù)據(jù)挖掘例外和不限目的的文本與數(shù)據(jù)挖掘例外,并分別規(guī)定于第三條和第四條中。第三條第一款規(guī)定:
成員國(guó)應(yīng)當(dāng)規(guī)定,科研機(jī)構(gòu)和文化遺產(chǎn)機(jī)構(gòu)為科學(xué)研究目的進(jìn)行文本與數(shù)據(jù)挖掘,對(duì)其合法獲取的作品或其他內(nèi)容進(jìn)行復(fù)制和提取的行為,屬于96/9/EC指令第5(a)與第7(1)條,2001/29/EC指令第2條以及本指令第15(1)條所規(guī)定的權(quán)利的例外。
1.適用主體和目的
該例外的適用主體僅包括“科研機(jī)構(gòu)”和“文化遺產(chǎn)機(jī)構(gòu)”。按《DSM指令》第2條的規(guī)定,科研機(jī)構(gòu)是指大學(xué)(包括其圖書(shū)館)、研究所,以及其他進(jìn)行科學(xué)研究或以開(kāi)展涉及科學(xué)研究的教育活動(dòng)為主要目的的實(shí)體。且該機(jī)構(gòu)必須符合兩個(gè)條件:一是以非營(yíng)利為基礎(chǔ);二是出于為成員國(guó)所承認(rèn)的公共利益而進(jìn)行研究。文化遺產(chǎn)機(jī)構(gòu)則是指可公開(kāi)進(jìn)入的圖書(shū)館、博物館、檔案館或電影、音頻等遺產(chǎn)機(jī)構(gòu)。而指令序言指出,為與歐盟現(xiàn)行的鼓勵(lì)大學(xué)、研究機(jī)構(gòu)與私營(yíng)部門合作的政策相一致,研究組織在公私伙伴關(guān)系框架內(nèi)開(kāi)展研究活動(dòng)時(shí),也應(yīng)屬于這種例外情況。以上兩類主體均具有較強(qiáng)的非商業(yè)性質(zhì),受商業(yè)機(jī)構(gòu)決定性影響的研究組織,因可能導(dǎo)致商業(yè)機(jī)構(gòu)優(yōu)先獲得研究成果而不一定能適用該例外。在適用目的上,例外則僅限于“科學(xué)研究目的”,即使是適格的主體也不能以其他目的(如商業(yè)目的)自由實(shí)施TDM。
2.適用的行為類型
在豁免的行為方式上,包括實(shí)施TDM中發(fā)生的“復(fù)制”與“提取”兩種行為。96/9/EC指令第5(a)與第7(1)條所規(guī)定的分別為數(shù)據(jù)庫(kù)權(quán)利人所享有的復(fù)制權(quán)與提取權(quán)(right of extraction)、反復(fù)利用權(quán)(right of re?utilization);2001/29/EC指令第2條規(guī)定了版權(quán)人或鄰接權(quán)人所享有的復(fù)制權(quán);而《DSM指令》第15(1)條則賦予了新聞出版者對(duì)其新聞出版物的鄰接權(quán),具體包括復(fù)制權(quán)和向公眾提供權(quán)(right of making available to the public)。也即符合該項(xiàng)例外的TDM可免于上述權(quán)利的限制。
3.適用的條件
該項(xiàng)例外的適用前提是:用于TDM的作品或其他內(nèi)容是通過(guò)合法渠道獲取的?!禗SM指令》序言部分指出“合法獲取”應(yīng)理解為包括基于開(kāi)放獲取政策或通過(guò)權(quán)利人與研究組織、文化遺產(chǎn)機(jī)構(gòu)之間的合同安排(如訂閱)以及通過(guò)其他合法手段獲取內(nèi)容。此外,由于技術(shù)保護(hù)措施的存在,即使是合法獲取的作品或內(nèi)容也有可能無(wú)法開(kāi)展TDM。因此,《DSM指令》同時(shí)也規(guī)定權(quán)利人可以采取措施確保承載作品或其他受版權(quán)保護(hù)內(nèi)容的網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)的安全性和完整性,但該措施不應(yīng)該超過(guò)實(shí)現(xiàn)這一目標(biāo)所必須的限度。即要求權(quán)利人所采取的技術(shù)措施應(yīng)與風(fēng)險(xiǎn)相對(duì)稱,不應(yīng)該阻礙TDM的實(shí)施。而對(duì)于合法獲取的作品或內(nèi)容以及其副本,TDM實(shí)施者可以保留作為科學(xué)研究或驗(yàn)證研究結(jié)果之用,但必須采取適當(dāng)?shù)姆绞絻?chǔ)存。
4.例外的強(qiáng)制性
以科學(xué)研究為目的的TDM例外不允許版權(quán)人或數(shù)據(jù)庫(kù)權(quán)利人通過(guò)合同條款排除適用。這是《DSM指令》第三條與第四條之間最大的區(qū)別之一。第四條所規(guī)定的是不限目的的TDM例外,其適用范圍可包含私人或公共部門出于各種目的的TDM,但條件是權(quán)利人沒(méi)有以適當(dāng)方式明確保留該例外的適用。由此可見(jiàn),《DSM指令》對(duì)于科學(xué)研究中的TDM提供了更大的自由度。因?yàn)榱⒎ㄕ哒J(rèn)為,從例外的性質(zhì)和范圍來(lái)看,其對(duì)于權(quán)利人所造成的任何潛在損害都將是最小的。
四、保障人工智能時(shí)代科學(xué)研究自由的制度設(shè)計(jì)
我國(guó)第三次《著作權(quán)法》修改中,在合理使用制度上仍然堅(jiān)持采用“封閉式”立法模式,即除《著作權(quán)法》第二十四條所規(guī)定的十三種情形外,其余使用作品的行為很難被認(rèn)定為屬于合理使用的范圍。而以科學(xué)研究為目的的TDM并非其中任何一種合理使用類型所能包含。這一立法模式雖然具有更大的可預(yù)見(jiàn)性和適用的便利性,但隨著科技和社會(huì)的發(fā)展,此模式的靈活性和包容性則明顯不足。在我國(guó),甚至出現(xiàn)了司法實(shí)踐與立法規(guī)范背道而馳的亂象。最高人民法院發(fā)布的指導(dǎo)意見(jiàn)中指出:“在促進(jìn)技術(shù)創(chuàng)新和商業(yè)發(fā)展確有必要的特殊情形下,考慮作品使用行為的性質(zhì)和目的、被使用作品的性質(zhì)、被使用部分的數(shù)量和質(zhì)量、使用對(duì)作品潛在市場(chǎng)或價(jià)值的影響等因素,如果該使用行為既不與作品的正常使用相沖突,也不至于不合理地?fù)p害作者的正當(dāng)利益,可以認(rèn)定為合理使用”12。也即在某些“特殊情形”下,法官可突破我國(guó)《著作權(quán)法》的封閉規(guī)定,適用一定的標(biāo)準(zhǔn)自行判斷是否屬于“合理使用”?!白源?,我國(guó)法院在一系列案件中陸續(xù)突破著作權(quán)法的封閉性規(guī)定,結(jié)合合理使用四要素展開(kāi)三步檢驗(yàn)法分析,以最終作出是否構(gòu)成合理使用的司法認(rèn)定。”[21]由此觀之,實(shí)踐中欲認(rèn)定以科學(xué)研究為目的的TDM為合理使用也并非毫無(wú)可能,只是該種認(rèn)定存在以下三個(gè)方面的弊端:其一,與《著作權(quán)法》的明確規(guī)定相沖突,存在法官造法的嫌疑;其二,在《著作權(quán)法》缺乏相應(yīng)規(guī)定的情形下,侵權(quán)的嫌疑容易阻卻TDM實(shí)施者的行為;其三,容易造成實(shí)踐中判斷標(biāo)準(zhǔn)的多樣化,影響司法的公正性。
將以科學(xué)研究為目的的TDM行為納入《著作權(quán)法》合理使用規(guī)范之中,作為一種獨(dú)立的合理使用類型既具有理論上的合理性,也有國(guó)際經(jīng)驗(yàn)可供參照,同時(shí)也是呼應(yīng)我國(guó)人工智能發(fā)展戰(zhàn)略和中央關(guān)于科學(xué)自立自強(qiáng)要求的重要立法措施?!吨鳈?quán)法》的第三次修改工作剛剛完成,而下一次修法的時(shí)機(jī)亦難以估計(jì),但《著作權(quán)法實(shí)施條例》的修訂工作正在進(jìn)行之中。因此,根據(jù)新修《著作權(quán)法》第二十四條第(十三)項(xiàng)13的規(guī)定,可在《著作權(quán)法實(shí)施條例》的修訂中增加以科學(xué)研究為目的的TDM合理使用規(guī)定。但從TDM在人工智能時(shí)代所具有的重要性以及普遍性來(lái)看,在時(shí)機(jī)成熟時(shí),仍有必要將其納入我國(guó)《著作權(quán)法》之中。
(一)以科學(xué)研究為目的的TDM版權(quán)例外的合理性探析
新技術(shù)的運(yùn)用對(duì)于版權(quán)人來(lái)說(shuō)存在兩面性,即版權(quán)風(fēng)險(xiǎn)與版權(quán)擴(kuò)張并存。如互聯(lián)網(wǎng)技術(shù)的運(yùn)用使作品的傳播變得輕而易舉,版權(quán)人一方面面臨利益受損的局面,另一方面也在不斷想辦法獲取這一新生領(lǐng)域所帶來(lái)的版權(quán)利益。由此,信息網(wǎng)絡(luò)傳播權(quán)得以確立,其既是出于保護(hù)版權(quán)人利益的需要,也吹響了版權(quán)人向互聯(lián)網(wǎng)領(lǐng)域進(jìn)軍的號(hào)角。而TDM技術(shù)的出現(xiàn)也同樣為版權(quán)人提供了攻城略地的機(jī)會(huì)。他們所主張的“挖掘權(quán)”即是明證。但一項(xiàng)權(quán)利是否能為法律所確認(rèn),必須經(jīng)過(guò)利益平衡的考量。無(wú)論是從我國(guó)《憲法》和《著作權(quán)法》所設(shè)置的利益平衡機(jī)制還是我國(guó)當(dāng)前的現(xiàn)實(shí)發(fā)展需求來(lái)看,為科學(xué)研究中的TDM設(shè)置版權(quán)例外均具有合理之處。
其一,在著作權(quán)的“憲法進(jìn)路”看來(lái),著作權(quán)制度是一種中性制度,對(duì)著作權(quán)的限制與著作權(quán)本身同樣重要,著作權(quán)的正當(dāng)性應(yīng)當(dāng)建立在對(duì)憲法目標(biāo)的實(shí)現(xiàn)上[17]。換言之,“憲法規(guī)定發(fā)展教育、科學(xué)和文化事業(yè)的國(guó)家義務(wù)和社會(huì)目標(biāo),是我國(guó)著作權(quán)法基本目標(biāo)的憲法淵源”[22]。我國(guó)《憲法》既已為科學(xué)研究自由提供了最基礎(chǔ)的保障,則著作權(quán)不應(yīng)當(dāng)成為實(shí)現(xiàn)該目標(biāo)的阻礙。在不損害著作權(quán)人原有利益的情況下,對(duì)基于新技術(shù)而產(chǎn)生的新權(quán)利主張加以適當(dāng)限制,是實(shí)現(xiàn)《憲法》利益分配的要求。TDM旨在對(duì)現(xiàn)有資料進(jìn)行機(jī)器分析,并從中獲得可供利用的知識(shí)。縱然其中涉及對(duì)作品或者其他內(nèi)容的復(fù)制,其僅僅是該過(guò)程中無(wú)法避免的一個(gè)技術(shù)步驟。所復(fù)制的內(nèi)容并非用于傳播,因此不會(huì)造成對(duì)權(quán)利人的市場(chǎng)替代。而所涉及的改編、匯編、翻譯等行為,也由于同樣的原因不會(huì)產(chǎn)生損害權(quán)利人利益的后果。從另一個(gè)角度觀之,若認(rèn)為TDM屬于版權(quán)人的專有權(quán)利,則勢(shì)必嚴(yán)重阻礙科學(xué)研究中TDM的運(yùn)用。進(jìn)一步而言,《憲法》所賦予公民的科學(xué)研究自由實(shí)際上將無(wú)從保障,公共利益與私人權(quán)利的平衡將被打破。
其二,從《著作權(quán)法》的角度而言,“促進(jìn)社會(huì)主義文化和科學(xué)事業(yè)的發(fā)展與繁榮”是賦予著作權(quán)人專有權(quán)利的目標(biāo)之一14。保障公眾對(duì)作品的接觸、欣賞和學(xué)習(xí)是提升公民素質(zhì)、促進(jìn)再創(chuàng)作以推動(dòng)社會(huì)文化和科學(xué)事業(yè)發(fā)展與繁榮的重要環(huán)節(jié)??梢哉f(shuō),作品、作者以至于著作權(quán)法均是因公眾而得以存在,公眾既是目的,也是動(dòng)力和最關(guān)鍵一環(huán)。因此,著作權(quán)法在賦予著作權(quán)人專有使用作品權(quán)利的同時(shí),也給予公眾消費(fèi)性使用15作品的權(quán)利,以實(shí)現(xiàn)著作權(quán)法的利益平衡設(shè)計(jì)。為學(xué)習(xí)、研究或欣賞等目的消費(fèi)作品則是公眾消費(fèi)性使用作品的重要體現(xiàn),其實(shí)質(zhì)是獲得作品的內(nèi)容,包括隱含的思想或信息[22]。唯應(yīng)注意的是,消費(fèi)性使用應(yīng)當(dāng)以“合法取得作品”以及“合理使用作品”為前提[23]。在合法取得作品的前提下,僅以科研目的進(jìn)行TDM是對(duì)作品的消費(fèi)性使用而非傳播性使用。而通常在取得作品的過(guò)程中,權(quán)利人已經(jīng)實(shí)現(xiàn)了其回報(bào)。誠(chéng)然,在TDM過(guò)程之中可能造成復(fù)制件外泄、發(fā)表的研究成果中利用了作品的表達(dá)等,但這不應(yīng)當(dāng)成為事先禁止科學(xué)研究中實(shí)施TDM的理由,應(yīng)當(dāng)依著作權(quán)侵權(quán)規(guī)則加以規(guī)制,即僅在相關(guān)后果產(chǎn)生侵權(quán)時(shí)才依權(quán)利人的主張對(duì)其加以禁止。
歐洲學(xué)界有觀點(diǎn)亦認(rèn)為,基于“思想和事實(shí)不受保護(hù)”的原則,任何旨在提取作品中所蘊(yùn)含的思想和事實(shí)的復(fù)制行為均應(yīng)當(dāng)被允許[24]。該觀點(diǎn)將TDM視作“機(jī)器閱讀”的過(guò)程,并認(rèn)為這與人類閱讀是相同的,均是利用作品中的思想以產(chǎn)生新的知識(shí)。唯其不同之處在于,機(jī)器的閱讀必須以復(fù)制為前提。若禁止該復(fù)制,則無(wú)異于禁止人們對(duì)作品中的思想和事實(shí)的利用。這與版權(quán)法的初衷是相違背的。思想/表達(dá)二分法大致劃定了版權(quán)人的控制范圍與公眾行為自由之間的界限,體現(xiàn)了保護(hù)版權(quán)利益與公共利益之間的平衡。若不對(duì)版權(quán)人的這種權(quán)利主張加以限制,將打破這種平衡,縮小公有領(lǐng)域的范圍,不利于實(shí)現(xiàn)版權(quán)法促進(jìn)社會(huì)文化和科學(xué)事業(yè)發(fā)展的目標(biāo)。
其三,增設(shè)以科學(xué)研究為目的的TDM版權(quán)例外具有高度的現(xiàn)實(shí)意義,符合我國(guó)當(dāng)前的戰(zhàn)略需求。十九屆五中全會(huì)提出:“堅(jiān)持創(chuàng)新在我國(guó)現(xiàn)代化建設(shè)全局中的核心地位,把科技自立自強(qiáng)作為國(guó)家發(fā)展的戰(zhàn)略支撐”。人工智能作為21世紀(jì)三大尖端科技之一,其對(duì)于我國(guó)實(shí)現(xiàn)科技自立自強(qiáng),建設(shè)科技強(qiáng)國(guó)的意義不言而喻。國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》指出:“人工智能是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),世界主要發(fā)達(dá)國(guó)家把發(fā)展人工智能作為提升國(guó)家競(jìng)爭(zhēng)力、維護(hù)國(guó)家安全的重大戰(zhàn)略”。作為人工智能時(shí)代最重要和最基礎(chǔ)的科學(xué)研究工具,TDM被普遍運(yùn)用到自然科學(xué)和社會(huì)科學(xué)等領(lǐng)域,并創(chuàng)造了巨大的經(jīng)濟(jì)和社會(huì)價(jià)值。鑒于TDM在人工智能時(shí)代所具有的重要意義,其已成為國(guó)際上所普遍承認(rèn)的一種科學(xué)研究自由,并體現(xiàn)在各國(guó)家和地區(qū)的立法中。我國(guó)欲實(shí)現(xiàn)人工智能發(fā)展的三步走戰(zhàn)略16,實(shí)現(xiàn)科技自立自強(qiáng),必須充分保障TDM在科學(xué)研究中的使用自由。而具體落實(shí)到版權(quán)法領(lǐng)域,則是應(yīng)當(dāng)破除當(dāng)前我國(guó)《著作權(quán)法》對(duì)科學(xué)研究中使用TDM的制度限制。
(二)立法設(shè)計(jì)
基于TDM作為一種科學(xué)研究自由所具有的合理性以及我國(guó)當(dāng)前的人工智能發(fā)展趨勢(shì)和政策,筆者認(rèn)為,我國(guó)《著作權(quán)法》第二十四條,即關(guān)于合理使用制度的規(guī)定亟須更新。具體而言,則是在第二十四條第(十二)項(xiàng)之后增加一項(xiàng)新的法定合理使用類型:
(十三)以科學(xué)研究為目的進(jìn)行文本與數(shù)據(jù)挖掘,對(duì)合法獲取的作品進(jìn)行復(fù)制、翻譯、改編、匯編。
1.該項(xiàng)合理使用應(yīng)當(dāng)限定為“以科學(xué)研究為目的”
《憲法》所規(guī)定的科學(xué)研究自由體現(xiàn)的是對(duì)公共利益的保障,也即為提升一國(guó)科研實(shí)力,促進(jìn)國(guó)家科技、經(jīng)濟(jì)和社會(huì)發(fā)展而賦予公民的自由。以公共利益對(duì)私人所享有的版權(quán)權(quán)利進(jìn)行限制有其充分的制度基礎(chǔ),且不會(huì)造成對(duì)權(quán)利人的過(guò)度損害。而“以營(yíng)利為目的”實(shí)施TDM則暫時(shí)不應(yīng)當(dāng)納入版權(quán)例外的范疇。一方面,大范圍開(kāi)放TDM版權(quán)例外,容易造成作品提供商提高授權(quán)許可費(fèi)。實(shí)際上,若不將該版權(quán)例外限制在一個(gè)較為有限的范圍內(nèi),權(quán)利人會(huì)默認(rèn)所有交易對(duì)象均有進(jìn)行TDM的可能,從而在定價(jià)時(shí)提高授權(quán)許可費(fèi),以彌補(bǔ)其預(yù)期利益的損失。另一方面,商業(yè)性的TDM需求巨大,而模式亦甚多,其更有可能對(duì)權(quán)利人形成市場(chǎng)替代,從而損害權(quán)利人利益。因此,限于科學(xué)研究為目的是多數(shù)國(guó)家的立法選擇,而《DSM指令》也僅對(duì)此目的下的TDM版權(quán)例外作出強(qiáng)制規(guī)定。此外,該項(xiàng)合理使用不應(yīng)當(dāng)作主體上的限制。無(wú)論是國(guó)家設(shè)立的科研院所、高等學(xué)校,還是私人設(shè)立的研究機(jī)構(gòu),只要其是出于科學(xué)研究目的而進(jìn)行文本與數(shù)據(jù)挖掘,其均屬于《憲法》所規(guī)定的科學(xué)研究自由的范疇。以主體性質(zhì)進(jìn)行區(qū)別對(duì)待沒(méi)有正當(dāng)?shù)睦碛伞?/p>
2.該項(xiàng)合理使用應(yīng)當(dāng)以“合法獲取”為前提
這一前提條件旨在實(shí)現(xiàn)TDM實(shí)施者與內(nèi)容提供者之間的利益平衡。以付費(fèi)換取接觸作品或其他內(nèi)容的權(quán)利是普遍的做法,也是版權(quán)法的基本邏輯。一方面,該例外旨在對(duì)抗內(nèi)容提供者基于技術(shù)發(fā)展而無(wú)故擴(kuò)張的版權(quán)主張(進(jìn)行TDM的權(quán)利),并非要否定原有的制度(許可使用、技術(shù)保護(hù)措施等相關(guān)規(guī)定)。另一方面,專門為研究者提供數(shù)據(jù)集已經(jīng)成為一種商業(yè)模式,這種商業(yè)模式的開(kāi)展不僅需要付出一定的成本,而且也方便了研究的開(kāi)展,為研究者所樂(lè)見(jiàn)。因此,合法獲取這一前提條件具有其合理性。
3.《著作權(quán)法》第二十四條第一款構(gòu)成了對(duì)該合理使用的內(nèi)在限制
新修改的《著作權(quán)法》引入了合理使用“三步檢驗(yàn)法”的內(nèi)容,規(guī)定合理使用作品“不得影響該作品的正常使用,也不得不合理地?fù)p害著作權(quán)人的合法權(quán)益”。TDM的實(shí)施即使?jié)M足了該項(xiàng)合理使用的規(guī)定,但若依然可能產(chǎn)生與他人作品的正常使用相沖突或不合理地?fù)p害權(quán)利人合法權(quán)益的后果時(shí),法官則可行使自由裁量權(quán),以決定該行為是否可獲得豁免。因此,該規(guī)定的引入實(shí)際上為該項(xiàng)合理使用設(shè)定了限制,有利于實(shí)現(xiàn)TDM實(shí)施者與版權(quán)人之間的利益平衡,避免制度的濫用和異化。
4.該項(xiàng)合理使用的行為類型包括“復(fù)制、翻譯、改編、匯編”
從TDM的技術(shù)過(guò)程來(lái)看,對(duì)作品進(jìn)行復(fù)制、翻譯、改編以及匯編均是常見(jiàn)的操作,且通常是不可或缺的環(huán)節(jié)。其中,“復(fù)制”并不受數(shù)量上的限制。原因在于,在TDM技術(shù)過(guò)程之中,大量復(fù)制是必不可少的。更為重要的是,TDM過(guò)程中對(duì)作品的復(fù)制并不導(dǎo)致傳播,不會(huì)為著作權(quán)人帶來(lái)潛在或?qū)嶋H的替代效應(yīng)。從更為本質(zhì)的角度而言,這四種行為均是對(duì)作品內(nèi)在思想的使用過(guò)程中所必要的步驟,屬于消費(fèi)性使用之列。退一步來(lái)看,即便在TDM過(guò)程中存在不規(guī)范的作品使用行為,若實(shí)際產(chǎn)生了對(duì)著作權(quán)人的市場(chǎng)替代,或者造成作品的傳播等,也可依“三步檢驗(yàn)法”的標(biāo)準(zhǔn)排除合理使用規(guī)則的適用,追究使用者的侵權(quán)責(zé)任。
結(jié)? 語(yǔ)
版權(quán)與科學(xué)研究自由的沖突由來(lái)已久,其實(shí)質(zhì)是科技發(fā)展過(guò)程中版權(quán)人利益與公共利益的動(dòng)態(tài)博弈??萍甲粤⒆詮?qiáng)須要充分的科學(xué)研究自由作為保障,而維護(hù)版權(quán)人的利益亦是促進(jìn)社會(huì)文化和科學(xué)事業(yè)發(fā)展與繁榮的基石。TDM作為人工智能時(shí)代不可或缺的科研手段,對(duì)于實(shí)現(xiàn)我國(guó)人工智能戰(zhàn)略和促進(jìn)科技自立自強(qiáng)意義重大。豁免科學(xué)研究中的TDM版權(quán)責(zé)任,不會(huì)打破我國(guó)《憲法》和《著作權(quán)法》所設(shè)定的利益平衡,有利于實(shí)現(xiàn)科學(xué)研究自由,促進(jìn)TDM的應(yīng)用和發(fā)展。當(dāng)前,國(guó)際競(jìng)爭(zhēng)的主舞臺(tái)已轉(zhuǎn)移到科技領(lǐng)域。發(fā)達(dá)國(guó)家紛紛完善其版權(quán)制度,以實(shí)現(xiàn)其在人工智能領(lǐng)域的戰(zhàn)略布局。響應(yīng)十九屆五中全會(huì)的號(hào)召,加快建設(shè)科技強(qiáng)國(guó),完善科技創(chuàng)新體制機(jī)制,亟須謀求合理使用制度的更新和完善。
參考文獻(xiàn):
[1] 羅嬌,張曉林.支持文本與數(shù)據(jù)挖掘的著作權(quán)法律政策建議[J].中國(guó)圖書(shū)館學(xué)報(bào),2018,44(3):21?34.
[2] 何哲.通向人工智能時(shí)代——兼論美國(guó)人工智能戰(zhàn)略方向及對(duì)中國(guó)人工智能戰(zhàn)略的借鑒[J].電子政務(wù),2016(12):2?10.
[3] 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院.人工智能標(biāo)準(zhǔn)化白皮書(shū)[EB/OL].(2018?01?24)[2021?3?14].http://www.cesi.cn/images/editor/20180124/20180124135528742.pdf.
[4] 羅森林,馬俊,潘麗敏.數(shù)據(jù)挖掘理論與技術(shù)[M].北京:電子工業(yè)出版社,2013:17.
[5] European parliament.The Exception for Text and Data Mining (TDM) in the Proposed Directive on Copyright in the Digital Single Market ? Technical Aspects[EB/OL].[2021?3?14].https://www.europarl.europa.eu/RegData/etudes/BRIE/2018/604942/IPOL_BRI(2018)604942_EN.pdf.
[6] Maximising the benefits of Artificial Intelligence through future?proof rules on Text and Data Mining[EB/OL].(2018?04?09)[2021?3?14].https://eare.eu/assets/uploads/2018/03/OpenLetter?to?European?Commission?on?AI?and?TDM_9April2018.pdf.
[7] 吳漢東.著作權(quán)合理使用制度研究[M].北京:中國(guó)人民大學(xué)出版社,2020:236.
[8] EUR?Lex.Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC (Text with EEA relevance.)[EB/OL].(2019?05?17)[2021?3?14].https://eur?lex.europa.eu/legal?content/EN/TXT/HTML/?uri=CELEX:32019L0790&from=EN.
[9] Future TDM.Baseline report of policies and barriers of TDM in Europe[EB/OL].[2021?3?14].http://www.futuretdm.eu/knowledge?library/?b5?file=2374&b5?folder=2227.
[10] 黃欣榮.大數(shù)據(jù)時(shí)代的哲學(xué)變革[N]. 光明日?qǐng)?bào),2014?12?03(015).
[11] AI+大數(shù)據(jù),新冠肺炎知識(shí)智能服務(wù)應(yīng)用大揭秘[EB/OL].(2020?05?13)[2021?3?14].https://mp.weixin.qq.com/s/l5hKnZykGtMBdAyM6uG?jQ.
[12] 沈陽(yáng),李洪磊,陳杰.圖數(shù)據(jù)模型及其在疫情追溯領(lǐng)域的應(yīng)用研究[J].軟件導(dǎo)刊,2021,20(2):13?17.
[13] 張放,甘浩辰.疫情心理時(shí)空距離對(duì)公眾情緒的影響研究——基于新冠肺炎疫期微博文本面板數(shù)據(jù)的計(jì)算分析[J].新聞界,2020(6):39?49.
[14] 楊娟.文本與數(shù)據(jù)挖掘合理使用例外規(guī)范的體系化設(shè)置[J].圖書(shū)館論壇,2020,40(4):141?150.
[15] 王德志.論我國(guó)學(xué)術(shù)自由的憲法基礎(chǔ)[J].中國(guó)法學(xué),2012(5):5?23.
[16] Campbell, Victoria.Authors Guild v. Google, Inc. [J].DePaul Journal of Art, Technology and Intellectual Property Law, 2016,27(1):59?72.
[17] 李雨峰.論著作權(quán)的憲法基礎(chǔ)[J].法商研究,2006(4),112?120.
[18] European parliament.The Exception for Text and Data Mining (TDM) in the Proposed Directive on Copyright in the Digital Single Market ? Legal Aspects[EB/OL].[2021?3?14].https://www.europarl.europa.eu/RegData/etudes/IDAN/2018/604941/IPOL_IDA(2018)604941_EN.pdf.
[19] European commission.Communication from the Commission to the European Parliament,the Council,the European Economic and Social Committee and Committee of the Regions[EB/OL].[2021?3?14].http://ec.europa.eu/newsroom/dae/document.cfm?action=display&doc_id=12526.
[20] 阮開(kāi)欣.歐盟版權(quán)法下的文本與數(shù)據(jù)挖掘例外[J].圖書(shū)館論壇,2019,39(12):102?108.
[21] 李楊.著作權(quán)合理使用制度的體系構(gòu)造與司法互動(dòng)[J].法學(xué)評(píng)論,2020,38(4):88?97.
[22] 劉銀良.著作權(quán)法中的公眾使用權(quán)[J].中國(guó)社會(huì)科學(xué),2020(10):183?208.
[23] 高富平.數(shù)字時(shí)代的作品使用秩序——著作權(quán)法中“復(fù)制”的含義和作用[J].華東政法大學(xué)學(xué)報(bào),2013(4):134?149.
[24] Marco Caspers.A right to read for machines? Part I: The introduction[EB/OL].(2016?12?02)[2021?3?14].https://www.futuretdm.eu/blog/a?right?to?read?for?machines?part?i?the?introduction/.
The Construction of Copyright Exemption Rules for Text and Data Mining in the Era of Artificial Intelligence
Zhang Huibin, Xiao Qixian
(Civil and Commercial Law Department, Southwest University of Political Science and Law, Chongqing
401120, China)
Abstract: The freedom of scientific research is a fundamental right granted by China's Constitution, which guarantees that researchers are free from unnecessary restrictions in their scientific research, thus contributing to the development of science and technology. In the era of artificial intelligence, text and data mining, as a basic scientific research method, has become a new type of scientific research freedom. From the perspective of Chinese legal system, text and data mining is severely restricted by the copyright legal system, and there is a huge risk of copyright infringement. From the perspective of comparative law, exempting the copyright liability for text and data mining in scientific research is a trend in the development of copyright legal systems in various countries. Although the third revision of Copyright Law improved the fair use system and considered the needs of scientific research development to a certain extent, it was generally unable to meet the needs of the era of artificial intelligence. Referring to the provisions of Article 3 of the European Union's Copyright Directive of Digital Single Market (2019), the addition of "fair use of text and data mining for the purpose of scientific research" is of great significance to ensure the freedom of scientific research and to achieve science and technology self?reliance and artificial intelligence strategy in the era of artificial intelligence.
Key words: text and data mining; freedom of scientific research; fair use; revision of Copyright Law