唐思慧
大數(shù)據(jù)環(huán)境下文本和數(shù)據(jù)挖掘的版權(quán)例外研究
——以歐盟《DSM版權(quán)指令》提案為視角
唐思慧
大數(shù)據(jù)時(shí)代,文本和數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用打破版權(quán)法構(gòu)建的利益平衡機(jī)制,給我國(guó)著作權(quán)法帶來了挑戰(zhàn),亟需調(diào)整。美國(guó)的應(yīng)對(duì)是從默示許可轉(zhuǎn)到無條件例外規(guī)則,而歐盟《DSM版權(quán)指令》提案以義務(wù)式的模式規(guī)定了“科學(xué)研究領(lǐng)域的文本和數(shù)據(jù)挖掘”例外規(guī)則,對(duì)科研促進(jìn)及對(duì)版權(quán)保護(hù)力度適中,值得借鑒。我國(guó)著作權(quán)法修改應(yīng)制定“文本和數(shù)據(jù)挖掘合理使用規(guī)則”,嚴(yán)格限制適用條件,重構(gòu)利益平衡機(jī)制。
大數(shù)據(jù) 文本和數(shù)據(jù)挖掘 版權(quán)例外 利益平衡
大數(shù)據(jù)時(shí)代,數(shù)據(jù)的產(chǎn)生、收集、儲(chǔ)存日益規(guī)?;\(yùn)用文本和數(shù)據(jù)挖掘技術(shù)從海量數(shù)據(jù)中發(fā)掘有用信息成為數(shù)據(jù)產(chǎn)業(yè)乃至科技創(chuàng)新的重要支撐。而文本和數(shù)據(jù)挖掘涉及對(duì)大量受版權(quán)保護(hù)客體的復(fù)制、使用,這打破了版權(quán)法所構(gòu)建的利益平衡機(jī)制,亟需調(diào)整并應(yīng)對(duì)。歐美國(guó)家所采取的因應(yīng)措施值得借鑒。
文本和數(shù)據(jù)挖掘(Text and Data Mining,以下簡(jiǎn)稱TDM)是指從大量文本數(shù)據(jù)中發(fā)掘信息和知識(shí)的計(jì)算機(jī)處理技術(shù)。《歐盟數(shù)字化單一市場(chǎng)版權(quán)指令》提案(以下簡(jiǎn)稱《DSM版權(quán)指令》提案)將TDM定義為:“為了獲取模式、趨勢(shì)、相關(guān)關(guān)系等信息而對(duì)數(shù)字格式的文本與數(shù)據(jù)采取的任何自動(dòng)化分析手段。”也有認(rèn)為:“從機(jī)器的可讀資料中提取有價(jià)值信息的過程,涉及對(duì)資料的大量復(fù)制、數(shù)據(jù)的提取以及數(shù)據(jù)的整合,從而識(shí)別出特定模式?!弊鳛橐环N復(fù)雜的自動(dòng)化處理技術(shù),TDM包括多個(gè)階段的計(jì)算機(jī)技術(shù),初始階段如對(duì)文本數(shù)據(jù)的復(fù)制、提取,后續(xù)階段如對(duì)復(fù)制結(jié)果的處理、分析等,最終目的是發(fā)現(xiàn)規(guī)律或者趨勢(shì)。其流程為獲取信息來源、轉(zhuǎn)換數(shù)據(jù)格式、載入數(shù)據(jù)、分析數(shù)據(jù)、形成報(bào)告。①參見樊佳怡:《歐盟有關(guān)文本和數(shù)據(jù)挖掘的法律框架》,載《信息資源管理學(xué)報(bào)》2016年第1期,第12–16頁。
以往的知識(shí)發(fā)現(xiàn)過程建立在定量、采樣的數(shù)據(jù)基礎(chǔ)上,因此能做到對(duì)這些少量數(shù)據(jù)進(jìn)行精確分析。TDM技術(shù)則實(shí)現(xiàn)了從依靠少量的數(shù)據(jù)樣本到分析與事物相關(guān)的所有數(shù)據(jù),從追求精確性到接受數(shù)據(jù)的紛繁復(fù)雜,從探求難以捉摸的因果關(guān)系到關(guān)注事物間的相關(guān)關(guān)系。②參見[英]維克托?邁爾—舍恩伯格、肯尼思?庫克耶著:《大數(shù)據(jù)時(shí)代》,盛楊燕、周濤譯,浙江人民出版社2013年版,第29頁。TDM挖掘者利用自動(dòng)化手段對(duì)海量的文本、數(shù)據(jù)進(jìn)行復(fù)制、提取,將復(fù)制提取的結(jié)果(包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù))轉(zhuǎn)換成能夠被計(jì)算機(jī)處理的結(jié)構(gòu)化數(shù)據(jù),再進(jìn)行分類、比較、解析等,最終得到分析總結(jié)報(bào)告。
(一)大數(shù)據(jù)環(huán)境下TDM技術(shù)的特征
TDM技術(shù)作為大數(shù)據(jù)時(shí)代重要的分析工具,具有以下新特征。
第一,主體的特殊性。TDM需要利用自動(dòng)化技術(shù)(如網(wǎng)絡(luò)爬蟲,針對(duì)非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換技術(shù)等)對(duì)文本和數(shù)據(jù)進(jìn)行抓取、復(fù)制、處理、比較、分析,因此,挖掘主體需具備一定技術(shù)和物質(zhì)條件,一般以非自然人的組織機(jī)構(gòu)形式存在,如大學(xué)、圖書館或者其他研究機(jī)構(gòu)等。
第二,復(fù)制范圍廣泛。TDM結(jié)果的質(zhì)量很大程度上取決于采取樣本的范圍,傳統(tǒng)的采樣方式不再適應(yīng)于對(duì)海量數(shù)據(jù)的挖掘,TDM采用“樣本=總體”的全數(shù)據(jù)模式,利用自動(dòng)化技術(shù)能夠復(fù)制、提取所有與主題相關(guān)的文本數(shù)據(jù)。
第三,無法辨識(shí)被挖掘?qū)ο蟮臋?quán)利狀態(tài)。TDM作為自動(dòng)化技術(shù),只能根據(jù)人工設(shè)置的指令運(yùn)行,本身并不能主動(dòng)識(shí)別被挖掘?qū)ο蟮臋?quán)利狀態(tài),如享有版權(quán)的主體、被挖掘文本數(shù)據(jù)是否受版權(quán)保護(hù)等。
第四,挖掘結(jié)果具有巨大價(jià)值?!皵?shù)據(jù)就像一個(gè)神奇的鉆石礦,當(dāng)它的首要價(jià)值被發(fā)掘后仍然能不斷給予……絕大部分都隱藏在表面之下”③[英]維克托?邁爾—舍恩伯格、肯尼思?庫克耶著:《大數(shù)據(jù)時(shí)代》,盛楊燕、周濤譯,浙江人民出版社2013年版,第127頁。,數(shù)據(jù)的價(jià)值是“取之不盡,用之不竭”,而TDM就是發(fā)掘數(shù)據(jù)潛在價(jià)值的重要工具。通過自動(dòng)化技術(shù)能及時(shí)有效地實(shí)現(xiàn)對(duì)數(shù)據(jù)的重組利用、再利用,得到所需的模式、趨勢(shì)、相關(guān)關(guān)系等信息,這些在商業(yè)、科研、教學(xué)、社會(huì)管理中作用巨大。
(二)TDM技術(shù)對(duì)版權(quán)法的利益平衡機(jī)制的打破
互聯(lián)網(wǎng)的開放、交互、共享等特性使作品的傳播和獲取簡(jiǎn)易化、多樣化,使得“樣本=總體”的全數(shù)據(jù)模式成為可能,海量文本和數(shù)據(jù)通過TDM技術(shù)被復(fù)制和提取,其中存在大量受版權(quán)保護(hù)的客體,這面臨版權(quán)侵權(quán)的危險(xiǎn),主要問題有:
第一,TDM技術(shù)合法性存疑,易陷入侵權(quán)爭(zhēng)議。一方面,TDM受版權(quán)或數(shù)據(jù)庫權(quán)的限制,在大多數(shù)國(guó)家未制定相應(yīng)的版權(quán)例外規(guī)則的情況下,因TDM技術(shù)導(dǎo)致的糾紛,往往只能判斷其是否符合已有的版權(quán)例外規(guī)則。另一方面,關(guān)于合法訪問是否默許TDM行為,亦存在較大的爭(zhēng)議:以出版商為代表的權(quán)利人一方認(rèn)為機(jī)構(gòu)付費(fèi)訂閱的內(nèi)容只包括緩存、閱讀、打印以及在PDF文檔中進(jìn)行檢索的權(quán)利,而不包括文本和數(shù)據(jù)挖掘;以研究人員為代表的挖掘者一方認(rèn)為“有權(quán)閱讀即有權(quán)挖掘”,不需要權(quán)利人再授權(quán)。④Peter Murray-Rust, The Right To Read Is The Right To Mine[OL].[2017.2.21]. https://blog.okfn.org/2012/06/01/the-right-to-read-is-the-rightto-mine/.
TDM技術(shù)在基礎(chǔ)階段通過自動(dòng)化手段來完成對(duì)海量文本數(shù)據(jù)的復(fù)制提取。在對(duì)文本數(shù)據(jù)進(jìn)行復(fù)制提取時(shí),計(jì)算機(jī)無法識(shí)別挖掘?qū)ο蟮臋?quán)利狀態(tài);由于TDM技術(shù)的隱秘性,權(quán)利人往往難以知曉自己權(quán)利受到侵害;加之網(wǎng)絡(luò)技術(shù)的發(fā)達(dá)使得信息產(chǎn)生、傳播復(fù)雜化、多樣化,作品的權(quán)利主體難以確定;被復(fù)制對(duì)象的數(shù)量龐大,獲取權(quán)利人授權(quán)的成本高昂。這些因素使得挖掘者通常不經(jīng)過授權(quán)就對(duì)文本數(shù)據(jù)進(jìn)行挖掘,易陷入侵權(quán)爭(zhēng)議。
第二,市場(chǎng)和社會(huì)層面的利益沖突凸顯。在版權(quán)市場(chǎng)中,一方面,TDM技術(shù)涉及對(duì)作品、數(shù)據(jù)庫的復(fù)制、提取,權(quán)利人希望通過版權(quán)法來規(guī)制TDM,通過作品獲取更多利益;另一方面,作為挖掘者,在版權(quán)法未賦予TDM版權(quán)例外規(guī)則的情況下,版權(quán)保護(hù)則構(gòu)成實(shí)施TDM技術(shù)的障礙,而獲得權(quán)利人許可往往成本高、程序繁雜,挖掘者則希望盡量降低獲取、使用作品的成本。在社會(huì)層面上,在法律賦予TDM合法性之前,未經(jīng)授權(quán)進(jìn)行TDM意味著版權(quán)侵權(quán);而大數(shù)據(jù)時(shí)代,TDM技術(shù)將是科研創(chuàng)新的重要支撐,在其價(jià)值性日益凸顯的背景下,嚴(yán)格保護(hù)版權(quán)意味著TDM技術(shù)應(yīng)用的舉步維艱,私權(quán)保護(hù)和社會(huì)公共利益之間的沖突日益凸顯。
(三)TDM技術(shù)給我國(guó)著作權(quán)法帶來的挑戰(zhàn)
一般而言,實(shí)施TDM技術(shù)的主體通常為具備科學(xué)研究能力的科研機(jī)構(gòu),包括大學(xué)、公共圖書館等非營(yíng)利性法人或者其他非法人組織,也包括商業(yè)研究所、商業(yè)公司等營(yíng)利性法人;TDM技術(shù)挖掘的對(duì)象是包括作品在內(nèi)的海量數(shù)字文本內(nèi)容,TDM的初始階段涉及對(duì)作品的大量復(fù)制,后期涉及對(duì)作品、數(shù)據(jù)或信息的使用、分析與應(yīng)用。
我國(guó)《著作權(quán)法》第10條第1款第(五)項(xiàng)明確規(guī)定著作權(quán)人對(duì)其作品享有復(fù)制權(quán),并將復(fù)制定義為:以印刷、復(fù)印、拓印、錄音、錄像、翻錄、翻拍等方式將作品制作一份或者多份的行為。在未經(jīng)著作權(quán)人同意的情形下,利用TDM技術(shù)復(fù)制作品就構(gòu)成對(duì)復(fù)制權(quán)的侵犯。TDM技術(shù)所涉及的復(fù)制行為能否適用著作權(quán)法中的合理使用或者法定許可規(guī)則?《著作權(quán)法》《信息網(wǎng)絡(luò)傳播條例》中沒有明確規(guī)定TDM技術(shù)的著作權(quán)例外規(guī)則,涉及科學(xué)研究的例外制度分別是《著作權(quán)法》第22條的個(gè)人使用和科研教學(xué)使用(分別為該條第1款第(一)項(xiàng);第(六)項(xiàng))、《信息網(wǎng)絡(luò)傳播條例》第6條第3款,而法定許可并不涉及TDM技術(shù)。由于TDM的實(shí)施主體通常是有科研能力的研究機(jī)構(gòu),而個(gè)人使用的主體限于個(gè)人,或者擴(kuò)展到其家庭,⑤吳漢東著:《知識(shí)產(chǎn)權(quán)法》,法律出版社2014年版,第100頁。但不能擴(kuò)展到單位,因此個(gè)人合理使用不能適用于研究機(jī)構(gòu);TDM運(yùn)用自動(dòng)化手段,對(duì)大量文本數(shù)據(jù)進(jìn)行復(fù)制、提取,而科研教學(xué)使用將使用方式限制為“少量翻譯或者復(fù)制”和“提供少量”,因此科研教學(xué)使用條款也不能適用于TDM技術(shù)。
綜上,TDM不能適用合理使用或者法定許可規(guī)則,經(jīng)授權(quán)才能賦予研究機(jī)構(gòu)對(duì)作品進(jìn)行TDM的合法性。大數(shù)據(jù)環(huán)境下,TDM技術(shù)的普及、應(yīng)用引發(fā)的問題日益凸顯,亟需立法予以規(guī)制,作出前瞻性安排。歐美的因應(yīng)措施值得關(guān)注。
(一)美國(guó):從默示許可到無條件例外——以Google Books案為線索
Google Books項(xiàng)目是指谷歌公司將大學(xué)圖書館等提供的書籍掃描數(shù)字化,然后在互聯(lián)網(wǎng)上發(fā)布、向用戶提供書籍的電子檢索。Google Books項(xiàng)目通過復(fù)制紙質(zhì)或數(shù)字作品,形成數(shù)據(jù)庫,并建立“Google Books”搜索引擎,用戶通過輸入搜索關(guān)鍵詞或者短語,能夠得到數(shù)據(jù)庫里面包含關(guān)鍵詞或短語的所有書籍,以及這些詞語在每本書中出現(xiàn)的次數(shù)。谷歌公司在Google圖書館項(xiàng)目中使用“ngrams”搜索工具,向用戶提供幾個(gè)世紀(jì)以來詞語和短語的使用頻率的統(tǒng)計(jì)信息,用戶可以獲得不同時(shí)期、不同語言地區(qū)對(duì)相關(guān)詞語的使用頻率,從而辨別社會(huì)就某一主題的興趣變化;研究者還可以從大量谷歌掃描的圖書中搜索到“詞語頻率、句法模式和主題標(biāo)識(shí)”,從中發(fā)現(xiàn)術(shù)語、語法和文學(xué)風(fēng)格的變遷。從Google Books項(xiàng)目復(fù)制書籍,到提供檢索服務(wù),最后通過對(duì)用戶的歷史搜索記錄進(jìn)行統(tǒng)計(jì)分析,得出某個(gè)主題或者領(lǐng)域的變化趨勢(shì),構(gòu)成一個(gè)完整的TDM過程。
2005年9月,美國(guó)作家協(xié)會(huì)以及幾位作家對(duì)Google網(wǎng)站提起集體訴訟,要求谷歌公司賠償損失以及停止侵權(quán)。隨后,美國(guó)五大出版社向Google提起了停止侵害訴訟。雙方當(dāng)事人于2009年11月13日達(dá)成和解協(xié)議,即《Google Books和解協(xié)議》。該協(xié)議中,谷歌公司可以不經(jīng)版權(quán)人的事先授權(quán)而對(duì)受版權(quán)保護(hù)的圖書進(jìn)行數(shù)字化,并就其內(nèi)容對(duì)外提供檢索服務(wù),而版權(quán)人則可決定其圖書在線顯示內(nèi)容的多少和銷售價(jià)格的高低,并可決定是否將其圖書撤出谷歌數(shù)字圖書館。
顯然,《Google Books和解協(xié)議》中采取了“默示許可”規(guī)則,實(shí)質(zhì)上推定了權(quán)利人的事先授權(quán),文本和數(shù)據(jù)挖掘者可以跳過授權(quán)這一環(huán)節(jié)而對(duì)其文本內(nèi)容進(jìn)行復(fù)制、提取,權(quán)利人可獲得報(bào)酬以及隨時(shí)決定是否撤回其授權(quán)許可。然而該案后續(xù)的審理結(jié)果并未采納《Google Books和解協(xié)議》中的“默示許可”方案。
美國(guó)上訴法院于2015年10月16日作出判決,認(rèn)定Google Books項(xiàng)目屬于合理使用,案件被上訴到聯(lián)邦最高法院,聯(lián)邦最高法院于2016年維持原判。在上訴法院的判決中,法官根據(jù)《版權(quán)法》第107條合理使用規(guī)則予以綜合考量:(1)使用的目的和性質(zhì),包括是否具有商業(yè)性質(zhì)還是非營(yíng)利的教育目的;(2)享有版權(quán)的作品的性質(zhì);(3)與享有版權(quán)的作品整體相比所使用部分的數(shù)量和實(shí)質(zhì)性;(4)使用對(duì)享有版權(quán)的作品的潛在市場(chǎng)或價(jià)值的影響。最終認(rèn)定谷歌未經(jīng)授權(quán)對(duì)受版權(quán)保護(hù)著作加以數(shù)字化,設(shè)置搜索功能以及片段瀏覽功能屬于非侵權(quán)的合理使用行為,其復(fù)制的目的具備高度轉(zhuǎn)換性,文本僅作有限公開,其展示行為不會(huì)造成對(duì)原作品市場(chǎng)的替代,谷歌的商業(yè)性質(zhì)不能作為排除合理使用的正當(dāng)理由。
可見,在實(shí)踐中認(rèn)定TDM是否屬于合理使用時(shí),版權(quán)法并未規(guī)定具體的限制條件,而采用典型的因素主義,法官只需考量TDM行為是否符合四因素,這種認(rèn)定方式可稱為“無條件例外”模式。
(二)歐盟:有條件的版權(quán)例外
對(duì)文本和數(shù)據(jù)挖掘,也有在版權(quán)法中確立TDM版權(quán)例外制度,并嚴(yán)格限定其適用條件,可稱為“有條件例外”模式,這典型體現(xiàn)在歐盟的《DSM版權(quán)指令》提案中。2016年9月14日,歐盟委員會(huì)發(fā)布了《DSM版權(quán)指令》,提案以義務(wù)式的模式規(guī)定了“科學(xué)研究領(lǐng)域的文本和數(shù)據(jù)挖掘”例外。
1.歐盟TDM版權(quán)例外規(guī)則的艱難抉擇:基于比例性考察
歐盟現(xiàn)有的科學(xué)研究版權(quán)例外規(guī)則不適用于TDM,歐盟多樣的許可實(shí)踐產(chǎn)生不必要的交易費(fèi)用以及單一市場(chǎng)法律制度不統(tǒng)一,導(dǎo)致TDM在歐洲科研中發(fā)展速度緩慢。⑥《Commission Staff Working Document Impact Assessment on the Modernisation of EU Copyright rules》,p125.對(duì)此歐盟曾提出四種解決方案:方案一:增強(qiáng)行業(yè)自律舉措,而不改變歐盟法律框架;方案二:為非商業(yè)性科學(xué)研究制定TDM版權(quán)例外規(guī)則;方案三:針對(duì)公共利益研究組織進(jìn)行的非商業(yè)性或商業(yè)性科研制定TDM版權(quán)例外規(guī)則;方案四:針對(duì)任何合法訪問的主體(包括公共利益研究機(jī)構(gòu)和商業(yè)研究機(jī)構(gòu))進(jìn)行的商業(yè)目的或非商業(yè)目的科研制定TDM版權(quán)例外規(guī)則。
歐盟委員會(huì)將上述方案的效益、成本、對(duì)利益相關(guān)者的影響以及社會(huì)、基本權(quán)利的影響進(jìn)行了對(duì)比,如表1所示,其中(0)表示中性評(píng)價(jià)或者無影響,(+)表示有一定積極影響,(++)表示有較強(qiáng)積極影響,(–)表示有一定消極影響,(– –)表示有較強(qiáng)消極影響。
表1 歐盟解決TDM問題的四種方案對(duì)比
⑦ Public-Private-Partners,公私合作關(guān)系。
續(xù)表1
方案1主張不做立法調(diào)整,其余三種方案主張制定TDM版權(quán)例外規(guī)則,這三種方案主要在受益主體和科學(xué)研究目的方面存在差異:方案2和方案4的受益主體既包括商業(yè)性的研究機(jī)構(gòu)也包括公益研究機(jī)構(gòu),方案3只包括公共利益研究機(jī)構(gòu);方案2只允許非商業(yè)性的科學(xué)研究,而方案3和方案4允許商業(yè)性和非商業(yè)性的科學(xué)研究;方案3能夠有效保證TDM的法律確定性,降低研究人員的交易成本,對(duì)出版商的TDM許可市場(chǎng)的影響也比較小,而且出版商付出的合規(guī)成本也較少。而方案1不能保證TDM的合法性,方案2不能確保PPPs項(xiàng)目中TDM的合法性,方案4給權(quán)利人帶來高昂的成本同時(shí)還嚴(yán)重影響TDM許可市場(chǎng)。因而歐盟提案最終采用方案3,以期達(dá)到最佳利益平衡。
2.歐盟TDM版權(quán)例外規(guī)則的具體內(nèi)容
《DSM版權(quán)指令》第3條⑧《DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》Article 3:1. Member States shall provide for an exception to the rights provided for in Article 2 of Directive 2001/29/EC, Articles 5(a) and 7(1) of Directive 96/9/EC and Article 11(1) of this Directive for reproductions and extractions made by research organizations in order to carry out text and data mining of works or other subject-matter to which they have lawful access for the purposes of scienti fic research.2. Any contractual provision contrary to the exception provided for in paragraph 1 shall be unenforceable.3. Rightholders shall be allowed to apply measures to ensure the security and integrity of the networks and databases where the works or other subject-matter are hosted. Such measures shall not go beyond what is necessary to achieve that objective.4. Member States shall encourage rightholders and research organizations to de fine commonly-agreed best practices concerning the application of the measures referred to in paragraph 3.明確了文本和數(shù)據(jù)挖掘的版權(quán)例外規(guī)則,以義務(wù)式的模式規(guī)定成員國(guó)須在國(guó)內(nèi)法進(jìn)行轉(zhuǎn)化,“成員國(guó)應(yīng)對(duì)第2001/29/EC號(hào)指令第2條,第96/9/EC號(hào)指令第5(a)和7(1)條和本指令第11(1)條規(guī)定的權(quán)利作出例外規(guī)定:研究機(jī)構(gòu)以科學(xué)研究目的,為了對(duì)合法訪問的作品或其他客體進(jìn)行文本和數(shù)據(jù)挖掘,可以采取復(fù)制和提取行為?!逼錁?gòu)成要件為:
(1)行為主體:公共利益研究機(jī)構(gòu)?!禗SM版權(quán)指令》提案第1條將其定義為:大學(xué)、研究所或者其首要目標(biāo)是開展科學(xué)研究或提供教育服務(wù)的組織。此類研究機(jī)構(gòu)必須基于非營(yíng)利性目的而研究或?qū)⑵淅麧?rùn)再投資于科研活動(dòng)中,或者為了完成公益項(xiàng)目而進(jìn)行研究。⑨《DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》Article 1:(1) ‘research organisation’ means a university, a research institute or any other organisation the primary goal of which is to conduct scientific research or to conduct scientific research and provide educational services:(a) on a non-for-profit basis or by reinvesting all the profits in its scientific research; or(b) pursuant to a public interest mission recognised by a Member State; in such a way that the access to the results generated by the scientific research cannot be enjoyed on a preferential basis by an undertaking exercising a decisive influence upon such organisation.此項(xiàng)例外主要目的是為了促進(jìn)科學(xué)研究,原文將科學(xué)研究、教育服務(wù)用“and”相連接。本文認(rèn)為僅提供教育服務(wù)的機(jī)構(gòu)不屬于這里的研究機(jī)構(gòu),因?yàn)椤禗SM指令》第4條已單獨(dú)針對(duì)教育服務(wù)規(guī)定了“在數(shù)字和跨境教學(xué)活動(dòng)中使用作品和其他客體”的版權(quán)例外條款。
(2)行為目的:科學(xué)研究目的,包括商業(yè)性和非商業(yè)性的科學(xué)研究。歐盟在議定文本和數(shù)據(jù)挖掘時(shí),曾提出三種方案:僅允許非商業(yè)性科學(xué)研究目的;允許非商業(yè)性和商業(yè)性科學(xué)研究目的,但限制商業(yè)性科學(xué)研究受益人的范圍;允許非商業(yè)性和商業(yè)性科學(xué)研究,不限制受益人范圍。歐盟最終優(yōu)選第二種方案。
科學(xué)研究目的包括非商業(yè)性研究和商業(yè)性研究。該項(xiàng)例外條款的適用主體為公共利益研究機(jī)構(gòu);公共利益研究機(jī)構(gòu)進(jìn)行商業(yè)性研究,既可獨(dú)立完成,也可通過PPPs框架完成,但研究機(jī)構(gòu)必須將商業(yè)利潤(rùn)再投資于科研活動(dòng)中。
(3)行為方式:“reproductions and extractions”明確研究機(jī)構(gòu)的行為方式為復(fù)制和提取。但這些行為只是文本和數(shù)據(jù)挖掘的基礎(chǔ)階段,其后續(xù)階段還包括對(duì)復(fù)制、提取結(jié)果的轉(zhuǎn)化、處理以及分析等,這些后續(xù)階段的行為是否仍然能夠適用TDM版權(quán)例外規(guī)則?若不能適用,那么后續(xù)階段的處理、分析行為是否受到改編、匯編、翻譯等權(quán)利的限制呢?若研究機(jī)構(gòu)進(jìn)行復(fù)制、提取之后,并未將其結(jié)果用于TDM,那么此時(shí)能否繼續(xù)適用TDM版權(quán)例外規(guī)則?
本文認(rèn)為,條文中既然僅明確復(fù)制和提取行為的合法性,那么例外規(guī)則就不能適用于TDM的后續(xù)階段。在TDM的后續(xù)階段將復(fù)制提取結(jié)果轉(zhuǎn)換成結(jié)構(gòu)化的數(shù)據(jù),再對(duì)其進(jìn)行分類、比較、解析等,最終得到全新的內(nèi)容,并不能體現(xiàn)出原有作品或數(shù)據(jù)庫的內(nèi)容或者表達(dá)方式,因此TDM后續(xù)階段不涉及對(duì)作品或數(shù)據(jù)庫的演繹、匯編。研究機(jī)構(gòu)只能將復(fù)制提取的結(jié)果用于TDM,若是將復(fù)制提取的結(jié)果作其它用途,就不受TDM版權(quán)例外規(guī)則的保護(hù)。
(4)行為對(duì)象:合法訪問的作品或者數(shù)據(jù)庫。此處的合法訪問包括經(jīng)過權(quán)利人的授權(quán)⑩如果授權(quán)范圍已經(jīng)包括對(duì)文本內(nèi)容的復(fù)制,則不必適用TDM版權(quán)例外規(guī)則,若授權(quán)范圍不明確或者權(quán)利人禁止復(fù)制,才可能適用例外規(guī)則?;蛘咴L問內(nèi)容對(duì)外公開。條文否定了“有權(quán)閱讀就有權(quán)挖掘”這個(gè)命題,因?yàn)檠芯繖C(jī)構(gòu)合法訪問之后就已經(jīng)獲得了閱讀的權(quán)利,但仍需要通過TDM版權(quán)例外來賦予復(fù)制和提取行為合法性,就說明有權(quán)閱讀并不代表有權(quán)挖掘。
(5)限制的權(quán)利:對(duì)作品的復(fù)制權(quán)、對(duì)數(shù)據(jù)庫的全部或部分的復(fù)制權(quán)、防止對(duì)數(shù)據(jù)庫內(nèi)容的全部或經(jīng)定性或定量證明為實(shí)質(zhì)部分進(jìn)行擷取權(quán)利、新聞出版物的出版者的復(fù)制權(quán)。
(6)與合同的關(guān)系:該項(xiàng)例外規(guī)定是強(qiáng)制性例外,任何違反例外規(guī)定的合同條款都無效,在歐盟的現(xiàn)有版權(quán)許可市場(chǎng)中,版權(quán)人往往在許可合同條款中排除例外規(guī)則的適用,[11]《Proposal for a DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》,p117.而《DSM版權(quán)指令》提案一旦通過,意味著此類合同條款無效,這能夠保障TDM例外規(guī)則的有效實(shí)施。
(7)對(duì)權(quán)利人的保護(hù):權(quán)利人可以采取必要措施,確保承載作品或其他客體的網(wǎng)絡(luò)和數(shù)據(jù)庫的安全性和完整性,而且權(quán)利人和研究機(jī)構(gòu)可以共同協(xié)商采取最佳措施,這項(xiàng)規(guī)定能夠有效防止他人惡意破壞網(wǎng)絡(luò)或數(shù)據(jù)庫。
采用“有條件例外”模式的還有英國(guó)2014年最新版權(quán)法修改案,其增設(shè)了文本與數(shù)據(jù)分析的例外條款,在原條文“科學(xué)研究與個(gè)人學(xué)習(xí)的例外”條款之下增設(shè)了第29A條,“用于非商業(yè)性科學(xué)研究的文本與數(shù)據(jù)分析所需的復(fù)制”[12]《Copyright, Designs and Patents Act 1988》,29A Copies for text and data analysis for non-commercial research:(1) The making of a copy of a work by a person who has lawful access to the work does not infringe copyright in the work provided that—(a) the copy is made in order that a person who has lawful access to the work may carry out a computational analysis of anything recorded in the work for the sole purpose of research for a non-commercial purpose, and(b) the copy is accompanied by a sufficient acknowledgement (unless this would be impossible for reasons of practicality or otherwise).,在明確文本和數(shù)據(jù)挖掘行為合法性的同時(shí),限制其適用條件為非商業(yè)性的科學(xué)研究?!缎录悠掳鏅?quán)法》公眾征求意見稿也規(guī)定了TDM例外規(guī)則。
比較而言,“默示許可”的成本高、對(duì)科研活動(dòng)的促進(jìn)作用較低,權(quán)利人仍能控制文本內(nèi)容;“無條件例外”模式成本最低,版權(quán)保護(hù)力度最弱,但易導(dǎo)致例外規(guī)則的濫用及盜版內(nèi)容泛濫,對(duì)科研活動(dòng)的作用未知;“有條件例外”模式中,成本、對(duì)科研的促進(jìn)及對(duì)版權(quán)的保護(hù)力度都處居中位置。
在著作權(quán)領(lǐng)域,作品載體不再局限于紙質(zhì)文檔、光盤或CD,作品的數(shù)字化、電子化日益普遍且方興未艾。TDM技術(shù)能實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的獲取、處理和分析,其帶來版權(quán)保護(hù)問題亟需法律調(diào)整。
(一)TDM著作權(quán)例外規(guī)則的模式選擇:基于利益平衡的分析
1.應(yīng)對(duì)TDM的可選方案
結(jié)合國(guó)際最新立法與司法實(shí)踐,我國(guó)可采用以下方案:“默示許可”方案、“解釋兜底條款”及“制定TDM合理使用規(guī)則”。
默示許可是指作品使用人雖然沒有得到著作權(quán)人的明示授權(quán),但是通過著作權(quán)人的行為可以推定著作權(quán)人不排斥他人對(duì)其作品進(jìn)行利用,作為一種補(bǔ)償,使用人應(yīng)當(dāng)向著作權(quán)人支付報(bào)酬的一種著作權(quán)許可使用方式。[13]馮曉青、鄧永澤:《數(shù)字網(wǎng)絡(luò)環(huán)境下著作權(quán)默示許可制度研究》,載《南都學(xué)壇》2014年第5期。,較之傳統(tǒng)授權(quán)模式,默示許可交易成本更低、程序更簡(jiǎn)捷,也能夠有效保護(hù)著作權(quán)。盡管如此,當(dāng)著作權(quán)人真實(shí)意思與此相反時(shí),復(fù)制和提取行為實(shí)質(zhì)上是對(duì)著作權(quán)的侵犯,而著作權(quán)人一旦撤回授權(quán),復(fù)制和提取結(jié)果就不能繼續(xù)使用。同時(shí),依照默示許可,復(fù)制和提取者應(yīng)向著作權(quán)人支付報(bào)酬,商業(yè)性研究主體和非商業(yè)性研究主體所承受的經(jīng)濟(jì)壓力差異明顯。
“解釋兜底條款”體現(xiàn)在《著作權(quán)法》第三次修改送審稿中,其第43條第1款第(十三)項(xiàng)增加了“其他情形”,第2款則增加了“以前款規(guī)定的方式使用作品,不得影響作品的正常使用,也不得不合理地?fù)p害著作權(quán)人的合法利益”,即三步檢驗(yàn)標(biāo)準(zhǔn)。送審稿中并未出現(xiàn)TDM例外條款,因此,可根據(jù)三步檢驗(yàn)標(biāo)準(zhǔn),對(duì)兜底條款進(jìn)行解釋。雖然解釋兜底條款具有一定的靈活性,卻增加了不確定性,在認(rèn)定TDM是否侵權(quán)時(shí),缺乏明確統(tǒng)一的標(biāo)準(zhǔn),導(dǎo)致司法實(shí)踐不統(tǒng)一,不利于著作權(quán)的保護(hù)。
制定“TDM合理使用規(guī)則”路徑則沿襲了我國(guó)著作權(quán)限制條款的立法模式,在賦予TDM合法性的同時(shí),嚴(yán)格限制其適用條件,如主體、目的等。適當(dāng)?shù)睦庖?guī)則能夠?qū)崿F(xiàn)TDM的確定性,防止例外規(guī)則的濫用;既不會(huì)過度損害著作權(quán),也能促進(jìn)科學(xué)研究,充分考慮了權(quán)利人和科研機(jī)構(gòu)、著作權(quán)人和社會(huì)公眾之間的利益平衡。
2. TDM著作權(quán)例外規(guī)則的利益平衡
TDM例外規(guī)則是利益平衡原則的體現(xiàn),在權(quán)利人與研究機(jī)構(gòu)之間、私人利益和社會(huì)公益之間形成新的利益平衡點(diǎn)。在著作權(quán)人和科研機(jī)構(gòu)之間,既要保護(hù)著作權(quán)人的正當(dāng)權(quán)益,也要賦予科研機(jī)構(gòu)利用TDM技術(shù)對(duì)作品進(jìn)行復(fù)制的合法性。因此,需要在復(fù)制權(quán)的保護(hù)范圍上打開一道缺口,而這道缺口僅針對(duì)有限的主體——即滿足特定條件的科研機(jī)構(gòu)——開放,科研機(jī)構(gòu)的復(fù)制行為不能給著作權(quán)人造成巨大損失,同時(shí)也要衡量其進(jìn)行TDM的正當(dāng)性,而衡量的標(biāo)準(zhǔn)就是社會(huì)公益。
大數(shù)據(jù)環(huán)境下,TDM技術(shù)擴(kuò)大了研究機(jī)構(gòu)對(duì)他人作品的復(fù)制范圍和數(shù)量,以更為便捷的方式實(shí)現(xiàn)了對(duì)海量數(shù)據(jù)的價(jià)值發(fā)掘,有利于推動(dòng)科研創(chuàng)新,但此類復(fù)制仍在復(fù)制權(quán)的保護(hù)范圍之內(nèi),著作權(quán)人專有權(quán)與社會(huì)公益之間失衡。一方面,著作權(quán)是私權(quán),在私權(quán)領(lǐng)域,權(quán)利人的利益是第一位的,法律不能對(duì)私權(quán)人過多限制,以免抑制作品的創(chuàng)作;另一方面,科學(xué)研究能夠帶來技術(shù)的進(jìn)步、文化的繁榮,考慮到社會(huì)公益,保障社眾能夠接近作品,著作權(quán)人應(yīng)將其權(quán)利讓渡一部分,讓渡這部分權(quán)利不至于過度減損著作權(quán),也足以實(shí)現(xiàn)社會(huì)公益。
(二)TDM著作權(quán)例外規(guī)則的具體立法
1.適用主體為非營(yíng)利性研究機(jī)構(gòu)
考慮到權(quán)利人的利益,不應(yīng)將主體范圍無限擴(kuò)大;社會(huì)公益是合理使用規(guī)則確立的初衷,而商業(yè)性主體的首要目的是為了賺取利潤(rùn),因此應(yīng)當(dāng)將其排除在外;我國(guó)民法典的編纂工作已經(jīng)啟動(dòng),民法總則將法人分為營(yíng)利法人、非營(yíng)利法人以及特殊法人,將非營(yíng)利法人定義為:“為公益目的或者其他非營(yíng)利目的成立,不向其出資人或者設(shè)立人分配所取得利潤(rùn)的法人”??梢詫DM例外規(guī)則的適用主體限制為非營(yíng)利性的研究機(jī)構(gòu),非營(yíng)利性則援引民法總則關(guān)于非營(yíng)利法人的定義。
2.限制行為方式為復(fù)制
應(yīng)考慮TDM技術(shù)的特點(diǎn),賦予基于TDM所實(shí)施的復(fù)制行為的合法性。利用其它手段對(duì)作品進(jìn)行復(fù)制則不受例外條款的保護(hù),而且復(fù)制的結(jié)果只能用于實(shí)現(xiàn)文本和數(shù)據(jù)挖掘,研究機(jī)構(gòu)不能將復(fù)制的結(jié)果提供(包括但不限于轉(zhuǎn)讓、向公眾公開等方式)給其他不受例外規(guī)則保護(hù)的主體,否則構(gòu)成對(duì)作品的侵權(quán)。
3.排除商業(yè)性科學(xué)研究
應(yīng)考慮權(quán)利人和社會(huì)公眾的利益平衡,科研機(jī)構(gòu)進(jìn)行TDM的目的是為社會(huì)公益,而非賺取利潤(rùn);若允許商業(yè)性的科學(xué)研究,著作權(quán)人就相當(dāng)于為商業(yè)性主體做了嫁衣,所以,應(yīng)當(dāng)將其行為目的限制為非商業(yè)性的科學(xué)研究。此目的將禁止非營(yíng)利研究機(jī)構(gòu)和商業(yè)公司合作,杜絕商業(yè)公司通過該條款搭便車的可能。
4. TDM結(jié)果可以免費(fèi)對(duì)外公開
TDM結(jié)果是否可以對(duì)外公開,需要考慮兩點(diǎn)因素:(1)TDM結(jié)果的公開行為是否受到著作權(quán)限制。誠(chéng)如上言,TDM的后續(xù)階段不涉及對(duì)著作權(quán)人作品的演繹、匯編等,其結(jié)果不能體現(xiàn)原作品的表達(dá)方式,因此TDM結(jié)果的公開不受著作權(quán)限制;(2)TDM結(jié)果的公開是否具備商業(yè)目的。合理使用條款只適用于非商業(yè)性的科學(xué)研究,如果研究機(jī)構(gòu)最終將TDM結(jié)果作商業(yè)性使用,則不能獲得合理使用條款的保護(hù),在TDM的復(fù)制階段,研究機(jī)構(gòu)就已經(jīng)構(gòu)成侵權(quán)。因此,TDM結(jié)果可以免費(fèi)公開,但不得作商業(yè)性用途。
5.不適用于未發(fā)表的作品
在確定行為對(duì)象時(shí),應(yīng)將未發(fā)表的作品排除在外。我國(guó)著作權(quán)取得方式為自動(dòng)取得,即作者完成作品的創(chuàng)作就享有著作權(quán),不以發(fā)表為權(quán)利取得要件。作者未發(fā)表其作品之前,著作權(quán)處于被作者絕對(duì)控制的狀態(tài),科研機(jī)構(gòu)不得根據(jù)例外規(guī)則對(duì)此類作品進(jìn)行復(fù)制。
綜上,我國(guó)著作權(quán)法應(yīng)當(dāng)在“權(quán)利的限制”一章中增加TDM合理使用條款,在《〈中華人民共和國(guó)著作權(quán)法〉修改草案送審稿》第43條規(guī)定增加一項(xiàng),規(guī)定“TDM合理使用”條款,將原第(十三)項(xiàng)“其他情形”推后為第(十四)項(xiàng),具體規(guī)定為:
第四十三條 在下列情況下使用作品,可以不經(jīng)著作權(quán)人許可,不向其支付報(bào)酬,但應(yīng)當(dāng)指明作者姓名或者名稱、作品名稱、作品出處,并且不得侵犯著作權(quán)人依照本法享有的其他權(quán)利:
……
(十三)非營(yíng)利性的研究機(jī)構(gòu)以非商業(yè)科學(xué)研究為目的,利用文本和數(shù)據(jù)挖掘技術(shù)對(duì)他人已發(fā)表的作品進(jìn)行復(fù)制,但不得將復(fù)制結(jié)果向他人提供,也不得將挖掘結(jié)果作商業(yè)用途;
(十四)其他情形。
In the era of big data, the extensive application of text and data mining technology breaks the interest balance mechanism created by copyright law, which brings challenges to the copyright law of China and calls for urgent adjustment. The United States changes the implied license to the unconditional exception rules,while the Proposal for a Directive of the European Parliament and of the Council on Copyright in the Digital Single Market proposes an obligation model to specify “the exception rules of text and data mining in the field of scientific research.” It is worthwhile to draw attention to the promotion of scientific research and the moderate copyright protection. The revision of the Copyright Law in China should formulate the rules for the rational use of text and data mining, strictly restrict the applicable conditions and reconstruct the interests balance mechanism.
big data; text and data mining; copyright exception; interest balance
唐思慧,湘潭大學(xué)公共管理學(xué)院副教授,管理學(xué)博士,碩士生導(dǎo)師,“法治湖南建設(shè)與區(qū)域社會(huì)治理協(xié)同創(chuàng)新中心”研究員