劉 靜,羽肖曼,陳雪飛,章 岑,黃金霞(中國科學院文獻情報中心,北京 100190)
圖書館開放期刊再利用中的權(quán)益問題研究
劉靜,羽肖曼,陳雪飛,章岑,黃金霞
(中國科學院文獻情報中心,北京 100190)
開放期刊再利用過程中存在一系列權(quán)益問題,包括機器采集、本地存儲、具體再利用方式合理性缺乏依據(jù)等,源于相關(guān)主體權(quán)益關(guān)系中的沖突。這些相關(guān)主體包括作者、出版商、再利用者、資助機構(gòu)、行業(yè)組織等?;跈?quán)益關(guān)系的分析,提出圖書館開放期刊再利用全流程,包括期刊采集、存儲、組織及再利用服務(wù)、數(shù)據(jù)調(diào)用等環(huán)節(jié)面臨的主要權(quán)益問題和對應(yīng)的解決方法。
開放期刊;權(quán)益;圖書館;開放資源
開放期刊,又稱“開放獲取期刊(Open Access Journal)”,是指在期刊論文正式發(fā)表時或在發(fā)表后一段時間內(nèi),通過使用許可的方式,允許任何人出于任何合理目的自由地通過互聯(lián)網(wǎng)免費使用期刊的全文內(nèi)容[1]。自20世紀90年代末以來,學術(shù)期刊的開放獲取得到來自各國政府、科研資助機構(gòu)、出版界、圖書館界的聯(lián)合推動,開放期刊數(shù)量規(guī)模不斷增長,目前,DOAJ開放期刊目錄中登記的開放期刊已超過10000種。同時,開放期刊再利用也成為當前圖書館建設(shè)和服務(wù)的重要組成部分。然而,隨著開放資源利用程度的加深和服務(wù)方式的拓展,特別是從元數(shù)據(jù)級向全文,甚至是數(shù)據(jù)級的利用,圖書館資源建設(shè)工作遇到了許多困惑,如資源的本地存儲是否合理,直接通過網(wǎng)頁采集數(shù)據(jù)是否仍存在賬號被封的風險,深度再利用是否存在法律風險等。在傳統(tǒng)版權(quán)環(huán)境下,圖書館在著作權(quán)問題處理方面已經(jīng)有了較深入的理論研究和實踐積累,但對于開放期刊再利用還缺少相應(yīng)的權(quán)益管理方案。針對這一問題,本文對開放期刊再利用過程中的權(quán)益問題進行研究,分析其產(chǎn)生背景、開放期刊再利用可能涉及的權(quán)益主體及其訴求。在此基礎(chǔ)上,思考和分析圖書館開放期刊再利用中的權(quán)益問題和破解方法。下文將圍繞上述問題展開詳細論述。
作為代表公眾利益的信息服務(wù)機構(gòu),如何平衡版權(quán)人利益和公眾獲取信息的權(quán)利一直是圖書館工作的重要內(nèi)容之一。國內(nèi)學者對傳統(tǒng)版權(quán)環(huán)境下的數(shù)據(jù)庫商與圖書館的關(guān)系[2]、國外數(shù)據(jù)庫商業(yè)版權(quán)模式與圖書館應(yīng)對對策[3]、著作權(quán)法中合理使用制度對圖書館的影響[4]等問題進行過深入的研究。對于開放獲取資源,作者通過使用許可協(xié)議,有效解決了版權(quán)保護和資源再利用間的矛盾。那么圖書館對開放期刊再利用,還存在權(quán)益問題嗎?答案是肯定的。本文認為開放期刊再利用權(quán)益問題的產(chǎn)生主要有以下幾方面的原因:
(1)開放獲取政策、使用許可等對于具體再利用方式的合理性缺乏規(guī)定
以開放期刊為代表的開放資源的再利用方式不斷更新,但現(xiàn)有的資源使用許可協(xié)議、開放獲取政策等缺乏對具體再利用行為合理性的規(guī)定。例如SPARC質(zhì)疑2014年美國能源辦公室公布的“DOE資助的研究開放獲取計劃”,認為它沒有闡述公眾需要的再利用權(quán)利,如批量下載、文本挖掘等[5]。
(2)使用許可協(xié)議本身仍處在發(fā)展變化中
目前針對開放資源的使用許可協(xié)議數(shù)量越來越多,包括知識共享協(xié)議(CC協(xié)議)、STM的New Model Licenses等;同時,它們的更新速度不斷加快。例如,開放期刊領(lǐng)域當前使用最廣泛的CC協(xié)議,自2002年發(fā)布至今,十多年間,已經(jīng)先后4次對協(xié)議條款進行調(diào)整更新,平均每隔2-3年就會推出一個新的版本,目前已更新到4.0版[6]。這會造成不同的開放期刊遵循的使用協(xié)議和版權(quán)規(guī)定不統(tǒng)一;同一本期刊中不同論文的使用許可不一致。許可協(xié)議的不一致,給圖書館開放期刊再利用造成一定障礙。
(3)圖書館對開放期刊再利用涉及多個環(huán)節(jié),需要處理復雜權(quán)益關(guān)系
圖書館的開放期刊再利用是一項復雜的系統(tǒng)工作,涉及期刊內(nèi)容采集、組織加工、提供服務(wù)等多個環(huán)節(jié),需要處理同多種主體的權(quán)益關(guān)系,包括圖書館同論文版權(quán)人的關(guān)系,數(shù)據(jù)采集、存儲過程中與出版商的關(guān)系,圖書館與用戶間的關(guān)系。而依靠開放獲取使用許可不能解決上述所有問題。以出版商對數(shù)據(jù)庫的保護為例,目前各國對數(shù)據(jù)庫保護適用的法律不同,歐盟的《數(shù)據(jù)庫保護指令》對數(shù)據(jù)庫實行比較嚴格的保護[7];美國在司法實踐中,采用多法結(jié)合的模式對數(shù)據(jù)庫使用中的侵權(quán)利行為進行判斷[8];中國則通過《信息網(wǎng)絡(luò)傳播條例》《反不正當競爭法》等法律對數(shù)據(jù)庫創(chuàng)建者予以保護。因此,圖書館對開放期刊采集工作涉及出版商對數(shù)據(jù)庫擁有的權(quán)益,需要考慮各國的法律規(guī)定。
3.1 開放期刊再利用中涉及的權(quán)益主體及其訴求
開放期刊一般會經(jīng)歷創(chuàng)作、資助、發(fā)表、他人對作品的使用等階段,這其中涉及的主體及其訴求,都影響著開放期刊的再利用,成為開放期刊再利用權(quán)益關(guān)系中的一部分。開放期刊論文的創(chuàng)作過程主要涉及作者、資助機構(gòu)兩類主體:作者對創(chuàng)作內(nèi)容擁有版權(quán);資助機構(gòu)通過開放獲取政策,對出版商施加影響,促使研究者選擇特定使用協(xié)議。論文發(fā)表過程,主要涉及作者和出版商兩類主體:作者保留版權(quán)而將發(fā)表權(quán)轉(zhuǎn)移給出版商[9];出版商根據(jù)資助機構(gòu)政策等,提供使用許可供作者選擇。期刊內(nèi)容的再利用過程,涉及的主體包括任何利用開放期刊的個人或機構(gòu)。同時一些行業(yè)組織、學術(shù)協(xié)會[10]等積極推動開放獲取,也對開放期刊的再利用產(chǎn)生重要影響,因此他們也是開放期刊再利用活動中的重要主體。綜上所述,開放期刊再利用活動涉及的主體包括作者、出版者、資助機構(gòu)、再利用者、其他主體,各主體間的關(guān)系如圖1所示。
圖1 開放期刊再利用中的主體及其相互關(guān)系示意圖
(1)作者和再利用者通過開放獲取定義、使用許可協(xié)議等體現(xiàn)其權(quán)益主張
布達佩斯開放獲取計劃,賦予了用戶對開放獲取資源自由獲取、復制、檢索、鏈接、傳播等方面的權(quán)利,不受技術(shù)、法律方面的障礙;但使用者應(yīng)充分尊重作者版權(quán),包括署名權(quán)和保證作品完整性,具體表現(xiàn)在遵循作品的使用許可。因此使用許可協(xié)議選擇體現(xiàn)了作者的權(quán)益主張。當前開放期刊主要采用的CC協(xié)議共提供6種組合,對演繹、匯編、發(fā)行、公開傳播、復制等再利用行為進行規(guī)定,具體內(nèi)容如表1所示[11]。
(2)出版商通過提供使用許可選擇方案或網(wǎng)站使用政策體現(xiàn)其權(quán)益主張
對于開放期刊,出版商不再要求作者轉(zhuǎn)移版權(quán),而是通過“提供使用許可協(xié)議供作者選擇”和“制定網(wǎng)站使用政策”等方式體現(xiàn)其在開放獲取環(huán)境下的權(quán)益主張。
本文通過對Springer、Elsevier、Nature Publishing Group、OXFORD、BMJ、Hindawi、PLOS、Medknow 等8家出版社的調(diào)研發(fā)現(xiàn):首先,出版商對平臺中開放獲取作品的使用協(xié)議都有明確的規(guī)定。所有出版商都采用 CC協(xié)議,并且趨向于CC BY,例如Springer、BMC、PLOS都規(guī)定該社出版所有開放獲取論文遵循CC BY協(xié)議;Nature Publishing Group已將所有期刊的使用許可協(xié)議統(tǒng)一至CC BY協(xié)議。但并非所有出版商都一致采用開放程度較高的CC BY協(xié)議,例如Wiley、BMJ規(guī)定只有英國研究理事會(RCUK)和惠康基金會(Wellcome Trust)資助的論文采用CC BY,其他的則不允許商業(yè)性再利用。但針對具體的再利用行為,大部分出版商只說明按照CC協(xié)議規(guī)定即可,只有Elsevier對CC協(xié)議下可實施的行為作出解讀。
表1 CC協(xié)議對版權(quán)作品再利用方式的規(guī)定
圖2 Elsevier對CC協(xié)議再利用方式的解讀
其次,網(wǎng)站使用政策方面。①大部分出版社有完善的網(wǎng)站使用條款和政策,對網(wǎng)站內(nèi)容和設(shè)計的版權(quán)、鏈接、下載等方面作出了明確的規(guī)定。例如Elsevier在網(wǎng)站的“Terms and Conditions”規(guī)定,所有網(wǎng)站內(nèi)容,包括文本、圖像、用戶接口、可視化接口、攝影、商標、標志、視頻、應(yīng)用代碼等,包括但不限于設(shè)計和內(nèi)容安排都由Elsevier和它們各自的許可人所有,受到版權(quán)法、商標法和其他知識產(chǎn)權(quán)法和反不正當競爭法的保護。②所有網(wǎng)站都通過Robots協(xié)議限制了搜索引擎對網(wǎng)站的抓取。此外Elsevier明確規(guī)定,除非經(jīng)過Elsevier授權(quán),否則不能使用任何機器、爬蟲軟件或自動下載的程序、算法、設(shè)備等,連續(xù)批量搜索、抓取、深度鏈接任何內(nèi)容。如果網(wǎng)站包含機器抓取限制文件,需要遵守相關(guān)規(guī)定;PLOS規(guī)定,要合理使用API,但任何行為,不應(yīng)給網(wǎng)站的服務(wù)器帶來負擔。
注:Robots協(xié)議是一種行業(yè)慣例,目的是規(guī)范搜索引擎的行為,是一種存放于網(wǎng)站根目錄下的ASCII編碼文本文件[12]。一旦設(shè)置,Robots協(xié)議就可以在整個萬維網(wǎng)執(zhí)行。搜索引擎的爬蟲要訪問該網(wǎng)站,首先需要檢索該Robots協(xié)議,以確定自己訪問權(quán)限,據(jù)此進行下一步操作:停止訪問,或者按照協(xié)議要求進行訪問。
(3)資助機構(gòu)通過要求受資助者采用特定的使用許可協(xié)議從而體現(xiàn)其權(quán)益主張
開放獲取運動中,科研資助機構(gòu)在制定開放政策、推動開放資源的再利用方面發(fā)揮重要作用。資助機構(gòu)往往要求受資助人的作品選擇某種許可協(xié)議對其作品進行開放。如RCUK和Wellcome Trust從2013年4月1日起強制要求由其資助的論文采用CC BY協(xié)議,授權(quán)任何人出于任何目的再利用的權(quán)利。又如歐洲原子能機構(gòu)(CERN)發(fā)起的SCOAP3計劃,規(guī)定從2014年起高能物理領(lǐng)域50%以上高水平期刊論文以CC BY方式開放獲取。本文認為資助機構(gòu)對開放期刊再利用的影響往往是間接的,它通過影響出版商的使用許可方案,間接影響用戶使用。
表2 出版商網(wǎng)站使用政策概覽
(4)行業(yè)組織、學術(shù)聯(lián)盟等也影響著開放期刊的再利用
一些行業(yè)組織、學術(shù)聯(lián)盟也在推動開放資源再利用和處理相關(guān)權(quán)益問題方面發(fā)揮著重要作用。例如學術(shù)出版與學術(shù)資源聯(lián)盟SPARC致力于促進作者、出版商和圖書館之間的合作,于2007年提出作者補遺(Author Addendum)模板,協(xié)調(diào)作者與出版商之間的權(quán)益問題[13]。美國國家信息標準協(xié)會NISO在2015年初推出了推薦權(quán)益元數(shù)據(jù)字段,如果這一建議得到廣泛采納,將使得作品的知識產(chǎn)權(quán)和使用許可信息得到更好的理解和標識[14]。2015年5月,COAR和SPARC等組織又發(fā)起了對于Elsevier sharing and hosting policies新政策的抵制,認為這項政策妨礙了開放獲取和學術(shù)成果的交流[15]。
3.2 開放期刊再利用中存在的主要權(quán)益問題
(1)出版商的網(wǎng)站政策限制開放期刊內(nèi)容的機器采集
雖然開放獲取期刊從理論上可以自由下載、使用,但這些資源都是首先發(fā)布于出版商網(wǎng)站、存儲于出版商的數(shù)據(jù)庫;如果出版商沒有針對這些開放獲取資源制定專門政策,開放期刊的下載仍要遵循網(wǎng)站整體使用政策的規(guī)定。在開放期刊采集環(huán)節(jié),如果出版商能夠主動通過FTP、開放接口等方式向圖書館批量提供數(shù)據(jù),那么根據(jù)開放獲取定義和CC協(xié)議中對開放獲取資源可以自由傳播的規(guī)定,不存在權(quán)益問題;如果出版商不能主動提供開放獲取資源,此時,圖書館如果通過機器采集方式從出版商網(wǎng)站直接獲取數(shù)據(jù),而忽略網(wǎng)站使用許可或者未提前與出版商進行溝通,就容易產(chǎn)生權(quán)益糾紛。例如Elsevier明確規(guī)定不得對網(wǎng)站內(nèi)容進行數(shù)據(jù)抓取,并沒有明確排除開放獲取資源;若此時圖書館在不告知出版社的情況下,自行開始數(shù)據(jù)采集,就可能與出版商產(chǎn)生糾紛。此外,即使沒有對數(shù)據(jù)爬取明確表態(tài)的出版商,他們也都通過Robots協(xié)議,對搜索引擎等實施的網(wǎng)頁爬取進行限制。
圖3 Elsevier開放獲取出版協(xié)議說明出版商享有發(fā)表權(quán)
圖4 Elsevier使用許可和對再利用行為的規(guī)定[16]
(2)出版商對作品享有發(fā)表權(quán)和開放期刊本地存儲間的利益沖突
數(shù)字資源的存儲實質(zhì)是一種對數(shù)據(jù)庫的復制行為,按照開放獲取定義和CC協(xié)議,開放獲取資源可以自由復制,因此開放期刊的本地化保存是合理再利用行為,但可能存在與出版商的利益沖突。開放獲取運動以來,大量的論文可以通過互聯(lián)網(wǎng)免費獲取而不需要再經(jīng)過出版商。Elsevier出版政策中明確規(guī)定,作品出版后,出版商享有發(fā)表權(quán)。關(guān)于機構(gòu)是否可以把開放獲取資源集成到本地,建立自己的數(shù)據(jù)中心,直接向用戶提供服務(wù),一直存在爭議。一般來說,出版商通常都希望論文的瀏覽集中在自己的數(shù)據(jù)庫或平臺,而認為開放資源集成平臺例如PubMed,分散了論文網(wǎng)上點擊量。
(3)具體的開放期刊再利用行為是否合理,難以直接判斷
通過上文對開放獲取定義和CC協(xié)議的分析可知,作者對作品的署名和保證作品完整性有著明確的權(quán)利要求,這就對作品的使用提出了明確的要求。但同時,我們也注意到,不論是開放獲取定義,還是CC協(xié)議中涉及的再利用行為,都比較籠統(tǒng)和抽象。這就給再利用者判斷自己行為的合理性造成了很大困難。例如CC協(xié)議的各種協(xié)議對文本挖掘是否支持、對單獨使用期刊內(nèi)容中的數(shù)據(jù)是否支持等科研人員關(guān)心的再利用方式并沒有給出直接的回應(yīng)。同時除了Elsevier以外,其他出版商也沒有對本出版社旗下開放期刊可能的再利用方式做出說明。
當前,圖書館對開放資源的再利用集中在兩個方面:一是,把開放期刊與現(xiàn)有館藏進行整合,解決目前圖書館面臨的資源短缺、數(shù)據(jù)庫訂購危機等問題,例如建立開放期刊導航、集成系統(tǒng),提供資源的瀏覽、下載;二是,通過對開放期刊元數(shù)據(jù)、全文進行語義標注、文本挖掘等提供更有深度的服務(wù)。中國科學院文獻情報中心開放資源建設(shè)團隊系統(tǒng)研究梳理了開放資源建設(shè)規(guī)范和方法的研究成果[17],提出開放資源再利用應(yīng)包括資源的發(fā)現(xiàn)與評價、內(nèi)容獲取與存儲、資源聚合與集成,元數(shù)據(jù)、內(nèi)容、數(shù)據(jù)的再利用和資源再傳播等環(huán)節(jié)。根據(jù)這一研究成果,本文將圖書館對開放期刊的再利用歸納為以下四個環(huán)節(jié):開放期刊的采集、存儲、組織及再利用服務(wù)、數(shù)據(jù)調(diào)用。
4.1 開放期刊采集環(huán)節(jié)中的權(quán)益問題分析及解決建議
(1)圖書館開放期刊的采集行為分析
目前出版商平臺或數(shù)據(jù)庫仍是獲取開放期刊的主要來源。獲取方式包括:由出版商直接主動通過FTP方式為圖書館提供數(shù)據(jù),或為其提供開放接口。在上述兩種方式不可行的情況下,圖書館可能需要直接通過出版商網(wǎng)站抓取數(shù)據(jù)。針對開放期刊采集行為的分析如表3所示。
表3 圖書館開放期刊采集行為分析
首先,本文調(diào)研的8家開放出版商網(wǎng)站,雖然對于是否允許機器抓取網(wǎng)站內(nèi)容,出版商的態(tài)度并不統(tǒng)一,但部分出版商明確規(guī)定不允許使用爬蟲軟件下載,如Elsevier。其次,這些出版商都通過robots.txt協(xié)議對于搜索引擎抓取有時間間隔的限制,并且規(guī)定了禁止抓取的頁面。Robots協(xié)議的初衷是規(guī)范搜索引擎等對網(wǎng)站內(nèi)容抓取的行為;違反Robots協(xié)議的抓取行為,主觀上均視為明知、惡意。但Robots協(xié)議實際是一種行業(yè)自律軟約束,關(guān)于robots文件是否具有法律強制效力,目前還存在爭議[12]。法律界人士認為,Robots協(xié)議只是行業(yè)間約定俗成的協(xié)議,不是行業(yè)規(guī)范,更不具備法律效力,因此不能作為解決法律糾紛的依據(jù)[18]。但違背Robots協(xié)議有可能會引起不必要的糾紛?;ヂ?lián)網(wǎng)領(lǐng)域已經(jīng)有相關(guān)案例,2013年10月關(guān)于百度起訴360,在未經(jīng)允許的情況下,違反Robots協(xié)議抓取百度知道等內(nèi)容,百度方面認為這是一種不正當競爭。法院最終判定360賠償百度70萬元經(jīng)濟損失;但同時要求百度修改其帶有歧視性的Robots協(xié)議[19]。
(3)解決圖書館開放期刊采集中權(quán)益問題的建議
圖書館在進行機器抓取時,應(yīng)首先與出版商提前溝通獲得支持,并對于采集頻率等進行溝通;爭取將圖書館進行數(shù)據(jù)采集的IP地址加入對方可信任列表當
(2)圖書館開放期刊采集中面臨的權(quán)益問題分析
根據(jù)開放獲取的定義以及CC協(xié)議的規(guī)定,開放獲取資源允許公開傳播,因此圖書館接收出版商主動提供開放期刊數(shù)據(jù)或者自行通過開放接口下載數(shù)據(jù)的行為,沒有權(quán)益風險。
但如果出版商不能通過FTP或開放接口方式提供數(shù)據(jù),圖書館需要從出版商網(wǎng)站機器抓取數(shù)據(jù)時,會給對方服務(wù)器帶來負擔。在未征求出版商同意的情況下,自行采集開放資源也有可能造成對出版商數(shù)據(jù)庫相關(guān)權(quán)益的侵害,產(chǎn)生糾紛,造成不良后果。中,避免賬號被封。
①對明令禁止機器采集的出版商,可以采取事前協(xié)商的措施。
②沒有明令禁止機器采集的出版商,做好事前溝通協(xié)商,按照對方服務(wù)器規(guī)定,采集行為不給對方服務(wù)器帶來負擔;不采集網(wǎng)頁的獨創(chuàng)性設(shè)計,尊重網(wǎng)站內(nèi)容的版權(quán);如果采集中一旦發(fā)生糾紛,應(yīng)及時停止相關(guān)活動,并可使用合理使用原則、避風港原則進行談判。
③作為為公眾利益服務(wù)的圖書館,應(yīng)遵守Robots協(xié)議。在開放期刊數(shù)據(jù)采集過程中,圖書館不能強行違反網(wǎng)站意愿,需要按照Robots協(xié)議規(guī)定對采集頻率等進行設(shè)置。
4.2 開放期刊本地存儲中的權(quán)益問題分析及解決建議
(1)圖書館開放期刊的本地存儲行為分析
圖書館將采集獲得的開放期刊存放于本地,存儲方式可以是對采集內(nèi)容直接存儲,或者為開放期刊論文的圖、表、附加材料建立單獨的數(shù)據(jù)倉儲。
(2)圖書館開放期刊本地存儲中面臨的權(quán)益問題分析
根據(jù)開放獲取的定義以及CC協(xié)議的規(guī)定,對開放獲取資源的復制是合理的再利用行為,因此圖書館將開放期刊內(nèi)容進行本地化保存,是合理的再利用行為,沒有權(quán)益風險。
但圖書館如果將開放期刊的部分內(nèi)容單獨保存,就需要注意這些具體內(nèi)容的權(quán)益問題。在調(diào)研中發(fā)現(xiàn),目前開放期刊的發(fā)展趨勢是將圖、表、附加數(shù)據(jù)等單獨揭示。這些圖、表、附加數(shù)據(jù)的使用許可分為兩種情況:一種是比較明確的,例如BMC規(guī)定,所有文章的附加數(shù)據(jù)采用CC 0 1.0協(xié)議,可以任意使用,不需要征得版權(quán)人的許可。而絕大多數(shù)的情況是,附加數(shù)據(jù)沒有單獨的使用協(xié)議,例如Springer、Hindawi、OUP、Wiley、PLOS、Medknow等。那么對于開放期刊中部分內(nèi)容的存儲是否合理就是一個需要解答的問題。
表4 圖書館開放期刊本地存儲行為分析
表5 圖書館開放期刊數(shù)據(jù)組織及再利用服務(wù)行為分析
(3)解決圖書館開放期刊本地存儲中權(quán)益問題的建議
根據(jù)著作權(quán)法,文章中的插圖等內(nèi)容版權(quán)歸作者所有[20]。作為文章的一部分內(nèi)容,如果期刊論文的圖、表和附加數(shù)據(jù)沒有單獨的使用許可協(xié)議,則默認其使用許可與全文保持一致。同時著作權(quán)法也規(guī)定,對論文中一部分內(nèi)容的使用,需要明確標明作品署名和來源。針對開放期刊本地存儲可能引發(fā)的權(quán)益問題,美國能源部開放獲取政策采取了折中的方案,規(guī)定在本地保存作者的論文時,同時也提供至出版商平臺的鏈接。
因此,圖書館在對開放期刊的本地存儲,特別是對期刊中部分內(nèi)容進行提煉和單獨存儲時,應(yīng)對所收錄開放期刊論文的使用許可協(xié)議進行全面掌握。對于遵循CC協(xié)議的論文,可以為其圖、表、附加數(shù)據(jù)建立單獨的數(shù)據(jù)倉儲開展再利用。但一定要注意標明這些內(nèi)容的作者署名、來源、使用許可信息等,并且與期刊論文相關(guān)聯(lián)。開放科學數(shù)據(jù)倉儲Dryad推薦,在引用某一數(shù)據(jù)的同時,需引用其原始來源文章。
4.3 開放期刊組織及再利用服務(wù)中的權(quán)益問題分析及解決建議
(1)圖書館開放期刊的組織及再利用服務(wù)行為分析
開放期刊進行有序組織加工后才能被更好利用。最基礎(chǔ)的組織方式是為開放期刊資源建立索引。在建立索引的基礎(chǔ)上,可以為開放期刊建立單獨的集成系統(tǒng),提供資源的集成檢索、瀏覽、下載服務(wù);同時也可以對期刊內(nèi)容進行語義標注、文本挖掘,形成新的服務(wù)能力或產(chǎn)品。
(2)圖書館開放期刊組織及再利用服務(wù)中面臨的權(quán)益問題分析
建立索引是一種匯編行為,根據(jù)開放獲取定義,可以為開放獲取資源建立索引、鏈接。因此圖書館為保存在本地的開放期刊建立索引是一種合理的再利用方式,沒有權(quán)益風險。
針對建立獨立的開放期刊集成系統(tǒng),根據(jù)之前對開放期刊再利用權(quán)益關(guān)系的分析,出版商享有開放獲取作品的發(fā)表權(quán),圖書館對開放期刊再傳播的過程中,如不注明資源的原始來源,使資源可以從出版商網(wǎng)站中獲取,就可能會造成侵權(quán)。
針對語義標注、文本挖掘等深度再利用行為,由于開放獲取定義、CC協(xié)議各種組合等都沒有對開放獲取資源文本挖掘的合理性做出具體的規(guī)定,因此圖書館從事相關(guān)活動時沒有直接可用的依據(jù)。但值得關(guān)注的是,近年來文本挖掘得到了越來越多的支持,表現(xiàn)在:
①出于合理目的的文本挖掘逐漸獲得法律和學協(xié)會層面的支持。首先,2014年英國對版權(quán)法進行修訂,其中《合理使用例外聲明草案》明確將用于非商業(yè)用途的文本挖掘列入合理使用的范圍。其次,在美國,判案時的合理使用權(quán)已經(jīng)開始包容文本挖掘,許多法院都支持將文本挖掘中必要的復制視為合理使用,即使被臨時復制到數(shù)據(jù)庫中的內(nèi)容是受版權(quán)保護的。此外,美國研究圖書館協(xié)會(ARL)發(fā)布簡報《文本與數(shù)據(jù)挖掘和美國的合理使用原則》,給出了有關(guān)文本和數(shù)據(jù)挖掘?qū)儆诤侠硎褂玫姆治觯?1]。同時,170多家組織于2015 年5月6日通過由歐洲研究圖書館協(xié)會(LIBER)發(fā)起的《數(shù)字時代知識發(fā)現(xiàn)海牙宣言》,呼吁為文本挖掘建立更好的制度和基礎(chǔ)設(shè)施[22]。
②出版商趨向于支持非商業(yè)目的的文本挖掘。Elsevier已將文本挖掘的權(quán)利寫入Science Direct 定購協(xié)議和用戶使用協(xié)議中,挖掘結(jié)果可作非商業(yè)性使用。Wiley規(guī)定,對于非商業(yè)性使用,如果資源遵循CC BYNC-ND和CC BY-NC,可以翻譯、文本挖掘,但必須注明出處并標明引用。BMC鼓勵對數(shù)據(jù)集中的數(shù)據(jù)進行挖掘,聲明所有內(nèi)容是開放獲取,可以免費使用,供研究人員進行挖掘[23]。
(3)解決圖書館開放期刊組織及再利用服務(wù)中權(quán)益問題的建議
首先,在建立開放期刊集成系統(tǒng)時,應(yīng)充分尊重出版商發(fā)表權(quán)。圖書館在開放期刊集成系統(tǒng)中應(yīng)注明該資源的原始來源,并定期對平臺中資源的使用狀況進行統(tǒng)計,并將統(tǒng)計報告提供給出版商,以獲取出版商更多支持和合作。目前世界知名的開放期刊集成平臺,如DOAJ、J-STAGE、SciELO等,都在網(wǎng)站上明確標明作品的原始來源URL和作品的使用許可。
其次,根據(jù)前文分析,目前非商業(yè)目的文本挖掘權(quán)益風險較小。因此圖書館現(xiàn)階段應(yīng)主要將文本挖掘活動集中在非商業(yè)目的,并在服務(wù)產(chǎn)品中標明數(shù)據(jù)內(nèi)容來源,通過各種可能的方式對數(shù)據(jù)貢獻方的支持給予感謝。
4.4 開放期刊數(shù)據(jù)調(diào)用中的權(quán)益問題分析及解決建議
(1)圖書館開放期刊數(shù)據(jù)調(diào)用行為分析
對開放獲取資源通過開放接口等方式進行數(shù)據(jù)調(diào)用、再傳播是開放獲取的本質(zhì)要求。圖書館開放期刊的數(shù)據(jù)調(diào)用,主要是指第三方對圖書館所獲取的開放期刊的調(diào)用。
表6 圖書館開放期刊數(shù)據(jù)調(diào)用行為分析
(2)圖書館開放期刊數(shù)據(jù)調(diào)用中面臨的權(quán)益問題分析
開放獲取定義支持開放資源的自由下載、傳播,同時不能以任何技術(shù)手段限制這種傳播。因此圖書館有義務(wù)使其獲取的開放期刊被第三方出于合理目的調(diào)用。
但為了更好傳播和再利用開放資源,圖書館通常會在資源采集、建立索引、網(wǎng)站設(shè)計方面投入大量的成本。法律規(guī)定,互聯(lián)網(wǎng)運營商對產(chǎn)品內(nèi)容享有著作權(quán),包括獨創(chuàng)性作品和匯編作品、網(wǎng)站設(shè)計等。因此,圖書館對所建立的網(wǎng)站享有版權(quán),機器抓取可能會影響網(wǎng)站運行,侵犯圖書館的正當權(quán)益。圖書館有權(quán)制定網(wǎng)站使用政策,限制不合理、會對網(wǎng)站造成損害的再利用行為發(fā)生。
(3)解決圖書館開放期刊數(shù)據(jù)調(diào)用中權(quán)益問題的建議
針對搜索引擎或第三方機構(gòu)對圖書館所建網(wǎng)站的數(shù)據(jù)抓取的行為,圖書館應(yīng)首先提供可用的開放接口,同時制定網(wǎng)站使用政策,對網(wǎng)站抓取行為做出相應(yīng)規(guī)定。針對機器抓取行為,開放獲取資源的集成平臺也有制定相關(guān)規(guī)定的先例,例如PMC的網(wǎng)站使用政策中指出,為了保護網(wǎng)站的安全性和服務(wù)正常,系統(tǒng)會實時監(jiān)控異常操作,對批量下載進行限制[24];日本科技電子期刊平臺J-STAGE在網(wǎng)站獲取政策(Access Policy)中規(guī)定不能抓取網(wǎng)站內(nèi)容[25]。
開放獲取并不意味著圖書館開放期刊的建設(shè)不會被權(quán)益問題困擾。圖書館開放期刊的建設(shè)是一項復雜的系統(tǒng)工程,涉及多方利益,需要有效的權(quán)益管理方案。本文對開放期刊再利用中的權(quán)益關(guān)系,以及圖書館開放期刊再利用每個環(huán)節(jié)中存在的權(quán)益風險、解決對策等進行了分析,希望以此為圖書館相關(guān)工作提供參考和借鑒。
[1] 中國圖書館學情報學期刊開放獲取出版蘇州宣言[J].圖書情報工作,2012,56(21):147-148.
[2] 劉茲恒,董舞藝,孟晨霞.試析數(shù)據(jù)庫商與圖書館的關(guān)系[J].圖書館雜志,2015(3):12-15,11.
[3] 劉茲恒,包心萍.國外數(shù)據(jù)庫商業(yè)版權(quán)模式及高校圖書館的對策[J].高校圖書館工作,2015,35(1):25-30.
[4] 張今,杜晶.數(shù)字環(huán)境下的合理使用制度論要[J].知識產(chǎn)權(quán)研究,2005(3):14-23.
[5] SPARC Statement on the Department of Energy's Plan for Increasing Public Access to the Results of Federally-Funded Research [EB/ OL]. [2014-08-04]. http://www.sparc.arl.org/news/sparc-respondsdepartment- energys-public-access-plan.
[6] What's New in 4.0 [EB/OL]. [2015-04-30]. https://creativecommons. org/Version4.
[7] 劉赪娜.《歐盟數(shù)據(jù)庫指令》研究及對我國圖書館數(shù)據(jù)庫法律保護的影響[J].新世紀圖書館,2011(11):89-91,45.
[8] 周智軍.從美國對數(shù)據(jù)庫保護的進程看我國對數(shù)據(jù)庫的保護[J].法制與社會,2009(6):94-95.
[9] Elsevier Copyright [EB/OL]. [2015-05-10]. https://www.elsevier.com/ about/company-information/policies/copyright.
[10] 李丹.現(xiàn)代圖書館危機管理研究[D].北京:北京大學,2006.
[11] Creative Commons [EB/OL]. [2015-04-15]. https://creativecommons. org/.
[12] 陳笑.論Robots協(xié)議下搜索引擎數(shù)據(jù)挖掘行為的法律責任[D].北京:北京郵電大學,2014.
[13] 李忠霞.加拿大采納SPARC的作者版權(quán)協(xié)議補遺[J].圖書情報工作動態(tài),2007(9):21.
[14] Access License and Indicators: A Recommended Practice of the National Information Standards Organization [EB/OL]. [2015-06-09]. http://www.niso.org/apps/group_public/download.php/14226/rp-22-2015_ALI.pdf.
[15] Statement against Elsevier's sharing policy [EB/OL]. [2015-12-10]. https://www.coar-repositories.org/activities/advocacy-leadership/ statements-and-guidelines/petition-against-elseviers-sharing-policy/.
[16] Open Access Licenses [EB/OL]. [2015-09-03]. https://www.elsevier. com/about/company-information/policies/open-access-licenses.
[17] 黃金霞,張建勇,黃永文,等.開放資源建設(shè)的措施及工作策略[J].圖書情報工作,2013,57(8):57-61.
[18] Robots協(xié)議不具備法律效力[EB/OL]. [2015-03-08]. http://www. chinadaily.com.cn/hqcj/xfly/2013-10-17/content_10350989.html.
[19] 百度訴360違反Robots協(xié)議一審判360賠償70萬[EB/OL]. [2016-01-24]. http://tech.163.com/14/0807/12/A31UJS5P000915BD. html.
[20] 張小強,鐘紫紅,張秀峰,等.科技期刊論文插圖的版權(quán)與再利用[J].中國科技期刊研究,2012,23(3):429-432.
[21] Fair Use in Text and Data Mining: ARL Publishes Issue Brief [EB/ OL]. [2015-06-15]. http://www.arl.org/news/arl-news/3643-fair-usein-text-and-data-mining-arl-publishes-issue-brief#.VZo7mvSl_fV.
[22] 趙力.《數(shù)字時代知識發(fā)現(xiàn)海牙宣言》之借鑒:以內(nèi)容挖掘為核心[J].圖書館,2015(9):22-26.
[23] About BioMed Central [EB/OL]. [2015-12-06]. http://www.biomedcentral.com/about.
[24] NCBI Website and Data Usage Policies and Disclaimers [EB/OL]. [2015-12-31]. http://www.ncbi.nlm.nih.gov/home/about/policies.shtml.
[25] Access Rules [EB/OL]. [2015-11-24]. https://www.jstage.jst.go.jp/pub/ html/AY04S120_en.html.
肖曼,女,1984年生,碩士,中國科學院文獻情報中心館員,研究方向:開放資源建設(shè)。
陳雪飛,女,1987年生,碩士,中國科學院文獻情報中心館員,研究方向:開放資源建設(shè)。
章岑,女,1991年生,碩士在讀,中國科學院大學,研究方向:開放資源建設(shè)。
黃金霞,女,1972年生,博士,中國科學院文獻情報中心副研究員,研究方向:開放資源建設(shè)。
Research on the Rights and Interests Issue of the Open Access Journal Reuse in Libraries
LIU JingYu, XIAO Man, CHEN XueFei, ZHANG Cen, HUANG JinXia
(National Science Library, Chinese Academy of Sciences, Beijing 100190, China)
There are a series of rights and interests issues during the Open Access journal reuse, including machine acquisition, local storage, lack of rationality of some specific reuse methods, etc. These issues derive from the conflict rooted in the rights and interests' relationship of the relevant subjects, for example, authors,publishers, Open Access Journals' users, funding agencies, industry organizations, etc. Based on the analysis of the relationship, this study proposes major issues happening during the whole process of the Open Access Journal reuse, including the collection, storage, organizing, reuse services, and data invoking. Meanwhile, some corresponding solutions are given.
Open Access Journal; Rights and Interests; Library; Open Resources
G250
10.3772/j.issn.1673-2286.2016.2.010
劉靜羽,女,1989年生,碩士,中國科學院文獻情報中心助理館員,研究方向:開放資源建設(shè),E-mail:liujingyu@mail.las.ac.cn。
2016-01-28)