王 婧 田愛蘋 李文蘭
(1. 天津大學(xué)圖書館 天津 300350;2. 天津大學(xué)情報(bào)研究所 天津 300350)
機(jī)構(gòu)知識(shí)庫(kù)是一種基于開放理念的信息獲取方式,用于管理和傳播機(jī)構(gòu)各個(gè)部門及其成員創(chuàng)作的數(shù)字化產(chǎn)品,允許其被搜索引擎發(fā)現(xiàn)、揭示,便于全球?qū)W者、機(jī)構(gòu)之間實(shí)現(xiàn)學(xué)術(shù)交流與分享。
機(jī)構(gòu)知識(shí)庫(kù)建設(shè)最早興起于美國(guó)。1991年8月,在美國(guó)國(guó)家科學(xué)基金會(huì)和美國(guó)能源部的資助下,美國(guó)洛斯阿拉莫斯(Los Alamos)國(guó)家實(shí)驗(yàn)室的物理學(xué)家Dr. Ginsparg發(fā)起創(chuàng)建電子預(yù)印本文獻(xiàn)庫(kù)arXiv.or,以開放獲取的方式供全球?qū)W者訪問利用,旨在促進(jìn)科學(xué)研究成果的交流與共享,機(jī)構(gòu)知識(shí)庫(kù)(Institutional Repository, IR)在美國(guó)初現(xiàn)雛形。21世紀(jì)初,隨著建設(shè)實(shí)踐的不斷深入,美國(guó)正式提出IR的概念[1]。2001年,美國(guó)俄亥俄州立大學(xué)圖書館和首席信息官辦公室聯(lián)合推出了知識(shí)庫(kù)服務(wù)(Knowledge Bank Service),員工、教師和學(xué)生可以將自己的作品上傳并長(zhǎng)期保存在知識(shí)庫(kù)中,機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)輪廓逐漸清晰。惠普公司實(shí)驗(yàn)室與麻省理工學(xué)院合作,從事IR的基礎(chǔ)理論研究及操作平臺(tái)的開發(fā),于2002年11月,成功開發(fā)出DSpace系統(tǒng)(數(shù)字空間)并投入使用,這是全球最早的機(jī)構(gòu)知識(shí)庫(kù)軟件平臺(tái)。隨著開放獲取運(yùn)動(dòng)的興起,機(jī)構(gòu)知識(shí)庫(kù)在世界范圍內(nèi)迅速發(fā)展,在OpenDOAR中注冊(cè)機(jī)構(gòu)逐年遞增。截至2018年10月,OpenDOAR中共有3 779個(gè)注冊(cè)機(jī)構(gòu)[2],其中美國(guó)537個(gè),英國(guó)277個(gè),日本222個(gè)。在排名前三的國(guó)家中,英國(guó)和日本機(jī)構(gòu)知識(shí)庫(kù)的總和仍小于美國(guó)??梢?,美國(guó)仍處于遙遙領(lǐng)先的地位。我國(guó)的注冊(cè)機(jī)構(gòu)知識(shí)庫(kù)有102個(gè),除臺(tái)灣地區(qū)的61個(gè)注冊(cè)機(jī)構(gòu)知識(shí)庫(kù)外,其它地區(qū)僅有41個(gè),與2014年的38個(gè)[3]相比增幅不大,這表明我國(guó)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)不僅遠(yuǎn)遠(yuǎn)落后于美國(guó)、英國(guó)和日本等發(fā)展較快的國(guó)家,近幾年整體發(fā)展也非常緩慢。
我國(guó)機(jī)構(gòu)知識(shí)庫(kù)的概念引自國(guó)外,起步較晚,建設(shè)情況與國(guó)外相比還有一定的差距,為了全面分析國(guó)外機(jī)構(gòu)知識(shí)庫(kù)的相關(guān)研究概況,推進(jìn)我國(guó)機(jī)構(gòu)庫(kù)建設(shè),文章收集了Web of Science平臺(tái)下SCIE、SSCI、CPCI數(shù)據(jù)庫(kù)中關(guān)于機(jī)構(gòu)知識(shí)庫(kù)研究的論文數(shù)據(jù)。截至2018年10月15日,Web of Science平臺(tái)的SCIE、SSCI、CPCI-S數(shù)據(jù)庫(kù)中,在主題字段檢索institution* near/3 repositor*,得到692篇文獻(xiàn),在此基礎(chǔ)上考慮開放獲取、開放數(shù)據(jù)、機(jī)構(gòu)知識(shí)庫(kù)、圖書館、DSAPCE等多種相關(guān)概念,通過人工篩選,最終獲得540篇相關(guān)文獻(xiàn),其中我國(guó)機(jī)構(gòu)和作者共發(fā)表23篇機(jī)構(gòu)知識(shí)庫(kù)論文。文章以國(guó)外作者和機(jī)構(gòu)發(fā)表的517篇機(jī)構(gòu)知識(shí)庫(kù)論文為數(shù)據(jù)基礎(chǔ)進(jìn)行研究。
不同類型的文獻(xiàn)所記載的信息內(nèi)容各有側(cè)重,在學(xué)術(shù)交流過程中起著不同作用。表1為國(guó)外作者和機(jī)構(gòu)發(fā)表機(jī)構(gòu)知識(shí)庫(kù)論文的文獻(xiàn)類型及被引頻次分布情況,可以發(fā)現(xiàn)期刊類型的論文無論是發(fā)文量還是被引量都遠(yuǎn)高于其余類型的文獻(xiàn),對(duì)機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域的影響不容小覷。
表1 文獻(xiàn)類型及被引頻次分布情況
從已標(biāo)注所屬機(jī)構(gòu)的論文數(shù)據(jù)來看,國(guó)外高校院系是機(jī)構(gòu)知識(shí)庫(kù)建設(shè)實(shí)踐的主力,也是機(jī)構(gòu)知識(shí)庫(kù)研究的主力,發(fā)表的論文無論是數(shù)量還是篇均被引量均高于其他類型的機(jī)構(gòu),其研究具備系統(tǒng)性并有一定的深度,為我國(guó)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)實(shí)踐提供了不可替代的理論指導(dǎo),機(jī)構(gòu)分布情況如表2所示。
表2 機(jī)構(gòu)發(fā)文量分布情況(第一機(jī)構(gòu))
美國(guó)作為最早提出機(jī)構(gòu)知識(shí)庫(kù)建設(shè)的國(guó)家,也是機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域內(nèi)影響力最高的國(guó)家,發(fā)表的論文無論是數(shù)量還是總被引量都遠(yuǎn)高于其他國(guó)家,是機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域研究的領(lǐng)軍者。國(guó)外發(fā)表的SCI論文的國(guó)家分布情況如圖1和圖2所示,國(guó)外發(fā)文量和被引量最高的國(guó)家依次為美國(guó)、英國(guó)、西班牙。
圖1 國(guó)外機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域發(fā)文量分布情況
圖2 國(guó)外機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域總被引量分布情況
表3 發(fā)文量排名前十機(jī)構(gòu)
國(guó)外高校院系是機(jī)構(gòu)知識(shí)庫(kù)相關(guān)研究探討的主導(dǎo)力量,為機(jī)構(gòu)知識(shí)庫(kù)建設(shè)實(shí)踐提供了不可替代的理論指導(dǎo)。機(jī)構(gòu)知識(shí)庫(kù)發(fā)文量的機(jī)構(gòu)排名情況如表3所示,發(fā)文量排名第一的機(jī)構(gòu)為馬來西亞的馬來亞大學(xué),其次為美國(guó)的羅格斯大學(xué)和印第安納大學(xué)。
發(fā)文量的時(shí)間變化是衡量某個(gè)研究領(lǐng)域發(fā)展情況的重要指標(biāo)之一,在一定程度上可以反映該領(lǐng)域研究的開展程度和研究進(jìn)度,了解該領(lǐng)域的研究變化趨勢(shì)。機(jī)構(gòu)知識(shí)庫(kù)相關(guān)論文的逐年發(fā)文量和五年移動(dòng)平均發(fā)文量趨勢(shì)如圖3所示。
圖3 逐年發(fā)文量情況
據(jù)此可以看出,機(jī)構(gòu)知識(shí)庫(kù)的研究整體處于技術(shù)的發(fā)展階段。將國(guó)外機(jī)構(gòu)知識(shí)庫(kù)的發(fā)展劃分為三個(gè)階段:
機(jī)構(gòu)知識(shí)庫(kù)建設(shè)自美國(guó)興起后,經(jīng)歷了一段時(shí)期的實(shí)踐探索,隨著人們對(duì)機(jī)構(gòu)知識(shí)庫(kù)的認(rèn)識(shí)不斷加深,才逐漸形成明確的概念,相關(guān)的研究探討也才逐漸興起。萌芽階段的研究?jī)?nèi)容主要集中在機(jī)構(gòu)知識(shí)庫(kù)的基礎(chǔ)概念、建設(shè)思路、平臺(tái)功能及實(shí)踐案例介紹等,這些研究成果為在全球推廣機(jī)構(gòu)知識(shí)庫(kù)建設(shè)做出了重要貢獻(xiàn),也為后續(xù)研究的蓬勃發(fā)展奠定了基礎(chǔ)。2002年,加利福尼亞數(shù)字圖書館的R Tennant[4]即對(duì)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)時(shí)采用的平臺(tái)、實(shí)施方式等進(jìn)行了介紹,提出了以聯(lián)盟的方式發(fā)展機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)思路,指出聯(lián)盟方式發(fā)展機(jī)構(gòu)知識(shí)庫(kù)可以降低圖書館的建設(shè)成本并減少重復(fù)工作帶來的資源浪費(fèi)。2003年,CA Lynch[5]提出了機(jī)構(gòu)知識(shí)庫(kù)的概念及建設(shè)思路,指出機(jī)構(gòu)知識(shí)庫(kù)可以為高等教育機(jī)構(gòu)提供變革的力量,更好地支持學(xué)術(shù)活動(dòng)?;萜展緦?shí)驗(yàn)室與麻省理工學(xué)院合作,從事IR的基礎(chǔ)理論研究及操作平臺(tái)的開發(fā),于2002年11月,成功開發(fā)出DSpace(數(shù)字空間)并投入使用,收集來自MIT教職員工和研究人員的各種形式的學(xué)術(shù)成果,并通過開源的方式,提供一系列遵循開放檔案信息系統(tǒng)參考模式的上載、管理、傳播數(shù)字信息的工具,對(duì)網(wǎng)絡(luò)用戶免費(fèi)開放,為機(jī)構(gòu)知識(shí)庫(kù)建設(shè)提供了解決方案[6-7]。
機(jī)構(gòu)知識(shí)庫(kù)對(duì)促進(jìn)學(xué)術(shù)交流以及學(xué)術(shù)成果的共享和傳播等都有著積極意義。在歐美等國(guó)的引領(lǐng)下,大學(xué)與科研院所紛紛創(chuàng)造條件建設(shè)機(jī)構(gòu)知識(shí)庫(kù),各國(guó)機(jī)構(gòu)知識(shí)庫(kù)的相關(guān)研究得到蓬勃發(fā)展,相關(guān)論文發(fā)表量開始快速增長(zhǎng),該研究主題已然成為業(yè)內(nèi)的研究熱點(diǎn)。SJ Bevan[8]以克蘭菲爾德大學(xué)為例,對(duì)電子論文提交過程中存在的問題進(jìn)行了分析研究,受到了包括斯洛文尼亞大學(xué)聯(lián)盟[8]、拉夫堡大學(xué)[9]在內(nèi)的科研機(jī)構(gòu)的廣泛關(guān)注。2006年,英國(guó)聯(lián)合信息系統(tǒng)委員會(huì)(JISC)對(duì)機(jī)構(gòu)知識(shí)庫(kù)的數(shù)字存儲(chǔ)發(fā)表觀點(diǎn),探索了為機(jī)構(gòu)存儲(chǔ)庫(kù)提供數(shù)字保存服務(wù)的模式[10],英國(guó)相關(guān)政府部門和高校對(duì)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)的重視使得英國(guó)機(jī)構(gòu)知識(shí)庫(kù)數(shù)量開始急劇增長(zhǎng)。除了歐美等國(guó)家,其他地區(qū)也紛紛開始建設(shè)機(jī)構(gòu)知識(shí)庫(kù)。2005年,PJ Lor[11]通過研究發(fā)現(xiàn),機(jī)構(gòu)知識(shí)庫(kù)建設(shè)及開放存取運(yùn)動(dòng)對(duì)非洲南北、北南、南南方向信息流動(dòng)有顯著促進(jìn)作用,印度科學(xué)研究所也積極開展機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)工作[12]。S Pinfield[13]指出,最初的機(jī)構(gòu)知識(shí)庫(kù)開發(fā)主要集中在北美、西歐和大洋洲,特別是美國(guó)、英國(guó)、德國(guó)和澳大利亞。不久之后,日本加大了機(jī)構(gòu)知識(shí)庫(kù)建設(shè)。自2010年以來,其他區(qū)域和國(guó)家的庫(kù)存量都有所增長(zhǎng),包括東亞(尤其是臺(tái)灣)、南美洲(尤其是巴西)和東歐(尤其是波蘭)。在此期間,法國(guó)、意大利和西班牙等國(guó)保持了平穩(wěn)增長(zhǎng),而中國(guó)和俄羅斯等國(guó)的增長(zhǎng)水平相對(duì)較低。在全球范圍內(nèi),知識(shí)庫(kù)主要是基于機(jī)構(gòu)、多學(xué)科和英語語言的。它們通常使用開源的符合OAI的機(jī)構(gòu)知識(shí)庫(kù)軟件,但在明確的許可協(xié)議方面仍不成熟,雖然機(jī)構(gòu)知識(shí)庫(kù)的大小很難準(zhǔn)確評(píng)估,但據(jù)可用數(shù)據(jù)表明,目前大型機(jī)構(gòu)知識(shí)庫(kù)較少,絕大部分為小型的機(jī)構(gòu)知識(shí)庫(kù)。BC Bjork以ISI和Ulrich’s中的數(shù)據(jù)為樣本,計(jì)算出2006年發(fā)表的文章總數(shù)約為1 350 000篇,其中4.6%立即可以公開獲得,在為期一年的禁用期之后又增加了3.5%,得益于機(jī)構(gòu)知識(shí)庫(kù),11.3%的論文可用副本可在特定主題或機(jī)構(gòu)存儲(chǔ)庫(kù)或作者的主頁(yè)上找到[14]。
這一時(shí)期機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟也逐漸興起,最有代表性的國(guó)外機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟工程是由使用DSpace系統(tǒng)創(chuàng)建機(jī)構(gòu)知識(shí)庫(kù)的研究機(jī)構(gòu)和大學(xué)圖書館組成的共同體,該聯(lián)盟以技術(shù)系統(tǒng)為紐帶,成員遍布世界各地,是工程師在Andrew W.Mellon基金會(huì)許可下與美國(guó)麻省理工學(xué)院和英國(guó)劍橋大學(xué)共同投資的實(shí)驗(yàn)項(xiàng)目,該項(xiàng)目降低了建庫(kù)成本,為推動(dòng)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)提供了有力的技術(shù)保障。加拿大各個(gè)大學(xué)也積極參加研究圖書館協(xié)會(huì)的機(jī)構(gòu)知識(shí)庫(kù)項(xiàng)目[15-16],成立了CARL機(jī)構(gòu)知識(shí)庫(kù)實(shí)驗(yàn)項(xiàng)目[17](CARL survey of institutional repositories),為成員提供了建庫(kù)指導(dǎo)和學(xué)術(shù)成果資源[17]。機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟既可避免單個(gè)學(xué)術(shù)機(jī)構(gòu)構(gòu)建機(jī)構(gòu)知識(shí)庫(kù)時(shí)所面臨的資金缺乏、內(nèi)容征集困難、技術(shù)條件不成熟等問題,又可以避免各機(jī)構(gòu)資源重復(fù)建設(shè),實(shí)現(xiàn)各機(jī)構(gòu)資源分布式整合、統(tǒng)一管理,促成各機(jī)構(gòu)資源開放存取的最優(yōu)化。
機(jī)構(gòu)知識(shí)庫(kù)研究論文量保持高位,從5年移動(dòng)平均發(fā)文量趨勢(shì)看(見圖3),機(jī)構(gòu)知識(shí)庫(kù)的整體發(fā)文量仍處于增長(zhǎng)階段,但開始出現(xiàn)了波動(dòng)態(tài)勢(shì),2009年機(jī)構(gòu)知識(shí)庫(kù)的論文產(chǎn)出略有降低,2010年恢復(fù)發(fā)文量高位后,2011—2013年產(chǎn)出開始減少,隨后于2014年達(dá)到峰值,隨后又有所降低,這一表現(xiàn)主要與建設(shè)實(shí)踐中遇到的問題有一定關(guān)聯(lián)。目前機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)大多停留在靜態(tài)數(shù)字資源的典藏階段,服務(wù)模式單一,用戶與知識(shí)原創(chuàng)者缺乏溝通渠道,評(píng)價(jià)體系不健全,以上現(xiàn)狀帶來了諸多問題,如導(dǎo)致機(jī)構(gòu)知識(shí)庫(kù)帶來的引文優(yōu)勢(shì)并沒有吸引科學(xué)家的參與,而大多數(shù)機(jī)構(gòu)知識(shí)庫(kù)的資源和人員缺乏則帶來了更嚴(yán)重的惡性循環(huán)。機(jī)構(gòu)知識(shí)庫(kù)需要與校園內(nèi)的數(shù)據(jù)提供者和管理者建立良好的聯(lián)系,才能系統(tǒng)、廣泛地支持?jǐn)?shù)據(jù)管理工作[18]。目前機(jī)構(gòu)知識(shí)庫(kù)中作者的自存檔率較低,大部分文獻(xiàn)是由圖書館員或管理人員保管的,導(dǎo)致可用性降低,自歸檔策略是較好的解決思路[19],機(jī)構(gòu)知識(shí)庫(kù)需要適應(yīng)廣泛的跨學(xué)科數(shù)據(jù)特征,才能解決目前機(jī)構(gòu)知識(shí)庫(kù)共享障礙的問題[20]。在開放訪問運(yùn)動(dòng)中,大學(xué)和高校圖書館公開挑戰(zhàn)傳統(tǒng)學(xué)術(shù)交流體系,緩解傳統(tǒng)學(xué)術(shù)交流體系和開放獲取之間的沖突是長(zhǎng)期以來的問題之一,然而目前并沒有顯示出任何減弱的跡象,機(jī)構(gòu)知識(shí)庫(kù)的低存儲(chǔ)率一直在持續(xù)。R Cullen[21]指出機(jī)構(gòu)知識(shí)庫(kù)可以通過存儲(chǔ)如學(xué)位論文等更廣泛的數(shù)據(jù)來擴(kuò)展自身功能,扮演更有價(jià)值的角色。2008年,Martinez-Uribe, L[22]指出科研數(shù)據(jù)的重要性,認(rèn)為科研數(shù)據(jù)管理是機(jī)構(gòu)知識(shí)庫(kù)未來的發(fā)展方向。通過轉(zhuǎn)換機(jī)構(gòu)知識(shí)庫(kù)中的元數(shù)據(jù)模式,增加谷歌學(xué)術(shù)的索引量,也是解決機(jī)構(gòu)知識(shí)庫(kù)存儲(chǔ)率低的途徑之一。S Corrall[23]指出,學(xué)術(shù)型圖書館未來發(fā)展方向之一即為數(shù)據(jù)管理,數(shù)據(jù)存儲(chǔ)是機(jī)構(gòu)知識(shí)庫(kù)未來的轉(zhuǎn)型方向。為促進(jìn)數(shù)據(jù)共享,Y Kim[24]研究了科學(xué)、技術(shù)、工程和數(shù)學(xué)研究人員的數(shù)據(jù)共享行為,指出科研人員自身的態(tài)度、政策約束和機(jī)構(gòu)知識(shí)庫(kù)的用戶友好度等都對(duì)數(shù)據(jù)存儲(chǔ)庫(kù)有重大影響,良好的數(shù)據(jù)服務(wù)及數(shù)據(jù)存儲(chǔ)工具均可以促進(jìn)數(shù)據(jù)共享行為。á Borrego[25]通過對(duì)西班牙開放獲取執(zhí)行情況的研究,指出西班牙90%的基金資助論文出版商允許向機(jī)構(gòu)知識(shí)庫(kù)繳存,但機(jī)構(gòu)知識(shí)庫(kù)對(duì)這些論文的覆蓋率很低,僅有14.4%,并且這些繳存的論文大多是圖書館員實(shí)施繳存的OA期刊的文章副本。2017年,á Borrego[26]通過對(duì)比西班牙13所高校機(jī)構(gòu)知識(shí)庫(kù)與社交學(xué)術(shù)網(wǎng)站ResearchGate的學(xué)術(shù)成果的可用性,發(fā)現(xiàn)這13所高校的研究人員在2014年發(fā)表的論文中,只有11.1%可以在他們所在的機(jī)構(gòu)知識(shí)庫(kù)中找到,出現(xiàn)這種現(xiàn)象的原因是研究人員對(duì)機(jī)構(gòu)知識(shí)庫(kù)的認(rèn)知或者操作不熟練,或者是更加認(rèn)可ResearchGate的傳播優(yōu)勢(shì)。這一系列問題一定程度上制約了機(jī)構(gòu)知識(shí)庫(kù)的發(fā)展,但人們?nèi)匀桓叨汝P(guān)注機(jī)構(gòu)知識(shí)庫(kù)建設(shè),集中針對(duì)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)實(shí)踐中的問題展開更深層次的研究。研究的關(guān)注點(diǎn)開始轉(zhuǎn)向用戶需求分析、建設(shè)模式調(diào)整、服務(wù)內(nèi)容拓展,以及機(jī)構(gòu)知識(shí)庫(kù)系統(tǒng)功能的深入開發(fā),并將研究?jī)?nèi)容主要集中在機(jī)構(gòu)知識(shí)庫(kù)建設(shè)的內(nèi)容模塊、質(zhì)量評(píng)價(jià)、服務(wù)模式、系統(tǒng)功能和聯(lián)盟機(jī)制等更深層次的問題。同時(shí),對(duì)機(jī)構(gòu)知識(shí)庫(kù)的訪問政策、服務(wù)模式、版權(quán)管理、聯(lián)盟機(jī)制和可持續(xù)發(fā)展等的討論也在持續(xù)深入。
論文被引頻次的高低,在一定程度上能夠揭示該論文的學(xué)術(shù)影響力和情報(bào)價(jià)值。被引頻次越高說明該文獻(xiàn)的研究成果得到了越多研究者的認(rèn)同,被研究者參考與借鑒,成為他人的研究基礎(chǔ),同時(shí)也表明與該研究主題相關(guān)的研究活動(dòng)比較集中,該研究主題是同領(lǐng)域的研究熱點(diǎn)。
通過機(jī)構(gòu)知識(shí)庫(kù)研究的高被引論文,可以分析不同發(fā)展階段關(guān)于機(jī)構(gòu)知識(shí)庫(kù)的研究熱點(diǎn)。根據(jù)ESI高被引論文的定義,并結(jié)合文章數(shù)據(jù)樣本量,對(duì)于國(guó)外的517篇論文數(shù)據(jù),文章取同一出版年發(fā)表的,按被引頻次倒序排列的前1%的論文作為高被引論文,不足1%補(bǔ)足整數(shù)位,如表4所示,2002—2017年機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域排名前1%的高被引論文共計(jì)16篇,總被引頻次556次,全部為期刊論文,文獻(xiàn)來源較為集中,均為信息科學(xué)與圖書館科學(xué)類期刊。
通過分析熱點(diǎn)論文,結(jié)合相關(guān)資料可以清楚地梳理出機(jī)構(gòu)知識(shí)庫(kù)發(fā)展的脈絡(luò)和研究熱點(diǎn)變化:
2004年以前,機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域研究還處于萌芽期,2002年,加利福尼亞數(shù)字圖書館的R Tennant即對(duì)機(jī)構(gòu)
知識(shí)庫(kù)建設(shè)時(shí)采用的平臺(tái)、實(shí)施方式等進(jìn)行了介紹,TA Peters[26]指出,機(jī)構(gòu)數(shù)字存儲(chǔ)庫(kù)將顯著提高構(gòu)建機(jī)構(gòu)的聲望,在建立時(shí)可從個(gè)人、學(xué)科、機(jī)構(gòu)、聯(lián)盟及國(guó)家等多角度建立,在此基礎(chǔ)上,2003年CJ Stoffle指出,機(jī)構(gòu)知識(shí)庫(kù)是圖書館未來的發(fā)展方向之一[27]。2003年,CA Lynch提出了機(jī)構(gòu)知識(shí)庫(kù)的概念及建設(shè)思路,指出機(jī)構(gòu)知識(shí)庫(kù)可以為高等教育機(jī)構(gòu)提供變革的力量,并支持學(xué)術(shù)活動(dòng)?;萜展緦?shí)驗(yàn)室與麻省理工學(xué)院合作,從事IR的基礎(chǔ)理論研究及操作平臺(tái)的開發(fā),于2002年11月,成功開發(fā)出DSpace(數(shù)字空間)并投入使用,收集來自MIT教職員工和研究人員的學(xué)術(shù)成果,并通過開源的方式,提供一系列遵循開放檔案信息系統(tǒng)參考模式的上載、管理、傳播數(shù)字信息的工具,對(duì)網(wǎng)絡(luò)用戶免費(fèi)開放,為機(jī)構(gòu)知識(shí)庫(kù)建設(shè)提供解決方案。研究熱點(diǎn)主要集中在機(jī)構(gòu)知識(shí)庫(kù)的概念、特點(diǎn)和系統(tǒng)建設(shè)方面,也是機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域的研究起點(diǎn),這一時(shí)期的文獻(xiàn)雖少,但這些高被引論文為機(jī)構(gòu)知識(shí)庫(kù)的研究奠定了基礎(chǔ)。
表4 國(guó)外歷年高被引論文
2005—2006年,對(duì)于機(jī)構(gòu)知識(shí)庫(kù)領(lǐng)域的研究開始進(jìn)入快速發(fā)展的黃金時(shí)期,在歐美等國(guó)的引領(lǐng)下,圖書館業(yè)界對(duì)建設(shè)機(jī)構(gòu)知識(shí)庫(kù)逐漸達(dá)成了共識(shí),紛紛創(chuàng)造條件建設(shè)機(jī)構(gòu)知識(shí)庫(kù),各國(guó)機(jī)構(gòu)知識(shí)庫(kù)的相關(guān)研究得到蓬勃發(fā)展。這一時(shí)期的主要研究熱點(diǎn)主要集中在機(jī)構(gòu)知識(shí)庫(kù)建設(shè)實(shí)踐方面,這些實(shí)踐研究也為今后各國(guó)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)提供了參考。機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟也在這一時(shí)期興起,聯(lián)盟內(nèi)部向著平臺(tái)整合,形成統(tǒng)一的機(jī)構(gòu)知識(shí)庫(kù)服務(wù)系統(tǒng)方向發(fā)展,解決了技術(shù)開發(fā)能力欠缺、大量人力、物力重復(fù)性投入的問題,對(duì)機(jī)構(gòu)知識(shí)庫(kù)的推廣起著重要作用。
2007年以后,針對(duì)機(jī)構(gòu)知識(shí)庫(kù)的研究開始進(jìn)入穩(wěn)定增長(zhǎng)期,此時(shí)的研究熱點(diǎn)轉(zhuǎn)向機(jī)構(gòu)知識(shí)庫(kù)的可持續(xù)發(fā)展方面,學(xué)者們針對(duì)諸如機(jī)構(gòu)知識(shí)庫(kù)運(yùn)行機(jī)理、提升使用率、擴(kuò)展數(shù)據(jù)服務(wù)等機(jī)構(gòu)知識(shí)庫(kù)建設(shè)實(shí)踐中的問題展開了更深層次的研究,研究的關(guān)注點(diǎn)開始轉(zhuǎn)向用戶需求分析、建設(shè)模式調(diào)整、服務(wù)內(nèi)容拓展、開放獲取生態(tài)系統(tǒng)、圖書館在數(shù)據(jù)服務(wù)中的自我定位、機(jī)構(gòu)知識(shí)庫(kù)系統(tǒng)功能的深入開發(fā)等方面。綜上,國(guó)外研究對(duì)機(jī)構(gòu)知識(shí)庫(kù)在科研數(shù)據(jù)管理、共享中的地位和作用表示了肯定,并對(duì)機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)開展了廣泛的實(shí)證研究。
通過上文分析,目前筆者對(duì)機(jī)構(gòu)知識(shí)庫(kù)建設(shè)中存在的問題及未來發(fā)展方向總結(jié)如下:
論文的版權(quán)許可問題。不同機(jī)構(gòu)知識(shí)庫(kù)中的資源存儲(chǔ)策略有一定區(qū)別,存繳的版本包括發(fā)表前的預(yù)印本和正式發(fā)表的版本,對(duì)于正式發(fā)表的版本會(huì)涉及到出版社的版權(quán)許可問題。目前實(shí)現(xiàn)開放存取主要有兩大途徑:金色OA和綠色OA,金色OA指整個(gè)期刊的文章都可免費(fèi)獲??;綠色OA指作者對(duì)手稿進(jìn)行自存檔處理后,存入機(jī)構(gòu)知識(shí)庫(kù)。機(jī)構(gòu)知識(shí)庫(kù)存儲(chǔ)中涉及到版權(quán)問題的文章即為非金色OA的文章,對(duì)于綠色OA文章,機(jī)構(gòu)知識(shí)庫(kù)大多采用延遲一段時(shí)間(一般為6—12個(gè)月)或存儲(chǔ)預(yù)印本來解決版權(quán)問題。目前幾乎所有的公共科研自助者都發(fā)布了支持開放獲取的政策,2013年5月全球研究理事會(huì)公布開放獲取行動(dòng)計(jì)劃,歐盟2016競(jìng)爭(zhēng)力會(huì)議要求科技論文在2020年全部OA化,但是完全實(shí)現(xiàn)科研人員、出版商、機(jī)構(gòu)三方共同協(xié)作仍需一定過程。
機(jī)構(gòu)知識(shí)庫(kù)數(shù)據(jù)數(shù)量、質(zhì)量問題。機(jī)構(gòu)知識(shí)庫(kù)中資源的收集量偏少成為機(jī)構(gòu)知識(shí)庫(kù)的普遍問題[28],機(jī)構(gòu)知識(shí)庫(kù)的作者自我存檔率和全文率并不高,這除了與版權(quán)問題相關(guān)外,缺乏相應(yīng)的政策激勵(lì)也是重要原因之一,因此機(jī)構(gòu)知識(shí)庫(kù)建設(shè)時(shí)應(yīng)持續(xù)關(guān)注全文率、作者自存檔率和文摘率。與此同時(shí),雖然機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)逐漸由收集公開發(fā)表的數(shù)字化資源成果轉(zhuǎn)向科研數(shù)據(jù)的存儲(chǔ),但數(shù)據(jù)存儲(chǔ)管理仍任重而道遠(yuǎn),許多并未正式出版但是具有重要科研價(jià)值的學(xué)術(shù)成果并未得到充分重視與認(rèn)可,數(shù)據(jù)的歸檔與保存仍需要圖書館與學(xué)校、社會(huì)相關(guān)機(jī)構(gòu)持續(xù)進(jìn)行互補(bǔ)性合作。此外,與傳統(tǒng)期刊相比,機(jī)構(gòu)知識(shí)庫(kù)最大的弱勢(shì)在于沒有嚴(yán)格的同行評(píng)議過程,因此未來機(jī)構(gòu)知識(shí)庫(kù)發(fā)展面臨的巨大挑戰(zhàn)之一就是對(duì)機(jī)構(gòu)知識(shí)庫(kù)內(nèi)容的質(zhì)量控制,只有保證數(shù)據(jù)的數(shù)量和質(zhì)量,機(jī)構(gòu)知識(shí)庫(kù)才能實(shí)現(xiàn)可持續(xù)發(fā)展。服務(wù)方面,目前機(jī)構(gòu)知識(shí)庫(kù)的建設(shè)大多停留在靜態(tài)數(shù)字資源的典藏階段,服務(wù)模式單一,用戶與知識(shí)原創(chuàng)者缺乏溝通渠道。通過建立機(jī)構(gòu)知識(shí)庫(kù)評(píng)價(jià)體系,提高機(jī)構(gòu)知識(shí)庫(kù)內(nèi)容及功能的可用性,是未來機(jī)構(gòu)知識(shí)庫(kù)可持續(xù)發(fā)展的方向之一。因此,在未來機(jī)構(gòu)知識(shí)庫(kù)建設(shè)中,要優(yōu)化、擴(kuò)展數(shù)據(jù)存儲(chǔ)服務(wù),提升用戶體驗(yàn),建立完善的機(jī)構(gòu)知識(shí)庫(kù)評(píng)價(jià)機(jī)制,從用戶出發(fā),一方面細(xì)化服務(wù),提升服務(wù)質(zhì)量;另一方面擴(kuò)展服務(wù)內(nèi)容,同時(shí)為數(shù)據(jù)質(zhì)量把關(guān),并制定有效的推廣計(jì)劃,提升數(shù)據(jù)的利用率,服務(wù)于科研活動(dòng),促進(jìn)知識(shí)流動(dòng)。
機(jī)構(gòu)知識(shí)庫(kù)元數(shù)據(jù)標(biāo)準(zhǔn)化問題。機(jī)構(gòu)知識(shí)庫(kù)的元數(shù)據(jù)及功能標(biāo)準(zhǔn)化是實(shí)現(xiàn)開放獲取和資源共享的關(guān)鍵,資源開放率和全文獲取率的高低直接影響機(jī)構(gòu)知識(shí)庫(kù)的使用價(jià)值和影響力。機(jī)構(gòu)知識(shí)庫(kù)建立的初衷在于開放共享,提升科研成果的影響力,這就需要機(jī)構(gòu)知識(shí)庫(kù)建設(shè)保證其元數(shù)據(jù)的標(biāo)準(zhǔn),以便為搜索引擎獲取。根據(jù)統(tǒng)計(jì)顯示,目前科研數(shù)據(jù)機(jī)構(gòu)知識(shí)庫(kù)的數(shù)據(jù)開放性和獲取率仍較低,除了受版權(quán)許可問題及科研人員自身意愿所限之外,元數(shù)據(jù)是否標(biāo)準(zhǔn)化也是影響數(shù)據(jù)獲取率的因素之一。因此需要加強(qiáng)機(jī)構(gòu)知識(shí)庫(kù)元數(shù)據(jù)的標(biāo)準(zhǔn)化,促進(jìn)機(jī)構(gòu)知識(shí)庫(kù)之間的數(shù)據(jù)融合,實(shí)現(xiàn)數(shù)據(jù)共享。
機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟化,擴(kuò)大數(shù)據(jù)量,提高數(shù)據(jù)價(jià)值。機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟既可解決單個(gè)學(xué)術(shù)機(jī)構(gòu)在構(gòu)建自身機(jī)構(gòu)知識(shí)庫(kù)時(shí)面臨的資金缺乏、內(nèi)容征集難、技術(shù)條件不成熟等問題,又可避免各機(jī)構(gòu)資源重復(fù)建設(shè);同時(shí)各機(jī)構(gòu)間數(shù)據(jù)分布式整合和統(tǒng)一管理也可促進(jìn)各機(jī)構(gòu)資源融合,擴(kuò)大覆蓋學(xué)科范圍,提升數(shù)據(jù)規(guī)模,為數(shù)據(jù)增值,有利于實(shí)現(xiàn)各機(jī)構(gòu)資源開放存取的最大化利用。建立機(jī)構(gòu)知識(shí)庫(kù)的目的是為了促進(jìn)科研數(shù)據(jù)的共享,高校機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟化對(duì)于弱化高??蒲谢顒?dòng)的小科學(xué)特征、建立科學(xué)數(shù)據(jù)聯(lián)盟、提高數(shù)據(jù)價(jià)值具有重要意義。同時(shí),機(jī)構(gòu)知識(shí)庫(kù)聯(lián)盟也應(yīng)積極與政府等相關(guān)部門溝通,制定相關(guān)的激勵(lì)政策和支持,實(shí)現(xiàn)機(jī)構(gòu)知識(shí)庫(kù)的可持續(xù)發(fā)展。
(來稿時(shí)間:2019年4月)