王紅霞 汪益
摘要:文章根據(jù)醫(yī)學(xué)機構(gòu)知識庫灰色資源建設(shè)中存在的問題,提出灰色資源建設(shè)的質(zhì)量控制機制,通過引入?yún)^(qū)塊鏈技術(shù)來加強灰色資源內(nèi)容建設(shè),對機構(gòu)知識成果進行再組織與利用,在保證灰色資源質(zhì)量控制的同時還能黏住用戶,拓展機構(gòu)庫的知識服務(wù)功能,形成知識成果傳播與利用的生態(tài)循環(huán)鏈,構(gòu)建一個可持續(xù)發(fā)展的共享型機構(gòu)知識庫模型。
關(guān)鍵詞:灰色資源;機構(gòu)知識庫;區(qū)塊鏈
中圖分類號:R197.3;G250.74文獻標志碼:A文獻標志碼
0 引言
醫(yī)學(xué)機構(gòu)在基礎(chǔ)研究、臨床研究、疾病診療等實踐中會形成大量優(yōu)秀的知識成果,這些成果包含多種形式,如傳統(tǒng)的期刊論文、會議論文、專著、專利、科研立項書、成果申報報告、影像資料等公開可查的資源,也會有內(nèi)部期刊、臨床實踐路徑、各類指南、研究報告、博碩士學(xué)位論文、一手實驗數(shù)據(jù)、特殊病例或死亡病案討論分析報告、誤診分析報告、MDT討論分析報告、某個專題的最新研究動態(tài)、某個疾病最新尖端技術(shù)報告以及新冠疫情這樣的突發(fā)事件專題研究等眾多種類型的灰色資源。這些灰色資源往往隱匿在醫(yī)學(xué)領(lǐng)域的各個方面,具有針對性、新穎性、隱蔽性等特征。它們不僅具有非常強的專業(yè)價值、臨床價值以及社會價值,有些甚至比公開發(fā)表的資源更具有代表性和專業(yè)性。在機構(gòu)知識庫建設(shè)中,資源建設(shè)是機構(gòu)知識庫建設(shè)能否成功的關(guān)鍵要素[1]?;疑Y源更是機構(gòu)知識庫建設(shè)不可忽視的重要組成部分[2]。機構(gòu)知識庫在保障公開資源建設(shè)的同時必須注重灰色資源的搜集、整理和利用,充分發(fā)揮其在推動醫(yī)學(xué)發(fā)展中的積極作用。
1 機構(gòu)知識庫灰色資源建設(shè)現(xiàn)狀
1.1 國外研究
國外高校與研究所最初的機構(gòu)知識庫建設(shè)主要限于保存研究論文、報告或少部分灰色文獻(主要是內(nèi)部出版物:內(nèi)刊、報道、會議紀要等)等。隨著對研究數(shù)據(jù)管理和共享的關(guān)注不斷增加,在這一趨勢下,開始加強灰色數(shù)據(jù)資源的管理,升級和優(yōu)化傳統(tǒng)機構(gòu)知識庫服務(wù)功能,如明尼蘇達大學(xué) UDC、康奈爾大學(xué) eCommons;同時,一些機構(gòu)通過構(gòu)建獨立的數(shù)據(jù)服務(wù)平臺來實現(xiàn)對灰色資源的長期保存與共享,如伊利諾伊大學(xué)厄巴納香檳分校的Illinois Data Bank、密歇根大學(xué)的Deep Blue Data以及普渡大學(xué)的PURR[3-5]。
1.2 國內(nèi)研究
近年來,我國機構(gòu)知識庫數(shù)量呈急速增長的趨勢,但資源建設(shè)未能同步進行[6]。司莉等[5]對高校機構(gòu)知識庫的建設(shè)需求做了調(diào)研,指出目前機構(gòu)知識庫的功能作用已得到科研人員的廣泛認可,但其資源質(zhì)量的滿意度仍不高;鄧支青[7]調(diào)研顯示,目前建成的高校機構(gòu)知識庫大部分是依靠第三方數(shù)據(jù)庫商提供數(shù)據(jù)建立的相對獨立的“重組型”靜態(tài)數(shù)據(jù)庫,其功能局限于對本機構(gòu)公開知識成果的收集、整理、保存與檢索利用,對灰色資源的資源開發(fā)、挖掘和保存嚴重不足。相對于高校機構(gòu)知識庫,醫(yī)學(xué)機構(gòu)庫的資源類型更少,即便是北京大學(xué)醫(yī)學(xué)部機構(gòu)知識庫的資源類型涵蓋了20多種,但在官網(wǎng)上可以看到許多資源類型的數(shù)量是個位數(shù),這與其學(xué)術(shù)地位與學(xué)術(shù)成果是不匹配的[8]。
綜上所述,我國無論是高校還是醫(yī)學(xué)機構(gòu)知識庫的灰色資源建設(shè)、開發(fā)與利用等方面都嚴重不足。由于灰色資源自身的特殊屬性,全面性、安全性、保密性以及患者個人隱私等問題成為制約建設(shè)的主要原因。要從根本上解決這些問題,就需要建立完整的灰色資源質(zhì)量控制機制,通過引入?yún)^(qū)塊鏈技術(shù)的分布式存儲、智能合約、共識機制、加密鑰匙與隱私保護等手段,可以有效解決用戶擔(dān)憂的全面性、版權(quán)問題、個人隱私、長期安全保存、可使用性、可追溯來源性等方面的問題。這些技術(shù)的應(yīng)用不僅有助于提升灰色資源的質(zhì)量和可信度,還有望促進知識庫建設(shè)的可持續(xù)發(fā)展。
2 構(gòu)建醫(yī)學(xué)機構(gòu)知識庫灰色資源建設(shè)的質(zhì)量控制機制
2.1 學(xué)術(shù)質(zhì)量控制機制
灰色資源通常是未公開發(fā)表的,來源復(fù)雜且種類繁多,缺乏統(tǒng)一的檢驗標準,缺乏同行專家學(xué)者的評審。機構(gòu)知識庫系統(tǒng)管理員很難全方位評估這些資源,如果沒有進行質(zhì)量評估就進行收錄和存儲,將導(dǎo)致資源繁雜無序,學(xué)術(shù)質(zhì)量參差不齊,降低用戶對機構(gòu)庫的資源質(zhì)量的信心。因此,在保障資源數(shù)量的同時,應(yīng)注重學(xué)術(shù)質(zhì)量的把控。在收納灰色資源時,可以結(jié)合資源存繳對象的學(xué)術(shù)背景和資源質(zhì)量,設(shè)定一個相對統(tǒng)一的價值認定標準和評審制度,設(shè)置自動查重機制,以保障學(xué)術(shù)質(zhì)量的同時防止資源冗余或無效。在做價值認定時,可以根據(jù)灰色資源的內(nèi)容將其分為學(xué)術(shù)型和應(yīng)用型,或根據(jù)內(nèi)容質(zhì)量將其分為科學(xué)型、創(chuàng)新型、實用型、一般型等。對于不同的內(nèi)容和質(zhì)量可以賦予不同的權(quán)重,這些權(quán)重可以根據(jù)同行專家評價來確定。這樣的學(xué)術(shù)質(zhì)量控制機制有助于提高機構(gòu)知識庫的整體學(xué)術(shù)水平,確保用戶對資源的信賴。
2.2 元數(shù)據(jù)質(zhì)量機制
灰色資源種類繁雜,大都散落在個人手中,通常以自主提交的方式進行資源的存繳。在這個過程中,元數(shù)據(jù)的質(zhì)量難以控制,經(jīng)常出現(xiàn)格式雜亂、有效信息缺失、資源內(nèi)容和屬性不符、拼寫錯誤、數(shù)據(jù)冗余等問題。根據(jù)美國信息標準組織提出的6條原則,元數(shù)據(jù)標準是要支持互操作、控制使用權(quán)限、用內(nèi)容標準來描述對象、包含使用條款、支持長期保存、具有良好質(zhì)量[9]。除上述原則外,灰色資源的元數(shù)據(jù)質(zhì)量控制還應(yīng)遵循便捷性、準確性、智能性、可擴展性和用戶需求性的原則[10]?;谶@些原則和標準,建立一個靈活、簡單、便捷、實用、可擴展的元數(shù)據(jù)庫至關(guān)重要。元數(shù)據(jù)的輸入可以通過自動選擇、手動輸入、與語音錄入相結(jié)合的方式,節(jié)省繳存時間。通過元數(shù)據(jù)庫質(zhì)量控制機制不僅有助于提高元數(shù)據(jù)的整體質(zhì)量,也更符合用戶的實際需求。
2.3 版權(quán)界定和共享機制
灰色資源具有信息含量高、社會價值大等特點。然而,由于這類資源沒有對外公開發(fā)表過,且流通范圍有限,一旦發(fā)生剽竊很難被發(fā)現(xiàn)和界定,常常會因為怕被侵權(quán)而不愿分享,因此對灰色資源的版權(quán)保護和界定在機構(gòu)知識庫建設(shè)中尤為重要。為確保用戶的版權(quán)權(quán)益,在提交資源時,用戶需要通過簽署授權(quán)協(xié)議書和知識共享許可協(xié)議來進行法律保障。在授權(quán)協(xié)議書中,用戶需要聲明自己所提交的內(nèi)容不侵犯他人的知識產(chǎn)權(quán)和隱私,且不包含國家機密或商業(yè)機密;同時為保證資源提供者的合法權(quán)益,機構(gòu)會開通權(quán)限設(shè)置,允許提交者設(shè)置開放對象、時間和范圍,同時具有更改權(quán)。機構(gòu)根據(jù)現(xiàn)有資源存繳政策、版權(quán)法、著作權(quán)法等法定規(guī)定制定本機構(gòu)的知識共享許可協(xié)議,將繳存成果分為法定共享型、著作權(quán)保護原創(chuàng)型、文化保存等,從而有效界定和保護作者、機構(gòu)、用戶的版權(quán)范圍,降低版權(quán)侵權(quán)和糾紛的發(fā)生。通過版權(quán)界定和共享機制有助于維護知識庫的合規(guī)合法性,能促進資源的共享與利用。
2.4 彈性自存儲與即時使用機制
成本因素包括在自存儲過程中額外付出的時間和精力,是影響學(xué)者存儲積極性的主要原因之一[11]。為了克服這一障礙,可以利用新的信息技術(shù)來簡化存儲流程,實現(xiàn)隨時隨地的彈性存儲,加強與各個系統(tǒng)平臺之間對接,避免用戶重復(fù)操作或反復(fù)存儲同一資源。利用新的信息技術(shù),如可以將用戶的電子名片加入微信小程序,用戶只需打開微信即可獲得自己的學(xué)術(shù)成果,也可以及時推廣自己的學(xué)術(shù)成果。通過彈性自存儲機制與即時使用機制,可在尊重用戶成果的同時尊重用戶的使用體驗,讓用戶在機構(gòu)庫內(nèi)可以感受到自我成就的實現(xiàn)感和被尊重感。這樣可以有助于降低存儲成本,提高學(xué)者存儲的積極性,并創(chuàng)造更加便捷、高效的學(xué)術(shù)成果管理體驗。
2.5 完善存繳政策,建立激勵機制
通過多部門合作,結(jié)合項目考核、職稱評定等方面,完善存繳政策,給予繳存者配套的獎勵機制,同時采取有效的版權(quán)保護措施,以確?;疑墨I資源長期存繳和保存工作的順利進行。灰色文獻的交存可包括采購、捐贈、呈繳、交換、現(xiàn)場收集、索取、網(wǎng)絡(luò)檢索獲取、復(fù)制、資源共享等途徑。
3 借助區(qū)塊鏈技術(shù)搭建共享型醫(yī)學(xué)機構(gòu)知識庫平臺
3.1 區(qū)塊鏈技術(shù)與機構(gòu)知識庫建設(shè)具有很好的匹配性
區(qū)塊鏈原本是比特幣等加密貨幣存儲數(shù)據(jù)的一種獨特方式。廣義上講,區(qū)塊鏈技術(shù)是利用塊鏈式數(shù)據(jù)結(jié)構(gòu)驗證與存儲數(shù)據(jù)、利用分布式節(jié)點共識算法生成和更新數(shù)據(jù)、利用密碼學(xué)的方式保證數(shù)據(jù)傳輸和訪問的安全、利用由自動化腳本代碼組成的智能合約編程和操作數(shù)據(jù)的一種全新的分布式基礎(chǔ)架構(gòu)與計算方式[12]。從更寬泛的角度來看,兩者都是基于互聯(lián)網(wǎng)的數(shù)據(jù)庫產(chǎn)物,管理對象涉及分布式存儲、長期性、開源性、共享性、再利用性以及安全性等問題,因此區(qū)塊鏈技術(shù)與機構(gòu)庫建設(shè)之間有很好的匹配性。
3.2 區(qū)塊鏈的特性為機構(gòu)知識庫灰色資源建設(shè)提供的技術(shù)支持與保障
運用區(qū)塊鏈去中心化技術(shù)實現(xiàn)機構(gòu)庫用戶自由自主參與成果存儲。區(qū)塊鏈的分布式賬本具有的去中心化特點,意味著網(wǎng)絡(luò)中任意節(jié)點均具有對等的權(quán)利和義務(wù),不需要作為可信第三方的硬件或仲裁機構(gòu)[13]。通過區(qū)塊鏈技術(shù)構(gòu)建信任的微環(huán)境,打破了傳統(tǒng)知識產(chǎn)權(quán)時間和空間的限制,讓機構(gòu)庫系統(tǒng)中的用戶能夠放心、自由地在各個節(jié)點上傳、交換、記錄、更新成果,從而解決機構(gòu)知識庫建設(shè)過程中的各類資源,尤其是灰色資源收集難題。
運用區(qū)塊鏈不可篡改來保障機構(gòu)庫數(shù)據(jù)信息真實性。區(qū)塊鏈是一個鏈式結(jié)構(gòu),由一個個的區(qū)塊根據(jù)哈希指針首尾相連,每一個區(qū)塊一旦形成便不可改變。機構(gòu)庫利用區(qū)塊鏈技術(shù)讓每個成果都添加了唯一性標簽,使得只有數(shù)據(jù)擁有者能夠使用自己的私鑰對已鎖定權(quán)限的數(shù)據(jù)進行修改,從而防止其他人的篡改來保障數(shù)據(jù)信息的真實性。這樣就可以為機構(gòu)庫提供有效的保障措施,確保了數(shù)據(jù)的不可篡改性。
運用區(qū)塊鏈的共享機制與共享賬本來確保機構(gòu)庫數(shù)據(jù)透明性和可溯源性。區(qū)塊鏈上所有的數(shù)據(jù)基于共識機制,保障每個節(jié)點共享數(shù)據(jù)具有有效性及透明的可利用性,從而構(gòu)建信任基礎(chǔ)。機構(gòu)庫用戶通過區(qū)塊鏈的共識機制獲得機構(gòu)庫中高質(zhì)量的數(shù)據(jù)資源,并根據(jù)使用需求追溯到數(shù)據(jù)的完整來源。這樣不
僅提高了數(shù)據(jù)的透明度,也增強了機構(gòu)庫用戶對數(shù)據(jù)可信性的信任感。
運用區(qū)塊鏈的非對稱加密和授權(quán)技術(shù)來保障機構(gòu)庫的數(shù)據(jù)安全性。盡管存儲在區(qū)塊鏈上的信息是公開的,但用戶身份信息是經(jīng)過高度加密的,只有在數(shù)據(jù)擁有者授權(quán)情況下才可以訪問,從而保障數(shù)據(jù)安全性。機構(gòu)庫利用加密技術(shù)對審核過的數(shù)據(jù)進行加密后存儲,同時開放權(quán)限的控制權(quán)交給數(shù)據(jù)擁有者,使其能夠自主選擇全部公開、全部加密或僅向部分用戶公開等,有效保護用戶的知識產(chǎn)權(quán)與各類隱私問題。這樣不僅保證了數(shù)據(jù)的安全存儲,也尊重了用戶對其數(shù)據(jù)的控制權(quán)和隱私權(quán)。
運用區(qū)塊鏈的智能合約實現(xiàn)機構(gòu)庫與其他多系統(tǒng)的互通。區(qū)塊鏈是利用自動化腳本代碼組成的智能合約實現(xiàn)自動交易的。在機構(gòu)庫中,數(shù)據(jù)提供者全部以智能合約的形式寫入機構(gòu)庫的網(wǎng)絡(luò)節(jié)點,實現(xiàn)知識成果產(chǎn)權(quán)登記、確權(quán)、流通和侵權(quán)、追溯等功能,同時系統(tǒng)可以自動化地執(zhí)行預(yù)先設(shè)定好的規(guī)則和條款,實現(xiàn)多系統(tǒng)的數(shù)據(jù)互通。這樣不僅提升了知識成果的管理效率,還使機構(gòu)庫能夠更加智能地與其他系統(tǒng)進行協(xié)同操作。
3.3 基于區(qū)塊鏈技術(shù)搭建醫(yī)學(xué)機構(gòu)知識庫模型
區(qū)塊鏈的分布式存儲與時間鏈的特性能幫助機構(gòu)庫實現(xiàn)灰色資源長期安全保存與利用。其開源特性不僅可以幫助機構(gòu)庫實現(xiàn)數(shù)據(jù)匯集、數(shù)據(jù)挖掘、決策咨詢以及知識服務(wù)四者之間形成一個知識增值的生態(tài)鏈,還可以自如地與其他系統(tǒng)互通與融合。因此本研究設(shè)想建立一個基于區(qū)塊鏈技術(shù)的醫(yī)學(xué)機構(gòu)知識庫模型以加強機構(gòu)庫的建設(shè)(見圖1)。該模型的技術(shù)構(gòu)架主要由基礎(chǔ)資源層、區(qū)塊鏈層、支撐層、應(yīng)用層、用戶層組成?;A(chǔ)資源層涵蓋計算、存儲等底層資源;區(qū)塊鏈層主要包含運維監(jiān)控管理和區(qū)塊鏈全生命周期管理兩大塊內(nèi)容,其中區(qū)塊鏈全生命周期管理包含元數(shù)據(jù)存儲、用戶身份存儲、智能合約執(zhí)行、時間日志、安全密鑰、隱私保護、數(shù)字認證服務(wù)等要素;支撐層是在可信安全執(zhí)行環(huán)境下支撐區(qū)塊鏈層與應(yīng)用層之間進行鏈上加密、鏈上授權(quán)、鏈下交換;應(yīng)用層主要包括數(shù)據(jù)目錄管理、授權(quán)管理、數(shù)據(jù)內(nèi)容管理、區(qū)塊鏈配置管理、交通通道配置管理、數(shù)據(jù)共享交換中心、算法模型管理;用戶層包含數(shù)據(jù)擁有者、數(shù)據(jù)使用者、數(shù)據(jù)監(jiān)管者、數(shù)據(jù)服務(wù)者。
4 結(jié)論
基于灰色資源建設(shè)的醫(yī)學(xué)機構(gòu)知識庫將通過學(xué)術(shù)質(zhì)量、元數(shù)據(jù)標準、彈性自存儲、激勵機制等多方面的機制建設(shè)來保障資源建設(shè)的質(zhì)量控制。利用區(qū)塊鏈技術(shù)構(gòu)建的醫(yī)學(xué)機構(gòu)知識庫致力于解決灰色資源的知識產(chǎn)權(quán)保護、個人隱私、長期安全保存、機構(gòu)知識庫與其他系統(tǒng)的互通與融合、學(xué)者電子名片的推廣和應(yīng)用,以及通過智能應(yīng)用程序即時自主提交完善個人科技檔案云等問題。建立一個全面、精準、安全的醫(yī)學(xué)機構(gòu)庫,不僅實現(xiàn)了機構(gòu)庫倉儲功能,而且能進一步拓展機構(gòu)知識庫的服務(wù)功能,讓醫(yī)學(xué)知識鏈形成一個良性的生態(tài)循環(huán),真正促進醫(yī)學(xué)知識增值,從而實現(xiàn)機構(gòu)知識庫的可持續(xù)性發(fā)展。
參考文獻
[1]LAGZIAN F,ABRIZAH A,WEE M C.Critical success factors for institutional repositories implementation[J].Electronic Library,2015(2):196-209.
[2]冼懷靈.淺議高校圖書館灰色文獻的開發(fā)與利用[J].科技情報開發(fā)與經(jīng)濟,2015(16):10-12.
[3]都平平,李雨珂,孟勇,等.新一代機構(gòu)知識庫中研究數(shù)據(jù)的關(guān)聯(lián)組織研究[J].現(xiàn)代情報,2018(12):86-90.
[4]宋秀芬.機構(gòu)知識庫與數(shù)據(jù)知識庫比較研究[J].圖書館理論與實踐,2019(9):55-60.
[5]司莉,莊曉喆.我國高??蒲袛?shù)據(jù)機構(gòu)庫聯(lián)盟的建設(shè)需求調(diào)查與分析[J].圖書館,2017(7):19-26.
[6]邱小紅,姜穎.中美機構(gòu)知識庫資源建設(shè)現(xiàn)狀與特點剖析[J].圖書情報知識,2015(3):113-119.
[7]鄧支青.高校機構(gòu)知識庫內(nèi)容質(zhì)量控制策略研究[J].情報雜志,2018(9):173-178.
[8]蔡思明.面向數(shù)字學(xué)術(shù)資源保障體系的支撐型學(xué)術(shù)圖書館建設(shè)[J].農(nóng)業(yè)圖書情報學(xué)報,2020(9):67-76.
[9]NISO.A framework of guidance for building good digital collections[EB/OL].(2007-12-01)[2024-03-05].http://www.niso.org/publications/rp/framework 3.pdf.
[10]吳海媛,劉莉.面向高校機構(gòu)知識庫的灰色文獻建設(shè)機制研究[J].新世紀圖書館,2020(8):11-15.
[11]中國新聞出版研究院全國國民閱讀調(diào)查課題組.第十六次全國國民閱讀調(diào)查主要發(fā)現(xiàn)[J].出版發(fā)行研究,2019(6):33-36.
[12]袁勇,王飛躍.區(qū)塊鏈技術(shù)發(fā)展現(xiàn)狀與展望[J].自動化學(xué)報,2016(4):481-494.
[13]張珊.區(qū)塊鏈技術(shù)在電子檔案管理中的適用性和應(yīng)用展望[J].檔案管理,2017(3):18-19.
(編輯 姚 鑫編輯)
Research on medical institution knowledge base based on grey resource construction
Wang? Hongxia1, Wang? Yi2*
(1.Library, The Second Affiliated Hospital of Soochow University, Suzhou 215000, China;
2.The Affiliated Suzhou Hospital of Nanjing Univerisity Medical School, Suzhou 215000, China)
Abstract: Based on the problems existing in the construction of gray resources in the medical institutions knowledge base, a quality control mechanism for gray resource construction is proposed. This involves strengthening the content construction of gray resources by introducing blockchain technology, reorganizing and utilizing institutional knowledge achievements. This not only ensures the quality control of gray resources but also attracts users, expands the knowledge service functions of institutional databases, forms an ecological cycle of knowledge dissemination and utilization, and builds a sustainable and shared institutional knowledge base model.
Key words: gray resource; institutional repository; blockchain
基金項目:江蘇省圖書館學(xué)會課題;項目編號:22YB007;蘇州市圖書館學(xué)會課題;項目編號:23-B-08。
作者簡介:王紅霞(1976— ),女,研究館員,學(xué)士;研究方向:信息分析與研究,信息資源建設(shè)。
*通信作者:汪益(1975— ),男,主任醫(yī)師,碩士;研究方向:影像診斷。