国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語義關(guān)聯(lián)的數(shù)字圖書館館藏資源聚合研究

2022-09-20 13:08:52魏明坤滕聞軒馮昌揚河北大學管理學院華中師范大學信息管理學院
圖書館理論與實踐 2022年5期
關(guān)鍵詞:關(guān)聯(lián)檢索語義

魏明坤,滕聞軒,馮昌揚(.河北大學管理學院;.華中師范大學信息管理學院)

近年來,數(shù)字經(jīng)濟的蓬勃發(fā)展以及數(shù)字信息的快速更新,使得數(shù)字資源管理成為資源管理系統(tǒng)的重要內(nèi)容。深度關(guān)聯(lián)并有效識別數(shù)字資源為用戶提供精準的信息檢索服務(wù),是館藏數(shù)字資源化發(fā)展的必然要求。隨著數(shù)字資源的復(fù)雜化、信息環(huán)境的泛在化和用戶需求的個性化,如何通過數(shù)字資源聚合技術(shù)提供全面、準確的知識服務(wù),優(yōu)化數(shù)字資源服務(wù)能力成為業(yè)界亟須研究和探討的問題。本研究從用戶的個性化需求出發(fā),在多源異構(gòu)數(shù)據(jù)集處理基礎(chǔ)上構(gòu)建數(shù)字資源聚合框架,實現(xiàn)數(shù)字資源語義層面的聚合,為用戶提供更好的知識服務(wù)。

1 數(shù)據(jù)采集與研究方法

本研究以數(shù)字資源聚合為研究對象,以中國知網(wǎng)為數(shù)據(jù)來源,以 “數(shù)字資源聚合” or “數(shù)字資源整合” or “數(shù)字資源融合” 為檢索式進行主題檢索,檢索時間截至2021年12月31日,共得到有效數(shù)據(jù)741條。本研究在對數(shù)字資源聚合研究主題進行梳理的同時,提出了語義關(guān)聯(lián)的數(shù)字資源聚合框架,采用定量分析方法揭示館藏數(shù)字資源聚合研究主題之間的差異,進而推進館藏數(shù)字資源聚合的深入研究。

2 結(jié)果分析

2.1 數(shù)字資源聚合研究主題年度分布

知識圖譜以更直觀、清晰的方式呈現(xiàn)研究內(nèi)容[1],關(guān)鍵詞突變分析能夠呈現(xiàn)研究主題的演變過程、研究熱點及知識基礎(chǔ),預(yù)測研究主題的交叉、滲透和衍生趨勢。通過文獻分析可以發(fā)現(xiàn),在2002年已有相關(guān)研究文獻借助CiteSpace分析數(shù)字資源聚合研究文獻的主題分布和發(fā)展趨勢,本研究時間閾值設(shè)置為2002—2021年,單個時間分區(qū)為2年。通過關(guān)鍵詞突變分析可以得到關(guān)鍵詞突變強度值,探測頻次強度較大的關(guān)鍵詞,進一步掌握研究前沿領(lǐng)域的演進情況(見表1)。

表1 數(shù)字資源聚合關(guān)鍵詞突變年度分布

表1統(tǒng)計了數(shù)字資源聚合突變值排名前20的關(guān)鍵詞。觀察突變詞變化情況可知,2003年為數(shù)字資源聚合主題發(fā)生突變的起點,經(jīng)歷了10多年的發(fā)展,研究突變從OPAC到關(guān)聯(lián)數(shù)據(jù),其中2007—2013、2012—2021階段突變點數(shù)量較突出。從文獻信息計量學角度,這些突變詞在一定程度上反映了數(shù)字資源聚合發(fā)展的研究過程,既反映了關(guān)鍵詞的變化,又體現(xiàn)了研究主題不同階段的特點。對關(guān)鍵詞的突變分析,可反映研究領(lǐng)域的現(xiàn)狀、熱點和未來趨勢[2]。

從突變值分析,自2015年起,大數(shù)據(jù)成為較突出的術(shù)語,大數(shù)據(jù)發(fā)展在給數(shù)字資源聚合發(fā)展提出挑戰(zhàn)的同時也豐富了數(shù)字資源聚合的資源對象。數(shù)字資源聚合、信息資源整合、資源整合、檔案館、公共數(shù)字文化資源、信息資源、關(guān)聯(lián)數(shù)據(jù)、博物館等都成為數(shù)字資源聚合研究的突變術(shù)語,這些關(guān)鍵詞分階段反映了數(shù)字資源聚合研究主題的變化情況。通過對數(shù)字資源內(nèi)部特征進行聚合,可以發(fā)現(xiàn)數(shù)字資源之間的關(guān)聯(lián)主要側(cè)重于以信息組織為基礎(chǔ)進行聚合。賀德方等通過知識間的關(guān)聯(lián)實現(xiàn)了信息服務(wù)向知識服務(wù)的轉(zhuǎn)變,提出了基于概念及概念關(guān)系、引證關(guān)系和科研本體的數(shù)字資源聚合方式[3]。黃傳慧等從數(shù)據(jù)、信息、知識三者間的發(fā)展關(guān)系入手,認為數(shù)據(jù)整合、信息整合、知識整合構(gòu)成了數(shù)字信息資源的整合目標層,并指出基于知識本體的整合將成為未來的發(fā)展方向[4]。馬文峰對數(shù)字資源整合的內(nèi)涵、理論基礎(chǔ)、動因及方式等進行了研究,指出知識組織理論與方法是數(shù)字資源整合的基礎(chǔ)[5]。肖希明等根據(jù)對數(shù)字資源內(nèi)容的整合深度進行分析,從數(shù)據(jù)整合、信息整合及知識整合三個層面對數(shù)字資源整合方式進行了歸納和總結(jié)[6]。

通過分析數(shù)字資源聚合主題的時區(qū)演化,筆者發(fā)現(xiàn):2002—2004年研究主題主要包括數(shù)字圖書館、信息組織、知識組織、資源整合等;2004—2006年的研究主題主要包括公共圖書館、信息整合、元數(shù)據(jù)、公共圖書館等;2006—2008年的研究主題主要包括整合模式、整合方式、個性化服務(wù)、知識整合、數(shù)字資源組織、整合技術(shù)等;2008—2010年的研究主題主要包括數(shù)字資源建設(shè)、信息服務(wù)、網(wǎng)絡(luò)環(huán)境、整合機制等;2010—2012年的研究主題主要包括知識服務(wù)、關(guān)聯(lián)數(shù)據(jù)、館藏資源、云計算、資源整合等;2012—2016年的研究主題主要包括資源聚合、大數(shù)據(jù)、深度聚合、數(shù)字文獻資源、公共數(shù)字文化資源、知識發(fā)現(xiàn)、資源共享等;2016—2018年的研究主題主要包括知識聚合、資源再組織、館藏數(shù)字資源、非物質(zhì)文化遺產(chǎn)、用戶需求、數(shù)字資源共享等;2018—2021年的研究主題主要包括開發(fā)利用、數(shù)字資源轉(zhuǎn)化、館際合作、融合儲存策略、需求分析等。王平等對數(shù)字資源聚合管理系統(tǒng)的開放背景、結(jié)構(gòu)框架、運行環(huán)境等方面內(nèi)容進行了分析[7]。許鑫等將數(shù)字資源聚合研究應(yīng)用在學術(shù)期刊出版領(lǐng)域,構(gòu)建了學術(shù)期刊語義出版模型,并進行實證分析[8]。

關(guān)聯(lián)數(shù)據(jù)是用一種輕型的、可利用分布數(shù)據(jù)集及其自主內(nèi)容格式、基于標準的知識表示與檢索協(xié)議、可逐步擴展的機制來實現(xiàn)可動態(tài)關(guān)聯(lián)的知識對象網(wǎng)絡(luò),有利于實現(xiàn)知識組織和知識發(fā)現(xiàn)[9]。關(guān)聯(lián)數(shù)據(jù)與圖書情報工作領(lǐng)域密切相關(guān),關(guān)聯(lián)數(shù)據(jù)描述了通過可鏈接的URI進行發(fā)布、分享、鏈接Web中的資源的各種方法[10]。從技術(shù)層面,關(guān)聯(lián)數(shù)據(jù)有利于資源的發(fā)布,劉煒對關(guān)聯(lián)數(shù)據(jù)在圖書館行業(yè)的應(yīng)用進行了分析,指出關(guān)聯(lián)數(shù)據(jù)成為數(shù)字對象 “編目” 和 “規(guī)范控制” 的基礎(chǔ)技術(shù)[11],丁楠等指出關(guān)聯(lián)數(shù)據(jù)為圖書館信息資源聚合提供了新途徑[12]。

數(shù)字資源聚合包括聚集和整合兩個部分,聚集是指對數(shù)字資源與用戶需求的聚集,整合是指從用戶的需求出發(fā),對數(shù)字資源的內(nèi)容及數(shù)字資源服務(wù)內(nèi)容的整合。劉明輝等認為聚合方法屬于資源搜索的范疇,在信息的組織層面,內(nèi)容聚合器是資源聚合的重要方法[13],在此基礎(chǔ)上衍生出的聚合服務(wù)包括兩種類型,一種是簡單地從網(wǎng)站收集信息,另一種是為滿足客戶需求而收集和分發(fā)的內(nèi)容。通過關(guān)鍵詞分析,筆者發(fā)現(xiàn)數(shù)字圖書館館藏資源聚合研究側(cè)重數(shù)字信息資源的聚合與服務(wù)。

2.2 數(shù)字資源聚合研究主題聚類分析

數(shù)字資源聚合是指根據(jù)外部及內(nèi)在特征對無序、分散的數(shù)字資源進行處理,挖掘數(shù)字資源的關(guān)聯(lián)關(guān)系,為用戶提供服務(wù)的過程。數(shù)字資源的聚合反映數(shù)字資源存在不同程度的聯(lián)結(jié),《弱關(guān)系的力量》一書對聯(lián)結(jié)強度概念進行了分析,將其劃分為強聯(lián)結(jié)和弱聯(lián)結(jié),并利用互動的頻率、感情力量、親密程度和互惠來測度聯(lián)結(jié)的強弱程度[14],成員之間互動頻率較高、關(guān)系比較緊密、互惠程度較高為強聯(lián)結(jié),反之則為弱聯(lián)結(jié)。強聯(lián)結(jié)在網(wǎng)絡(luò)內(nèi)部的相似性較高,但范圍一般有限;而弱聯(lián)結(jié)是網(wǎng)絡(luò)組織之間獲得聯(lián)系的紐帶,作為大規(guī)模網(wǎng)絡(luò)形成的基礎(chǔ),分布的范圍較廣,網(wǎng)絡(luò)密度較小。通過網(wǎng)絡(luò)密度可以測度網(wǎng)絡(luò)中成員之間相互聯(lián)系的緊密程度,如果網(wǎng)絡(luò)中的兩個成員均與其他成員具有同等關(guān)系,則這兩個成員的結(jié)構(gòu)具有等效性,可以相互替換。

20世紀40年代末,Leavitt對網(wǎng)絡(luò)中心性概念進行了分析[15]。網(wǎng)絡(luò)中心性可分為點中心性和網(wǎng)絡(luò)中心性,前者用于測度個體處于網(wǎng)絡(luò)中心的程度,反映行為者在網(wǎng)絡(luò)中的影響程度,后者用于反映整個網(wǎng)絡(luò)中各個點的差異程度,體現(xiàn)的是整體網(wǎng)絡(luò)的整合性和一致性。通過社會網(wǎng)絡(luò)分析,筆者對數(shù)字資源聚合服務(wù)研究主題文獻進行了聚合(見圖1),節(jié)點之間的連線代表關(guān)鍵詞之間具有共現(xiàn)關(guān)系,連線疏密程度反映研究主題之間的緊密程度。通過計算可知,該網(wǎng)絡(luò)的平均距離為1.838,網(wǎng)絡(luò)聚集度為0.591,關(guān)鍵詞網(wǎng)絡(luò)關(guān)系密度為3.3975,表明聚合網(wǎng)絡(luò)中關(guān)鍵詞間的聯(lián)結(jié)最多經(jīng)過兩個,聚類效果較好,關(guān)鍵詞之間的關(guān)聯(lián)性較強。

圖1 數(shù)字資源聚合研究主題聚類

通過對數(shù)字資源聚合主題的聚類分析,筆者發(fā)現(xiàn)數(shù)字資源聚合研究主題的覆蓋范圍非常廣泛,不僅包括企業(yè)及政府部門,還包括圖書館、檔案館、博物館等涉及數(shù)字與信息資源的領(lǐng)域。數(shù)字資源聚合的研究內(nèi)容較豐富,如信息資源的聚合、信息服務(wù)的聚合、信息功能的聚合、信息技術(shù)的聚合、信息系統(tǒng)及軟件的聚合等。其中,數(shù)字資源聚合的對象不僅包括傳統(tǒng)信息資源,還包括大量的非結(jié)構(gòu)化信息資源、遠程信息資源等數(shù)字資源。即使數(shù)字資源形式多樣,聚合方式不盡相同,但數(shù)字資源聚合體系對本體論、語義網(wǎng)、信息構(gòu)建等理論與方法的應(yīng)用推動了數(shù)字整合研究的深入發(fā)展。在研究技術(shù)方面,信息技術(shù)不斷被應(yīng)用到數(shù)字資源聚合中,如 XML、OWL、數(shù)據(jù)挖掘、信息抽取、P2P、網(wǎng)格等,信息技術(shù)的發(fā)展推動了數(shù)字資源聚合研究的精細化發(fā)展。

2.3 數(shù)字資源聚合框架分析

數(shù)字資源語義聚合是指在元數(shù)據(jù)聚合的基礎(chǔ)上進行數(shù)字資源語義標注,通過構(gòu)建領(lǐng)域本體庫,實現(xiàn)語義關(guān)聯(lián)和語義服務(wù)。已有元數(shù)據(jù)的數(shù)字資源聚合并不能完全解決信息系統(tǒng)的語義異構(gòu)問題,包括數(shù)字資源采用不同元數(shù)據(jù)方案形成的微觀結(jié)構(gòu)異構(gòu)問題以及資源對象之間存在的復(fù)雜關(guān)聯(lián)關(guān)系。隨著數(shù)字資源數(shù)量的激增,基于文獻特征的聚合已不能滿足用戶的個性化需求,數(shù)字資源語義聚合成為數(shù)字資源聚合的發(fā)展主流。數(shù)字資源之間存在的關(guān)系是數(shù)字資源聚合的前提,從數(shù)字資源的結(jié)構(gòu)和內(nèi)容挖掘數(shù)字資源之間的關(guān)聯(lián)關(guān)系,如語義、本體、關(guān)聯(lián)數(shù)據(jù)、主題詞表等,成為館藏數(shù)字資源語義框架構(gòu)建的基礎(chǔ)?;谡Z義的館藏數(shù)字資源聚合框架對館藏數(shù)字資源標準化處理的元數(shù)據(jù)庫進行知識提取,通過語義本體、主題、關(guān)鍵詞或其他知識單元對數(shù)字資源進行知識表示,從而在信息技術(shù)、協(xié)議標準、知識組織的基礎(chǔ)上,解決數(shù)字資源庫之間孤立、內(nèi)容交叉或異構(gòu)問題,實現(xiàn)資源與個性化服務(wù)的關(guān)聯(lián),提升數(shù)字圖書館的服務(wù)能力。數(shù)字資源聚合框架(見圖2)在數(shù)據(jù)集層、知識表示層、語義檢索層的基礎(chǔ)上揭示了 “碎片化” 信息的內(nèi)在聯(lián)系,從而為用戶提供個性化知識服務(wù)。

圖2 數(shù)字資源聚合框架

(1)數(shù)據(jù)集層。數(shù)據(jù)集層將各種類型的數(shù)字資源采集入庫,其中源數(shù)據(jù)包括數(shù)字資源的書目數(shù)據(jù)庫、各種期刊論文數(shù)據(jù)、全文數(shù)據(jù)以及音頻、視頻數(shù)據(jù)等各種不同結(jié)構(gòu)的數(shù)據(jù),這些數(shù)字資源的表現(xiàn)形式和屬性各具特點。通過對這些數(shù)據(jù)的物理特性和內(nèi)容特征的分析、選擇和標記,進行元數(shù)據(jù)描述,建立關(guān)聯(lián)關(guān)系,實現(xiàn)知識表示。

(2)知識表示層。知識表示層在數(shù)據(jù)集層的基礎(chǔ)上,通過一定的知識表示技術(shù),將各種知識元的語義關(guān)系呈現(xiàn)出來,形成知識元之間的邏輯關(guān)系,構(gòu)建基于知識的信息網(wǎng)絡(luò)化結(jié)構(gòu)。知識表示的形式包括本體、主題和其他知識表現(xiàn)形式;本體包括學科的領(lǐng)域本體形式、通用本體等;主題是一種用于描述信息資源知識結(jié)構(gòu)的元數(shù)據(jù)格式,它可以定位某一知識概念所在的資源位置,也可以表示知識概念間的相互聯(lián)系,是一個主題概念網(wǎng)絡(luò),用于知識導(dǎo)航,幫助用戶快速定位所需知識元的位置,同時還可檢索和瀏覽相近或者相關(guān)知識元的位置。構(gòu)建本體庫、知識庫是將知識表示的本體和知識元存儲到一個或者多個知識庫中,實現(xiàn)對知識的本地化,這樣不僅能提高知識庫的可靠性,還能提高檢索效率、支持并發(fā)機制、避免訪問沖突,提高對本地知識庫的管理、更新和維護效率。

(3)語義檢索層。語義檢索層能夠為用戶提供直觀易用的檢索工具或平臺,實現(xiàn)人機交互功能。語義檢索層通過處理用戶的知識檢索需求,實現(xiàn)對用戶的檢索詞的語義分析,匹配相應(yīng)的本體概念,迅速找到知識元以及與其相關(guān)的數(shù)據(jù)資源,以可視化的方式為用戶呈現(xiàn)目標知識。用戶交互層面不僅為用戶提供簡單易用、功能強大的統(tǒng)一檢索界面,還可實現(xiàn)個性化定制等智能服務(wù),能同時接受和迅速處理用戶的需求信息。

3 結(jié)語

隨著公眾需求的多元化發(fā)展以及圖書館自身發(fā)展的需要,對圖書館數(shù)字資源的聚合成為用戶獲取全面、高質(zhì)量數(shù)字資源的有效手段。隨著網(wǎng)絡(luò)化、數(shù)字化時代的到來,圖書館的館藏資源發(fā)生了很大的變化,數(shù)字型資源在圖書館館藏中占據(jù)的比例越來越大,地位越來越重要。通過信息計量與可視化方法對數(shù)字資源聚合主題分布進行梳理,可以發(fā)現(xiàn)數(shù)字資源聚合研究主題較多,覆蓋多個研究領(lǐng)域,數(shù)字資源聚合不僅成為數(shù)字時代數(shù)字資源利用的有效途徑,而且范圍不斷擴大,不僅包括傳統(tǒng)的數(shù)字化文獻資源,還涉及數(shù)據(jù)、非物質(zhì)文化遺產(chǎn)、博物館等信息,這些都已成為數(shù)字資源聚合研究的對象,豐富了數(shù)字資源的聚合廣度。針對館藏數(shù)字資源聚合發(fā)展,本文在前人研究的基礎(chǔ)上,從數(shù)據(jù)集、知識表示、語義檢索三個層面提出數(shù)字資源的聚合框架,揭示了數(shù)字資源元素、結(jié)構(gòu)、層次等方面的映射關(guān)系,對數(shù)字資源知識表示進行分析,實現(xiàn)數(shù)字資源個性化知識服務(wù)。

猜你喜歡
關(guān)聯(lián)檢索語義
語言與語義
“一帶一路”遞進,關(guān)聯(lián)民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
2019年第4-6期便捷檢索目錄
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
認知范疇模糊與語義模糊
語言學與修辭學:關(guān)聯(lián)與互動
當代修辭學(2011年2期)2011-01-23 06:39:12
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
卓尼县| 吉水县| 平顶山市| 沈丘县| 神池县| 奉节县| 西乌珠穆沁旗| 景东| 弋阳县| 墨玉县| 晋中市| 平和县| 资兴市| 六枝特区| 丹东市| 新民市| 汉沽区| 礼泉县| 新闻| 乌恰县| 白朗县| 富宁县| 晋江市| 屯门区| 泌阳县| 邢台县| 沙洋县| 榆林市| 新干县| 农安县| 南召县| 平利县| 巴彦淖尔市| 徐闻县| 民勤县| 瑞昌市| 蒲江县| 嘉黎县| 内江市| 汕尾市| 秭归县|