馬 麗
(西安醫(yī)學院 圖書館,陜西 西安 710021)
圖書館信息資源整合,是指參照一定的標準與要求,使用多種技術,將多渠道、不同來源的數據、信息、資源進行集成,實現(xiàn)不同類型、多種格式信息之間的無縫連接[1]。經過整合后的圖書館信息庫,具有集成式、一體化檢索功能,可實現(xiàn)為終端用戶提供跨平臺、跨終端、跨數據庫、跨內容等多種新式服務。圖書館在市場內作為承載信息、典藏資源的主要場所,不僅可以為用戶提供資源檢索服務,還可以為物質資源與非物質資源的存儲提供安全、可靠的空間。為滿足圖書館服務對象的多元化需求,管理人員需要加大對資源信息整合的投入,從雜亂無序的資源中篩選出有價值的信息,將多種具有相同指向的信息進行集成,通過此種方式,使資源建設朝著整合化、集成化的方向發(fā)展[2]。為落實此項工作,向圖書館用戶提供更加優(yōu)質的服務,科研單位在較早時期引進大數據技術與云端共享技術進行信息資源的集成與融合,但由于設計的融合方法與用戶需求呈現(xiàn)背離狀態(tài),導致融合后的資源一直未能在圖書館發(fā)揮預期的效果,也未能實現(xiàn)給予用戶更優(yōu)質的推送資源。因此,本文將在現(xiàn)有工作的基礎上,引進關聯(lián)規(guī)則挖掘技術,設計一種針對圖書館信息資源的全新整合方法,通過此種方式,集成多類別信息,為圖書館用戶提供更加優(yōu)質的資源檢索服務。
為實現(xiàn)圖書館信息資源的有效整合,應結合圖書館信息資源的來源與獲取渠道,構建圖書館信息資源分布結構模型。為確保構建的模型與資源分布具有較強的適配性,引進Small-world網絡拓撲結構,參照此結構,建立圖書館信息資源存儲中心與來源渠道之間的直接訪問接口,實現(xiàn)對資源分布的精細化描述[3]。此過程如圖1所示。
圖1 圖書館信息資源分布結構模型
在掌握不同信息資源的來源渠道后,對現(xiàn)有信息進行屬性專項配置,通過此種方式,構建在不同時態(tài)區(qū)間下,圖書館信息資源的空間狀態(tài)[4]。對其狀態(tài)進行描述,計算公式如下:
(1)
式中:Pn為圖書館信息資源的空間狀態(tài);P0為資源在空間中的分布密度;δ為分布節(jié)點。在此過程中,假設信息資源在空間中的動態(tài)屬性表示為Y,此時Y可以作為空間中的一個因變量,假設圖書館信息資源表示為X,則X與Y之間存在某種約束性條件,對此種約束條件進行描述。計算公式如下:
(2)
式中:m為X的最大取值。在此基礎上,使用相關統(tǒng)計法,對資源進行在線調度,根據最優(yōu)線性均衡函數,進行圖書館信息資源存儲空間中信息的回歸表達,方程式如下:
(3)
式中:x為圖書館信息資源存儲空間中信息的回歸表達方程式;η為動態(tài)回歸參量;r為資源在圖書館中的有效傳輸路徑;T為資源調度時間;R為資源覆蓋范圍;s為信息資源流通節(jié)點;σ為資源傳輸路徑總數;N為鏈路結構;z為鏈路長度;y為信息資源格式。通過上述方式,對圖書館信息資源的空間狀態(tài)與來源渠道進行描述,將相關信息通過集成的方式導入結構模型,實現(xiàn)對信息資源分布狀態(tài)的描述。
完成上述設計后,為實現(xiàn)圖書館信息資源的整合,需結合資源在空間中的分布特征,進行歷史數據的挖掘。為此,本章引進關聯(lián)規(guī)則挖掘技術,根據圖書館中現(xiàn)有信息資源,進行信息資源特征的提取。在此過程中,使用關聯(lián)規(guī)則挖掘技術中的Apriori算法,提取數據庫中的兩組信息資源,將其表示為A與B,對A與B的潛在聯(lián)系進行挖掘。此過程可表示如下:
(4)
式中:p為A與B的關聯(lián)挖掘;γ為關聯(lián)規(guī)則;b為關聯(lián)條件。按照上述方式,提取A與B的關聯(lián)關系,掌握兩者之間的聯(lián)系后,持續(xù)擴大事件的選擇范圍,進行信息資源的頻繁選擇。為避免輸出冗余信息,可設置一個偽代碼將其作為信息資源規(guī)律挖掘的全新規(guī)則,將此作為參照,對圖書館信息資源進行深度挖掘與關聯(lián),通過此種方式,提取圖書館信息資源特征,此過程可表示為:
(5)
式中:M為圖書館信息資源特征;n為偽代碼;v為資源有效傳輸區(qū)間;i為資源類別數量。按照上述計算公式,進行圖書館中不同類別信息資源特征的提取,以此方式為后續(xù)信息資源聚類中心的確定提供支撐。
完成上述研究后,建立針對特征的空間映射函數,函數表達式如下:
(6)
式中:D為圖書館信息資源特征空間映射函數;L為空間映射范圍。在此基礎上,設計一個隨機聚類節(jié)點,建立針對此節(jié)點的鏈路矩陣,矩陣表示為S,S可以通過N×L實現(xiàn)??紤]到此節(jié)點可能并非信息資源聚類最優(yōu)節(jié)點,因此,可以在構建矩陣后,采用概率分布計算的方式,進行節(jié)點為最優(yōu)聚類中心概率的計算,計算公式如下:
(7)
式中:β為節(jié)點為最優(yōu)聚類中心的概率;Z為資源分布離散型;G為節(jié)點時隙;w為節(jié)點最大跳點;χ為空間調度矢量。通過上述方式,掌握節(jié)點與最優(yōu)聚類中心之間的關系,為實現(xiàn)聚類節(jié)點向最優(yōu)節(jié)點的靠近,結合自適應算法,根據節(jié)點數據之間的關聯(lián)性,進行聚類中心節(jié)點的優(yōu)化。此過程計算公式如下:
κ=E[ωk(vj)]
(8)
式中:κ為最優(yōu)聚類中心節(jié)點;E為自適應調度算法;ω為嵌入式網絡環(huán)境;k為模糊中心;j為可調度節(jié)點。按照上述方式,設計最優(yōu)聚類中心,在此節(jié)點進行信息資源的聚類融合。此過程計算公式如下:
f(κ)=μK·ij
(9)
式中:f為圖書館信息資源的聚類融合;μ為均衡信道;K為節(jié)點差分矩陣;ij為聚類過程中的奇異值。按照上述方式,對圖書館信息資源進行聚類,以此種方式,完成基于關聯(lián)規(guī)則挖掘的圖書館信息資源整合方法設計與研究。
上文從3個方面完成了基于關聯(lián)規(guī)則挖掘的圖書館信息資源整合方法設計,為檢驗此方法在實際應用中的整合效果,下文將以某地區(qū)大型公共圖書館為例,通過設計對比實驗的方式,檢驗本文方法的整合效果。
實驗前,由相關人員與圖書館管理人員進行交涉,發(fā)現(xiàn)此圖書館已經實現(xiàn)其內部的全數字化管理,并開發(fā)了完善的信息資源庫,用于存儲多渠道、多來源的信息資源。通過對管理終端的檢索,掌握此圖書館現(xiàn)存資源的類別與來源。
為進一步檢驗本文設計的整合方法在實際應用中的性能,引進基于云處理技術的圖書館信息資源整合方法,將其作為傳統(tǒng)方法,對所選用的信息資源進行整合。在此過程中,需要先將信息資源導入圖書館管理云端,在云端建立數據信息聚類中心,在中心區(qū)域內進行數據類別的劃分,將具有相同特征的圖書館信息資源進行聚類;完成區(qū)塊信息的聚類后,再將多個分項單元進行整合,通過此種方式,實現(xiàn)基于傳統(tǒng)方法的圖書館信息資源整合。
將整合處理后資源的查全率作為評價整合方法有效性的指標。查全率是指在數據庫中輸入檢索關鍵詞,可檢索得到的和關鍵詞相關的信息量與數據庫中和檢索關鍵詞相關的信息總量比值,計算公式如下:
(10)
式中:C為整合處理后圖書館信息資源的查全率;C1為可檢索得到的與關鍵詞相關的信息量;C2為數據庫中與檢索關鍵詞相關的信息總量。按照上述方式,在兩種方法整合后的數據庫中搜索關鍵詞,計算檢索不同關鍵詞時數據庫的查全率。統(tǒng)計測試結果如表1所示。
表1 圖書館信息資源整合后的查全率
從表1可以看出,本文方法在實際應用中的整合效果較好,可以提高整合后圖書館內信息資源的集成度,從而為用戶提供更豐富的檢索信息。
在信息化技術與圖書館發(fā)展發(fā)生融合后,圖書館早期的典藏方式與讀物模式都面臨著巨大的沖擊,如何為用戶提供更加優(yōu)質的資源、提高資源的專項性與服務性成為圖書館管理工作關注的重點。為進一步落實此項工作,發(fā)揮圖書館在市場內更高的價值與效能,本文從構建圖書館信息資源分布結構模型、信息資源特征提取、基于特征辨識的信息資源聚類融合3個方面,開展了基于關聯(lián)規(guī)則挖掘的圖書館信息資源整合方法設計研究。完成設計后,通過對比實驗證明了相比傳統(tǒng)方法,本文設計的融合方法聚類效果更優(yōu)。因此,可在進行圖書館的服務優(yōu)化設計時,將本文方法在試點單位中進行推廣,通過此種方式,為用戶提供更加優(yōu)質的資源檢索服務。