国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng)設(shè)計

2023-08-27 09:02:38周香
電子設(shè)計工程 2023年17期
關(guān)鍵詞:查全率查準率書目

周香

(陜西電子信息職業(yè)技術(shù)學院,陜西西安 710500)

數(shù)字圖書館是一種新型的圖書管理模式,滿足了網(wǎng)絡(luò)化的需求。數(shù)字化、多媒體信息資源是數(shù)字圖書館服務(wù)的基礎(chǔ)與先決條件,也是數(shù)字圖書館建設(shè)的核心。作為信息資源的持有者和提供者,如何充分利用互聯(lián)網(wǎng),構(gòu)建大規(guī)模的數(shù)字資源庫,并通過互聯(lián)網(wǎng)進行網(wǎng)上查詢,是當前各大圖書館面臨的一個重要難題。圖書館是使用者能夠獲取最豐富的文獻資料的主要來源,過去的文獻資料則把圖書館與網(wǎng)絡(luò)之間的聯(lián)系分割開來。另外,不同的數(shù)字圖書館系統(tǒng)開發(fā)語言、開發(fā)平臺和通信協(xié)議也各不相同,在不同的數(shù)字圖書館體系中,信息資源的共享存在著很大的困難。文獻[1]提出的基于Solr 的標準查詢技術(shù),通過Solr 查詢引擎對標準書目進行拆分,并對查詢結(jié)果排序,使其應(yīng)用到數(shù)字圖書館書目查詢工程實踐中;文獻[2]提出的基于人工智能技術(shù)的查詢方案,通過對數(shù)據(jù)標準化處理,實現(xiàn)對數(shù)字圖書館書目的挖掘,結(jié)合人工智能技術(shù)實現(xiàn)數(shù)字圖書館書目查詢。然而,這兩種方法受到大量數(shù)字圖書館書目信息影響,導致查詢效果不佳,為此,設(shè)計了基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng)。

1 系統(tǒng)硬件結(jié)構(gòu)設(shè)計

設(shè)計的基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng),硬件結(jié)構(gòu)如圖1 所示。

圖1 系統(tǒng)硬件結(jié)構(gòu)

1.1 書目分類導航模塊

為了確保該書目分類導航模塊基本功能,用戶可以通過查詢式目錄的查詢界面選取目錄號,并按照目錄進行查詢。讀者在進入分類導航界面后,開始查詢書目,并向目錄數(shù)據(jù)庫發(fā)送查詢請求[4]。

1.2 查詢接口模塊

使用的數(shù)字圖書館數(shù)目查詢接口,如圖2 所示。

圖2 查詢接口

數(shù)字圖書館數(shù)目查詢接口具有模糊查詢功能,能夠校驗前后查詢語句一致性和完整性。通過定位檢索方式,構(gòu)建索引標識,能夠提高檢索響應(yīng)速度[5]。通常查詢接口主要有兩種,分別是人機代理接口和監(jiān)控代理接口。

1.2.1 人機代理接口

人機代理接口包括輸入接口、輸出接口和輸出處理模塊,其工作方式如下:輸入接口接收讀者的輸入信息,并對其進行檢驗,如果不滿足接收條件,則提示讀者修改輸入信息;如果滿足,則向結(jié)果處理器發(fā)送查詢詞[6-7]。結(jié)果處理器接收到查詢詞后,根據(jù)索引地址集獲取查詢詞的相關(guān)屬性信息,之后在MIS 系統(tǒng)中提取相關(guān)屬性信息,并將提取結(jié)果發(fā)送給輸出接口,輸出接口負責顯示和打印[8]。

1.2.2 監(jiān)控代理接口

監(jiān)控代理接口主要負責對查詢界面中的索引文件進行維護,該部分主要由感知器、知識庫、控制器和執(zhí)行器組成。由于人機代理接口無法更改系統(tǒng)原始索引,所以只能通過監(jiān)控索引結(jié)構(gòu)進行更改[9]。如果出現(xiàn)變化,需要在書目中及時反映出來。監(jiān)控代理工作方式如下:感應(yīng)器是感應(yīng)環(huán)境,并在第一時間作出指標[10]。在原始指標數(shù)據(jù)發(fā)生變化時,需要立即向控制器發(fā)送信號,依據(jù)控制器預先設(shè)置的關(guān)聯(lián)規(guī)則來更改原始指標數(shù)據(jù)[11]。將更改后的指標數(shù)據(jù)加入系統(tǒng),該記錄就會被傳送到該索引中。此時,系統(tǒng)會自動創(chuàng)建一個新的索引,控制器也會立刻執(zhí)行索引更新任務(wù),待控制器獲取來自感知器的全部數(shù)據(jù)后,即可完成知識庫全部索引更新任務(wù)[12]。通過監(jiān)控代理接口,能夠及時判斷索引結(jié)構(gòu),一旦發(fā)現(xiàn)結(jié)構(gòu)變化,只需更新關(guān)聯(lián)規(guī)則,不用更改代理程序,就能快速完成索引的更新,該過程靈活、簡便,方便移植。

HPV感染與肺癌預后相關(guān)性的機制暫不明確。既往研究提示,HPV陽性肺癌組織中HPV E6、E7癌蛋白的過度表達會下調(diào)p53蛋白,導致HPV陽性肺癌患者預后更好[23]。也有研究提出,HPV感染相關(guān)惡性腫瘤的主要特征為p53退化和p16上調(diào),導致野生型TP53[24]和p16[25]基因攜帶幾率增大,無病生存率提高。同時,遺傳學研究提示,相比未感染HPV的腫瘤細胞,HPV感染腫瘤細胞的染色體畸變率和染色體增倍體出現(xiàn)幾率明顯降低,對放療和化療的敏感性明顯升高,預后更好[26]。未來仍需進一步深入的基礎(chǔ)研究來闡述HPV感染與肺癌預后相關(guān)性的可能機制。

1.3 Apache服務(wù)器模塊

Apache 可以在任意一臺計算機操作系統(tǒng)上運行,其結(jié)構(gòu)如圖3 所示。

圖3 Apache服務(wù)器模塊結(jié)構(gòu)

由圖3 可知,該服務(wù)器主要用于監(jiān)視系統(tǒng)運行情況。Apache 能夠在很大程度上靈活地記錄和監(jiān)控服務(wù)器的運行狀態(tài),并且能夠滿足用戶的需要[13]。同時,它還配備了一個虛擬主機,主要功能是通過一個服務(wù)器實現(xiàn)多個主機之間的互聯(lián),為整個系統(tǒng)提供HTTP 服務(wù)[14]。Apache 模塊可以在運行時進行動態(tài)加載,從而減少了內(nèi)存負載。

2 系統(tǒng)軟件部分設(shè)計

2.1 基于關(guān)聯(lián)規(guī)則的查詢索引構(gòu)建

書目推薦算法一般都是以項集合來表達,這些項集合彼此獨立,沒有重復屬性。對于關(guān)聯(lián)規(guī)則,需要計算書目特征集的支持度,對于項集D的支持度,其計算公式為:

式中,Q表示全部數(shù)據(jù)集。如果項集D是一種頻繁項集,那么該項集支持度大于等于頻繁項集中的任意最小頻繁項集。集合間的個性化規(guī)則必須符合以下條件:各項集合是有效的,且各項集合之間的個性化應(yīng)具有某種普遍性[15]。以此為依據(jù),構(gòu)建的基于關(guān)聯(lián)規(guī)則的查詢索引模型,如圖4 所示。

圖4 基于關(guān)聯(lián)規(guī)則的查詢索引模型

由圖4 可知,在確定特征采集結(jié)果和關(guān)鍵詞后,在字段上建立索引,由此完成索引的構(gòu)建。在查詢系統(tǒng)中,構(gòu)建查詢索引模型詳細步驟如下:首先,讀者提出查詢需求的條件,然后,系統(tǒng)按照查詢需求來檢索與查詢相關(guān)的文件,同時系統(tǒng)根據(jù)查詢條件與書目數(shù)據(jù)之間的關(guān)聯(lián)性按照相似度大小依次排序,最后,將排序后的結(jié)果反饋給讀者[16]。

2.2 數(shù)字圖書館書目查詢步驟設(shè)計

根據(jù)構(gòu)建的查詢索引模型搜索頻繁項集,待搜索完成后會產(chǎn)生強大的關(guān)聯(lián)規(guī)則。在該規(guī)則中,設(shè)1為非空子集,0 為空子集,如果項集合的每一個頻繁項集為1,說明該項集為非空子集,可以將此集合作為書目查詢集合,反之,則不能。

針對數(shù)字圖書館查詢書目存在特征集合xm,對這些特征進行矢量化處理,得到的特征均與書目單詞相呼應(yīng)。

設(shè)需要查詢的書目庫為W,可表示為:

式中,gn表示第n個書目;N表示書目總量。在需要查詢的書目庫中,將全部特征映射成一組節(jié)點數(shù)據(jù),使其成為一條量化路徑。

在該條量化路徑上,使用一種能控制字段存儲的估計參數(shù),可表示為:

式中,l(μ)表示估計參數(shù)相對于特征集合xm的似然函數(shù)。通過對似然函數(shù)進行數(shù)據(jù)轉(zhuǎn)化處理,能夠得到書目查詢模型,如下所示:

式中,Uμ表示數(shù)字圖書館書目全部查詢結(jié)果。該公式計算結(jié)果越高,書目查詢結(jié)果就越精準,由此完成數(shù)字圖書館書目查詢。

3 系統(tǒng)測試

3.1 數(shù)據(jù)源選取

系統(tǒng)測試選取的圖書館歷史記錄數(shù)據(jù)作為圖書館查詢系統(tǒng)的研究對象,登錄某校圖書館自動化管理系統(tǒng)模塊,統(tǒng)計2018 年1 月—2022 年1 月的讀者查詢歷史記錄。

3.2 系統(tǒng)生成的關(guān)聯(lián)規(guī)則

從基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng)生成的頻繁數(shù)據(jù)庫中產(chǎn)生具有強關(guān)聯(lián)的規(guī)則,如果這些規(guī)則的支持度和置信度大于設(shè)定的閾值0.4 和0.7,則說明該系統(tǒng)查詢結(jié)構(gòu)與讀者查詢結(jié)果關(guān)聯(lián)性較大。

使用該平臺生成的15 條歷史記錄關(guān)聯(lián)規(guī)則,如表1 所示。

表1 生成的關(guān)聯(lián)規(guī)則

由表1 可知,讀者在查詢圖書時表現(xiàn)出較強的個性化,因此,系統(tǒng)生成的關(guān)聯(lián)規(guī)則支持度和置信度較高。根據(jù)系統(tǒng)測試結(jié)果可以看出,《鄧小平思想概論》、《思想道德修養(yǎng)教程》、《現(xiàn)代國家的政策過程》關(guān)聯(lián)規(guī)則較高,說明被查詢的次數(shù)也較多。

3.3 測試結(jié)果與分析

為了進一步驗證基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng)設(shè)計合理性,需將其與基于Solr 的標準查詢技術(shù)、基于人工智能技術(shù)的查詢方案的查詢結(jié)果進行對比分析。以查全率和查準率為指標,三種方法的查詢效果對比結(jié)果如圖5 所示。

圖5 三種方法查詢效果對比分析

由圖5 可知,A、B、C 三個點分別代表《鄧小平思想概論》、《思想道德修養(yǎng)教程》、《現(xiàn)代國家的政策過程》書目,這三個點也為三種方法的平衡點,曲線A 完全包住曲線B,曲線B 完全包住曲線C,其中A 點為查詢效果最佳點,C 點查詢效果最差點。通過對比結(jié)果可知,使用基于Solr 的標準查詢技術(shù),C點查全率和查準率均為40%,A 點查全率和查準率均為67%;使用基于人工智能技術(shù)的查詢方案,C 點查全率和查準率均為49%,A 點查全率和查準率均為68%;使用基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng),C 點查全率和查準率均為60%,A 點查全率和查準率均為78%。

通過上述分析結(jié)果可知,使用基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng)查全率和查準率均最高,說明使用該系統(tǒng)具有高效查詢效率。

4 結(jié)束語

文中設(shè)計了基于關(guān)聯(lián)規(guī)則的數(shù)字圖書館書目查詢系統(tǒng),對查詢數(shù)據(jù)進行了關(guān)聯(lián)分析,確定圖書館書目之間存在的關(guān)聯(lián)信息,并形成了強大的關(guān)聯(lián)規(guī)則,為讀者提供了一種主動的、個性化的查詢服務(wù),通過對查詢方式分析向讀者提供有關(guān)書籍的建議。

目前,數(shù)據(jù)查詢技術(shù)在圖書館的應(yīng)用尚處于起步階段,對個性化查詢服務(wù)的發(fā)展起到積極的推動作用。針對關(guān)聯(lián)規(guī)則數(shù)字圖書館書目查詢問題,提出了如下期望:下一步需要設(shè)置一個頻率門限,來決定頻繁書目集合,從而迅速找到讀者所關(guān)心的書目。

猜你喜歡
查全率查準率書目
推薦書目《初春之城》
都市人(2022年3期)2022-04-27 00:44:57
海量圖書館檔案信息的快速檢索方法
基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)信息過濾系統(tǒng)設(shè)計
基于詞嵌入語義的精準檢索式構(gòu)建方法
大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
基于深度特征分析的雙線性圖像相似度匹配算法
中文分詞技術(shù)對中文搜索引擎的查準率及查全率的影響
本刊郵購書目
基于Web的概念屬性抽取的研究
《全國新書目》2009年1月薦書榜
全國新書目(2009年1期)2009-04-13 06:58:24
肥乡县| 牡丹江市| 常宁市| 石家庄市| 芜湖市| 晋中市| 南郑县| 通许县| 德江县| 潞城市| 阿鲁科尔沁旗| 晋中市| 灌南县| 陆河县| 随州市| 彭州市| 中江县| 水富县| 金川县| 江川县| 鱼台县| 霍邱县| 临西县| 鄂州市| 大名县| 监利县| 太谷县| 郯城县| 宁夏| 图木舒克市| 东乌珠穆沁旗| 景谷| 苍山县| 澄江县| 邯郸市| 额尔古纳市| 昌邑市| 汉寿县| 安陆市| 泗洪县| 闵行区|