国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計特征分析系統(tǒng)設(shè)計與應(yīng)用

2022-04-29 00:44:03魏立杰劉蔭明孫江文楊久強林年添
社會科學(xué)進(jìn)展 2022年6期
關(guān)鍵詞:特征分析聚類分析系統(tǒng)設(shè)計

魏立杰 劉蔭明 孫江文 楊久強 林年添

摘 要|透過分類文獻(xiàn)下載量的大小及分布特征,可以了解讀者的閱讀行為及其與學(xué)科發(fā)展的關(guān)聯(lián)性。本文根據(jù)分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計特點,有針對性地設(shè)計及研

發(fā)數(shù)據(jù)統(tǒng)計特征分析系統(tǒng),并將其應(yīng)用于實際案例分析中。應(yīng)用結(jié)果表明,多樣性的分析方法提高了分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計分析的可靠性,有助于更好更全面地了解讀者閱讀規(guī)律和下載特點,為數(shù)字圖書館或資料庫建設(shè),為優(yōu)化學(xué)科及學(xué)科的有效發(fā)展,提供科學(xué)量化管理依據(jù)[1]。

關(guān)鍵詞|分類文獻(xiàn)下載量;系統(tǒng)設(shè)計;下載量熱力值;聚類分析;特征分析

Copyright ? 2022 by author (s) and SciScan Publishing Limited

This article is licensed under a Creative Commons Attribution-NonCommercial

International License. https://creativecommons.org/licenses/by-nc/4.0/

信息技術(shù)的不斷發(fā)展進(jìn)一步改變了大學(xué)圖書館用戶服務(wù)和尋求信息的行為, 即從實體的資源分享拓展到了虛擬數(shù)字資源分享。顯然,互聯(lián)網(wǎng)的發(fā)展使圖書呈現(xiàn)的形式發(fā)生了重大變化,尤其是數(shù)字化圖書的出現(xiàn)改變了人們的閱讀行為[2]。

了解線上分類文獻(xiàn)(數(shù)字圖書或文章等)下載量的大小及分布特征,有助于了 解數(shù)字化圖書或分類文獻(xiàn)的利用情況,基于此,分析讀者的閱讀傾向以評估學(xué) 科布局和發(fā)展的有效性。通過對圖書館數(shù)字化圖書或分類文獻(xiàn)的下載情況進(jìn)行 統(tǒng)計分析,對促進(jìn)圖書館數(shù)字圖書或資料庫建設(shè),對優(yōu)化學(xué)科及學(xué)科的有效發(fā)展, 提升讀者服務(wù)工作水平起到參考借鑒作用[1]。

1 系統(tǒng)方案設(shè)計思路

該系統(tǒng)設(shè)計的核心思想是,基于分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計特點,進(jìn)行有針對性的設(shè)計及研發(fā),且能在目前主流的操作系統(tǒng)(如在 Windows 系統(tǒng))中便捷安裝運行,并能直接利用目前主流文檔管理系統(tǒng)(如 OFFICE 操作系統(tǒng)中的 EXCEL 表格)的數(shù)據(jù)進(jìn)行統(tǒng)計特征分析。系統(tǒng)或軟件的功能不僅能靜態(tài)分析分類文獻(xiàn)下載量數(shù)據(jù)分布特征,還能動態(tài)分析分類文獻(xiàn)下載量變化趨勢,具有一定的預(yù)測功能。通過該系統(tǒng)的應(yīng)用,了解數(shù)字化圖書或分類文獻(xiàn)的利用情況及分類文獻(xiàn)學(xué)科的被關(guān)注程度。據(jù)此,通過讀者的閱讀傾向分析評估學(xué)科布局和發(fā)展的有效性。

基于上述設(shè)計總體思路,我們進(jìn)行了系統(tǒng)軟件的研發(fā)。該項研發(fā)是在Windows 系統(tǒng)下的 Matlab 平臺上開展的,該軟件可在 Windows 系統(tǒng)下運行,運行時所需內(nèi)存較小,可以在現(xiàn)存的幾乎所有的計算機平臺運行。

2 系統(tǒng)基本架構(gòu)及模塊功能

系統(tǒng)主要由“學(xué)科年度下載量靜態(tài)分析模塊(含‘學(xué)科年度下載量與‘重點年年度下載量)”“學(xué)科下載量動態(tài)分析趨勢模塊”“下載量熱力值”及“下載量譜系分析模塊(聚類分析)”五部分組成,具體如圖1 ?所示。本文案例以某大學(xué)(SKD)圖書館中國知網(wǎng)期刊全文庫的文獻(xiàn)下載量為數(shù)據(jù)基礎(chǔ)。其中,大類學(xué)科 10 種,小類學(xué)科 168 種,大類學(xué)科分別為:A 為基礎(chǔ)科學(xué)、B 工程科技

Ⅰ輯、C 工程科技Ⅱ輯、D 農(nóng)業(yè)科技、E 醫(yī)藥衛(wèi)生科技、F 哲學(xué)與人文科學(xué)、G 社會科學(xué)Ⅰ輯、H 社會科學(xué)Ⅱ輯、I 信息科技、J 經(jīng)濟與管理科學(xué)[3]。

學(xué)科年度下載量靜態(tài)分析模塊

在軟件主界面,如圖1 所示,單擊“學(xué)科年度下載量”,在下拉菜單中, 選擇年份(本案例加載了 2011—2021 年不同分類文獻(xiàn)的下載量,該模塊可以根

據(jù)需要,隨時加載新增年份或更早期年份的下載量),如 2016 年,軟件會自動繪制出該年度不同分類文獻(xiàn)的下載量分布圖。也可以選擇多個年份,并疊加顯示, 如圖2 所示為2011 年、2015 年、2019 年、2021 年不同分類文獻(xiàn)的下載量統(tǒng)計圖像。在此過程中,可以根據(jù)實際需要,重點顯示某些學(xué)科的索引號,如在本案例中, 共顯示了 42 個小類學(xué)科的文獻(xiàn)索引號,可以看到,B021 學(xué)科的下載量要明顯高于其他學(xué)科的下載量。在實際操作過程中,可以根據(jù)需求,調(diào)整顯示的文獻(xiàn)索 引號,以達(dá)到進(jìn)行不同或相近學(xué)科之間分析比較的目的。此外,還可以通過調(diào) 整下載量的取值范圍,以顯示文獻(xiàn)下載量在某一借閱量范圍之間的學(xué)科,便于 進(jìn)行學(xué)科下載量的統(tǒng)計分析。

學(xué)科下載量動態(tài)分析趨勢模塊

單擊如圖1 所示的“重點學(xué)科下載量”模塊,選擇不同學(xué)科,并疊加顯示。如圖3 所示為 A011、B021、C038、I138、I140、J152 學(xué)科 2011—2021 年度下載量變化趨勢圖。依此,不僅可直觀觀察到某學(xué)科的下載量的變化趨勢, 還可以同時觀察不同學(xué)科下載量的變化趨勢對比情況??梢钥吹?,在此過程中,B021、C038、I138、I140、J152 五類學(xué)科的變化趨勢中有交叉現(xiàn)象,從圖中可以看到大體的趨勢分布。如果想得到更為精細(xì)的分析數(shù)據(jù)(如在 2012 年時C038、I138、I140 三類學(xué)科的下載量是否一致)比較困難,此時,可以通過調(diào)整下載量范圍的大小進(jìn)行局部放大,即通過縮小下載量的范圍,突出不同學(xué)科下載量的差異,從而達(dá)到數(shù)據(jù)精細(xì)分析的目的。

下載量熱力值圖

“下載量熱力值圖”或稱為“下載量變化趨勢圖”,用于展示多學(xué)科分類文獻(xiàn)的年度下載量變化態(tài)勢??梢允撬袑W(xué)科(如圖3 所示),也可以是部分學(xué)科(如相鄰學(xué)科)。在此過程中,可以通過調(diào)整圖書類別,以對不同學(xué)科下載量數(shù)據(jù)進(jìn)行分析。如圖4 中間區(qū)域?qū)W科相較于上下區(qū)域?qū)W科的熱力值(即變化趨勢)不明顯,

可以通過對圖書類別進(jìn)行調(diào)整,僅對上下區(qū)域?qū)W科的熱力值進(jìn)行比較,以獲得近些年下載量有明顯增加的學(xué)科數(shù)據(jù)特征。此外,還可以通過調(diào)整熱力圖的取值范圍, 以獲得下載量大于(或小于)某一值的學(xué)科,便于對數(shù)據(jù)進(jìn)一步分析。

下載量譜系分析模塊

下載量譜系分析是通過聚類分析實現(xiàn)的。聚類分析是一種探索性分析方法,與判別分析不同,聚類分析事先并不知道分類的標(biāo)準(zhǔn),甚至不知道應(yīng)該分成幾類,而

是根據(jù)樣本數(shù)據(jù)的特征自動進(jìn)行分類。作為一種無監(jiān)督學(xué)習(xí)方法,聚類分析被廣泛地應(yīng)用于數(shù)據(jù)的統(tǒng)計和分析。本系統(tǒng)采用系統(tǒng)聚類方法進(jìn)行數(shù)據(jù)的分析。步驟如下:

(1) 首先,輸入圖書的類別(本案例為圖書大類),共 10 種。因此,在聚類分析開始時,每類圖書自己劃分為一類,共劃分為十類,即每種圖書和其類別是一一對應(yīng),從而將所有的研究數(shù)據(jù)進(jìn)行劃分成相應(yīng)類別。

(2) 利用幾何數(shù)學(xué)方法計算任意兩類之間的相似性(距離),以距離最近為準(zhǔn)則,將最接近的兩類重新歸為一類。

(3)重復(fù)上述步驟(2)的過程,直至分類完成,獲得最終的分類結(jié)果。利用此原理,點擊圖1 中“聚類分析”模塊獲得如圖5 所示的聚類樹形圖

(下載量譜系圖),其所展示的為 10 大類不同學(xué)科總下載量聚類分析系譜圖。用于分析各大類學(xué)科總下載量的相關(guān)度。可以看到,在該圖中,系統(tǒng)聚類分析自動對所有學(xué)科之間的關(guān)系進(jìn)行調(diào)整,將數(shù)據(jù)特征相近的學(xué)科歸位一類。并且, 根據(jù)需求可以將學(xué)科分為不同的大類,如分為兩類時,將 6、8、7、4、5、1、9 分為一類;2、10、3 分為一類。此外,不僅可以對大類學(xué)科進(jìn)行聚類分析,也可以對小類學(xué)科進(jìn)行分析,此時,僅需將大類學(xué)科數(shù)據(jù)替換為小類學(xué)科數(shù)據(jù), 無須進(jìn)行其他修改,即可進(jìn)行聚類分析過程。相較于監(jiān)督學(xué)習(xí)算法來說,當(dāng)修改為小類學(xué)科數(shù)據(jù)時,無須進(jìn)行參數(shù)調(diào)整、模型訓(xùn)練等操作,因此聚類系數(shù)分析方法操作簡單,是一種高效、快捷的數(shù)據(jù)分析方法。

3 系統(tǒng)綜合應(yīng)用評價

本部分將“系統(tǒng)基本架構(gòu)及模塊功能”應(yīng)用于實際案例,從“分類文獻(xiàn)下 載量分布特征分析”及“讀者閱讀習(xí)慣與學(xué)科發(fā)展態(tài)勢分析”兩個方面進(jìn)行討論, 以評估所設(shè)計系統(tǒng)的有效性。

分類文獻(xiàn)下載量分布特征分析

從圖2 和圖4 不難看出,本案例中(2011—2021 年)下載量最大和較大的區(qū)域主要在前區(qū)和后區(qū),前者主要是 A、B、C 三個區(qū),分別對應(yīng)的是基礎(chǔ)科學(xué)和工程科技(Ⅰ、Ⅱ),后者主要對應(yīng)的是 I 與J 兩個區(qū),分別對應(yīng)信息科技及經(jīng)濟與管理科學(xué)。在前區(qū)中尤以 B 區(qū)中的礦業(yè)工程、C 區(qū)中的建筑及 A 區(qū)中的地質(zhì)學(xué)最為顯著。在后區(qū)中主要以I 區(qū)中的計算機、自動化及J 區(qū)中企業(yè)經(jīng)濟為突出。如圖5 所示, 下載量譜系圖也有良好的對應(yīng)關(guān)系。譜系圖中的 2(B 區(qū)工程科技Ⅰ)、10(I 區(qū)計算機、自動化)與 3(C 區(qū)工程科技(Ⅱ)),作為一類區(qū),也是下載量主要貢獻(xiàn)區(qū)。

讀者閱讀習(xí)慣與學(xué)科發(fā)展態(tài)勢分析

圖 2、圖4 及圖5 展示了分類文獻(xiàn)下載量的基本分布特征。那么他們之間的變化趨勢如何?圖3 是對如上所分析中下載量最大與較大區(qū)的一定年段內(nèi)的變化趨勢的對比。下載量最大的 B 區(qū)中的礦業(yè)工程呈現(xiàn)出下載量逐年增加到 2015 年出現(xiàn)拐點,2017 年后上升,到 2019 年又出現(xiàn)下降的拐點,A 區(qū)中的地質(zhì)學(xué)的拐點出現(xiàn)在 2016 年,而 C 區(qū)中的建筑出現(xiàn)下降拐點是在 2018 年。J 區(qū)中企業(yè)經(jīng)濟的拐點出現(xiàn)在 2019 年,而 I 區(qū)中的計算機與自動化一路呈上升趨勢。反映了不同學(xué)科不同時期其熱度存在此起彼伏的現(xiàn)象。

學(xué)科發(fā)展綜合分析

通過此系統(tǒng)對近十年分類文獻(xiàn)下載量數(shù)據(jù)特征進(jìn)行統(tǒng)計和分析,可以發(fā)現(xiàn)不同學(xué)科近些年的發(fā)展規(guī)律和特點,以及讀者們的閱讀傾向,從而有針對性地采取有效措施,提高文獻(xiàn)的利用率,并合理地調(diào)整策略以更好地滿足讀者的閱讀和科研需求。

該系統(tǒng)通過不同的技術(shù)方法較好地反映了一定時間范圍內(nèi)不同分析文獻(xiàn)下載量的數(shù)據(jù)特征,通過不同文獻(xiàn)下載量變化趨勢,可以反映讀者的閱讀需求。在對實際數(shù)據(jù)進(jìn)行分析時,可以以該系統(tǒng)為基礎(chǔ),通過對不同文獻(xiàn)的下載量統(tǒng)計常態(tài)化,不斷改進(jìn)數(shù)據(jù)分析的技術(shù)方法,實時更新數(shù)據(jù)信息。通過對各種指標(biāo)進(jìn)行分析研究,以便準(zhǔn)確把握不同學(xué)科最新的下載量趨勢,獲得讀者的閱讀傾向。針對各種數(shù)據(jù)變化特點,靈活地調(diào)整數(shù)據(jù)庫的采購策略[4]。此外,不僅要考慮讀者的閱讀習(xí)慣,還應(yīng)不斷關(guān)注學(xué)校的學(xué)科建設(shè)情況和科研發(fā)展動向, 及時提供相應(yīng)的文獻(xiàn)資源,保障學(xué)科建設(shè)和科研發(fā)展的順利進(jìn)行。為更好地滿足教學(xué)科研的實際需求,圖書及數(shù)據(jù)庫的訂購也可采取薦購的做法[5],針對一些小類學(xué)科,對于多于這些針對性較強的學(xué)科文獻(xiàn),可將書目信息提供給相關(guān)專業(yè)的研究人員和讀者,由其選擇推薦購買的書目。

4 結(jié)語

根據(jù)分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計特點,所設(shè)計及研發(fā)的目的性明確、專業(yè)性更強的分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計特征分析系統(tǒng),其所具有的定量化與多樣性分析作用提高了分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計分析的科學(xué)性。通過對圖書館數(shù)字化圖書或分類文獻(xiàn)的下載情況進(jìn)行統(tǒng)計分析,能更好地了解讀者閱讀規(guī)律和下載特點,對促進(jìn)數(shù)字圖書館或資料庫建設(shè),對優(yōu)化學(xué)科及學(xué)科的有效發(fā)展,提供了科學(xué)量化管理依據(jù),為充分發(fā)揮圖書館的教育職能作用提供借鑒[1]。

參考文獻(xiàn)

[1]任麗麗.館藏圖書借閱量統(tǒng)計分析:以浙江警察學(xué)院圖書館為例[J]. 電子世界,2013(4):84-85.

[2]魏立杰,林年添,丁仁偉,等.讀者線下閱讀行為變遷對大學(xué)隱性教育教學(xué)的啟示[J].科技視界,2021(5):90-91.

[3]楊曉萍.2012中文專業(yè)數(shù)據(jù)庫檢索:中國知網(wǎng)期刊全文[EB/OL].

[2022-11-20].中國知網(wǎng)ppt課件,http://www.doc88.com/p%2D23 44903511470.html.

[4]周珊.高校圖書館電子圖書使用評價與分析:以海南大學(xué)圖書館為例

[J].圖書情報導(dǎo)刊,2016,1(10):57-61,77.

[5]王榮宗,鐘克理,隋晶晶,等.大學(xué)生圖書借閱檔案數(shù)據(jù)分析:以中國石油大學(xué)(華東)為例[J].江蘇科技信息,2022,39(8):7-9.

Design and Application of Statistical Characteristic Analysis System for Downloads of Classified Literature

Wei Lijie1 Liu Yinming1 Sun Jiangwen1 Yang Jiuqiang2 Lin Niantian2

1. Shandong University of science and Technology Library, Qingdao;

2. College of Earth Science and Engineering, Shandong University of Science and Technology, Qingdao

Abstract: Through the size and distribution characteristics of the downloads of classified literature, we can understand the readers reading behavior and its relevance to the development of the discipline. In this paper, according to the statistical characteristics of the downloaded data of classified literature, we designed and developed a data statistical characteristics analysis system, and applied it to the actual case analysis. The application results show that the diversity analysis method improves the reliability of the statistical analysis of the download data of classified literature, helps to better and more comprehensively understand the readers reading rules and download characteristics, provides scientific quantitative management basis for the construction of digital libraries or databases, and optimizes the effective development of disciplines and disciplines.

Key words: Downloads of classified literature; System design; Downloads heating value; Cluster analysis; Characteristics analysis

基金項目: 山東省軟科學(xué)項目“高校國家知識產(chǎn)權(quán)信息服務(wù)中心建設(shè)路徑與發(fā)展策略研究

(2021RKY04065)”;山東省本科教學(xué)改革研究項目“新工科背景下行業(yè)高校地質(zhì)類傳統(tǒng)專業(yè)的升級改造與創(chuàng)新人才培養(yǎng)模式(M2020257)”;山東科技大學(xué)課程思政培育項目“地震勘探原理(KCSZ201904)”。

通訊作者:林年添,博士,山東科技大學(xué)地球科學(xué)與工程學(xué)院教授,研究方向:專業(yè)課教學(xué)理論及應(yīng)用研究, E-mail:377237866@qq.com。

文章引用:魏立杰,劉蔭明,孫江文,等.分類文獻(xiàn)下載量數(shù)據(jù)統(tǒng)計特征分析系統(tǒng)設(shè)計與應(yīng)用[J].社會科學(xué) 進(jìn)展,2022,4(6):467-475.

https://doi.org/10.35534/pss.0406041

猜你喜歡
特征分析聚類分析系統(tǒng)設(shè)計
2012 年南海夏季風(fēng)特征分析
農(nóng)村居民家庭人均生活消費支出分析
一種基于SATA硬盤陣列的數(shù)據(jù)存儲與控制系統(tǒng)設(shè)計研究
工業(yè)熱電偶計量檢定系統(tǒng)設(shè)計
基于物聯(lián)網(wǎng)的煤礦智能倉儲與物流運輸管理系統(tǒng)設(shè)計與應(yīng)用
目標(biāo)特性測量雷達(dá)平臺建設(shè)構(gòu)想
科技視界(2016年22期)2016-10-18 14:34:34
基于省會城市經(jīng)濟發(fā)展程度的實證分析
中國市場(2016年33期)2016-10-18 12:16:58
基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
科技視界(2016年20期)2016-09-29 12:32:48
“縣級供電企業(yè)生產(chǎn)經(jīng)營統(tǒng)計一套”表輔助決策模式研究
基于PowerPC的脈內(nèi)特征分析算法的工程實現(xiàn)
灵璧县| 沂南县| 苍溪县| 故城县| 巴中市| 措勤县| 彭州市| 丰台区| 淮滨县| 威信县| 滦南县| 沁水县| 宁武县| 丰台区| 互助| 怀仁县| 喀喇沁旗| 合山市| 都江堰市| 甘德县| 图木舒克市| 道真| 浪卡子县| 金堂县| 巴彦淖尔市| 鹿泉市| 卢氏县| 汽车| 宜章县| 定日县| 高清| 南陵县| 嵩明县| 安阳县| 治多县| 河北区| 安吉县| 鄂托克旗| 双江| 内黄县| 泊头市|