国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺談數字人文下的信息檢索與可視化研究

2022-10-22 00:54翟婧
公關世界 2022年15期
關鍵詞:檢索可視化數據庫

文/翟婧

(山東政法學院圖書館 山東 濟南 250014)

一、 引言

隨著全球通信技術、互聯網技術、人工智能等大數據技術的快速發(fā)展,大眾越來越偏向使用網絡作為獲取信息的渠道和喜歡把網絡當成學習和交流的工具,移動智能閱讀設備性能不斷地提升,推進智能化、移動化和服務化的社會建設也越來越深入,數字智能化也成為當今社會人類生活中不可少的環(huán)節(jié)。當計算機技術啟蒙時,科學研究人員就在不斷地創(chuàng)新,嘗試著將計算機技術應用到數字人文領域中。中國引進數字人文技術已彈指10年有余。國際上數字人文的發(fā)展已經有很豐富的成果,數字人文項目建設的蓬勃發(fā)展直接推動了中國數字人文發(fā)展步伐,但數字人文不是一個新的領域,隨著計算機軟件技術的不斷更新發(fā)展,現如今研究數字人文領域已變得十分廣泛。

數字人文的概念具有包容性與演進性的基本特點,有時也被稱為人文計算。數字人文是數字技術與人文科學張力性的結合,它是針對計算與人文科學之間的交叉領域進行學習、研究、發(fā)明以及創(chuàng)新的一門學科,但它又是一門交叉學科,它的研究涉及到對互聯網信息的研究、分析、識別等綜合技術,它致力于如何利用媒體來影響人文科學。

從大學圖書館事業(yè)發(fā)展的角度談個性化服務,就是以讀者為中心,在研究讀者的興趣愛好、專業(yè)和習慣的基礎下,根據讀者的個性化需要,向讀者推薦基于其需求和愛好的個性化圖書,來滿足讀者需求而開展的信息服務。個性化服務模式打破了傳統(tǒng)的被動式服務模式,主動開展以滿足讀者個性化需求為目的的全方位服務。對那種渴望精準定位、針對所學專業(yè)性強和根據自己具體所研究課題和研究方向成果需求需要的個性化師生而言,大學圖書館就要充分利用數字人文平臺的個性化資源,來開展主動性定位的個性化服務,滿足讀者數字人文需求下的全方位服務。

二、刊物數字信息檢索功能的發(fā)展給讀者帶來的便利

數字信息檢索廣義上講是指用數字技術,將各類信息按一定的方式進行采集、加工處理存儲起來,并根據信息用戶的需要找出有關的信息過程的一種新型模式。這種新型模式被各行各業(yè)看作是一種即將發(fā)出變革的新力量,包括高校圖書館在內,都希望通過大數據的共享、跨界、快捷、開發(fā)等資源來創(chuàng)造更多的價值。在這樣的背景驅動下,高校圖書館有必要結合自身的發(fā)展需要,在數字資源權益的領域下積極開展深入的研究和實踐探索。

1.書目信息檢索的延伸

書目信息的檢索是根據讀者的需求借用網絡數字資源和專業(yè)的技術手段,對有序化的圖書信息集合起來進行查詢,來獲取符合和滿足讀者檢索要求的信息資料。

在搜索框中輸入書名、作者或者關聯詞,即可獲取該書目相關館藏的點擊條,點開點擊條就可以一目了然地查看該書目館藏的信息,通常包括書目的書名、責任者、出版信息、價格、該書目在哪個書庫收藏、是否在館、該書目的預約等借閱本書目的流通情況。例如米哈伊爾·肖洛霍夫編著的《靜靜的頓河》這本書目信息,當從搜索框中搜索后,此書目會顯示在中文文學書庫以字母I開頭編輯入庫的藏本和外文語言書庫以H字母開頭編輯的藏本,如果讀者想看原版的來提升自身的學習就點擊外文語言書庫。如果流通點擊條中顯示為“在架”說明該書目在圖書館可以借出。

登錄學校圖書館的網站,進入圖書館界面跳轉頁面,就會彈跳出電子資源、服務指南、本館要覽、分類查找等點擊欄。然后點擊分類查找欄中的館藏文獻檢索,在文獻檢索框中輸入書目的書名或者作者就會呈現出讀者所要查找的圖書信息了。電子資源分為中文數據庫、外文數據庫、電子期刊數據庫、電子圖書、學科電子導航等條目。隨便點擊任何的電子資源,就會彈跳出圖書館免費下載或者館內購買來的電子文獻,提供給各個學科領域有需求的師生訪問閱讀。如讀者需求中文方面的資料,就可以直接點擊中文數據庫網站的鏈接。例如檢索《圖書情報工作》這本期刊中文雜志,從搜索框中輸入《圖書情報工作》雜志名,網頁就會彈跳出該雜志的文獻資料,讀者就可以選擇性的免費閱讀或者下載自己有需求的部分了。但這種方法搜索也有利弊,好處是可以搜尋到很多的文獻資料,而且信息還比較全面,弊端就是需要讀者從大量的文獻資料中整理尋找自己需要的資料。

高級檢索一般被應用在一些數據庫中作為信息檢索入口的三種檢索途徑之一,高級檢索功能包括字段檢索、布爾邏輯檢索等,利用這些檢索功能搜索引擎可以獲取某Web站點被連接的次數,比較各站點的聲望高低等。同時高級檢索也可以方便讀者精準地查找數據資料。

進入高級檢索界面里,主要由檢索欄和歷史記錄兩部分組成。檢索欄是有上下兩個檢索框組成,上方檢索框可以輸入書名、作者等關鍵詞,可以直接跳轉到具體檢索到的文獻頁面。而下面的檢索框則是可以查看具體的檢索方式。高級搜索檢索欄中有很多類別,其中比較常用的有作者檢索、雜志檢索、日期檢索、標題檢索和摘要檢索等。

高級搜索第二個部分是歷史檢索。在高級檢索中,除了可以自定義檢索文獻還可以檢索歷史記錄。在檢索歷史記錄中可以看到每一個自定義檢索的檢索方式以及有多少個相關聯的文獻資料。自定義檢索的結果,PubMed都會為檢索的歷史記錄進行編號,這樣方便讀者查找。除了使用編號進行檢索之外,歷史檢索還有一個Actions的功能。Action又包括三個選項:刪除檢索記錄、添加到檢索欄、以及創(chuàng)建提醒。每一次讀者使用高級搜索之后都會留下閱覽記錄,而歷史記錄只顯示具體的檢索結果,不會把文獻內容返回。但歷史檢索完整記錄了本次以來所有檢索式的具體內容及命令中的結果。包括檢索式序號、檢索式、檢索結果以及檢索的時間。運用歷史檢索的好處可以幫助讀者分步檢索,且可以方便讀者調整、修正檢索的策略。

三、數字可視化存儲功能的工作發(fā)展

在線詞典、在線翻譯、文本標記、語料庫等工具都是數字人文中常用的熱門工具。數字可視化是通過多媒體、三維、傳感、智能交換、實時跟蹤等多種方法,將虛擬的信息與真實的現實和歷史相結合起來疊加、融為一體的技術。

數字可視化與信息圖形、信息可視化、科學可視化、以及統(tǒng)計圖形密切相關。數字可視化主要是利用數據分析和開發(fā)工具等手段將大型、比較集中的數據借助圖形圖像形式去處理其中未知的信息的過程,并能清晰有效地傳達和讀者網絡信息溝通的能力。大數據時代數字人文的數據價值亟需被挖掘利用起來助力時代的發(fā)展,有了可視化數字人文真正地提高了運維工作的效率,把復雜的工作簡單化,很好地改進了重復性和繁重的定位工作問題。

圖書館數字可視化的開發(fā)人員多是通過讀者大數據的靜態(tài)信息和動態(tài)信息的電子資源對讀者進行分析研究的。如讀者的動態(tài)信息有:讀者的借閱數據、借閱刊物的類型、借閱的時間、和讀者訪問電子資源的活躍時間段等讀者操作電子信息留下痕跡的動態(tài)信息;讀者的靜態(tài)信息:如師生們的校園一卡通、身份證、所在年級和專業(yè)學科等比較固定的基本信息和讀者本身外露出來的本質信息。開發(fā)研究人員通過大數據靜態(tài)信息和動態(tài)信息對讀者個人進行深入挖掘分析就能精準地了解讀者的需求。

例如數字信息顯示某位讀者經常在下午的時間段瀏覽教育方面的資料,從靜態(tài)的信息反饋是一名三十歲左右的女讀者,那從動態(tài)信息就會反饋出這位女士有可能是一位寶媽,在從她瀏覽的痕跡中判斷出她有個七八歲的孩子,從她看教育書的類型,數字信息還可以分析出她的寶寶是女孩,那么在她下次再來閱覽時,電子信息直接就會給這位讀者跳躍出兒童讀物中女孩子喜歡的書如《白雪公主》等信息。還有《兒童營養(yǎng)膳食》等寶媽喜愛的刊物。先進的數字人文就是采集讀者檢索、瀏覽等使用電子數據留下的痕跡,根據讀者的興趣點將不同的內容推送給相應的個性化的用戶。

四、數字可視化存在的不足及改進的策略

1.多元數據庫信息融合的困難與研究熱點

目前國內外數字可視化的大數據發(fā)展,還停留在獨立的電子數據庫的數字信息分析研究階段,還不能將多個電子數據庫信息融合起來統(tǒng)一建數據庫。在數字可視化檢索領域中,用戶查找數據都是一對一的互訪,并且還要從多個檢索數據中進行局部的數據分析,保證全部檢索結果的準確性。對不同數據進行合并的同時,還要滿足合并后的結果的精準性,對科研工作者來說是一項艱難的任務。隨著大數據信息技術的發(fā)展,各行各業(yè)的多渠道獲取的信息將會融合成一個庫集(如:交通管制、軍事領域、病例診斷等)將成為可能。將多個單獨的數據庫的信息合并起來組成海量的多元數據庫彌補了人類認知的局限性,將平臺原有的數字資源進行重組后,能使新的數據進行文本分析,為用戶進行個性化服務,更加先進快捷,推動國內科研人員研究多元數據庫的數字可視化的技術,將成為一個研究熱點。

2.數字可視化的安全性難以保證及改進策略

在大數據時代背景下,2018年5月25日,歐盟開始實施《通用數據保護條例》,各國也紛紛加強對數據信息、個人隱私等重要的信息加以保護。數字可視化具有明確的開放性和流動性,因此圖書館在利用數字可視化對讀者的隱私和作者的信息安全也存在不可忽視的隱患。大規(guī)模的數據信息難免會存在風險,會侵犯到個人的隱私導致糾紛。如大數據對圖書館知識產權風險研究中的專利權、著作權、商業(yè)秘密三種類型的知識產權作為科學數據保護的權利。針對上述的信息風險問題就需要圖書館的數據網絡研究人員建立數據安全保護機制,對存在的問題進行系統(tǒng)化、規(guī)范化,積極探討、落實有效的保護辦法和研究創(chuàng)新的科學技術,根據相應的法律明文規(guī)定,利用法律武器來追究相應的責任,更高水平地維護圖書館的數字資源系統(tǒng)的管理和保護。

3.合并資源導致的缺陷及解決途徑

合并數字資源,刷新后的原始數據丟失,會使現有的系統(tǒng)數據不完整,影響用戶查找結果的準確性和可視化網絡分析用戶精確性。如:靜態(tài)數據身份識別、院系等動態(tài)的訪問數據等信息。解決的途徑可以考慮如下策略,首先需要數字網絡人員更加詳細的編錄數據字段,對那些有限制條件的檢索組配進行加權,對讀者的瀏覽方式進行更加細致的分類,對讀者的閱覽痕跡加入更加專業(yè)的格式化,便于電子信息更加個性化的分析信息,來提高讀者對圖書館電子資源的利用效率。其次更加詳細地把讀者的靜態(tài)數據資料入檔,把動態(tài)數據留存,幫助大數據進行更全面的分析。最后拓展數據的來源,強化數據的質量,挖掘新穎數據,便于更新換代與持續(xù)改進。

五、結論

數字人文的發(fā)展,為現如今的圖書館事業(yè)開辟出一條新的道路,是人文學科發(fā)展的未來。數字人文不僅僅是一種工具、方法和平臺,還可以把科研人員從繁雜的資料整理中解脫出來,更加專注于高層次的科學研究。圖書館在數字人文方面的進步,意味著加速科研人員的研究速度和效率,因此促進數字人文的發(fā)展具有重大的現實意義。

猜你喜歡
檢索可視化數據庫
數據可視化設計在美妝類APP中的應用
思維可視化
CNKI檢索模式結合關鍵詞選取在檢索中的應用探討
通過實際案例談如何利用外文庫檢索提高檢索效率
瑞典專利數據庫的檢索技巧
復變函數級數展開的可視化實驗教學
復變函數級數展開的可視化實驗教學
復變函數共形映射的可視化實驗教學
復變函數共形映射的可視化實驗教學
英國知識產權局商標數據庫信息檢索
逊克县| 收藏| 海伦市| 东海县| 栾川县| 湖州市| 芷江| 新密市| 江川县| 南平市| 民乐县| 横峰县| 汨罗市| 莫力| 保德县| 建湖县| 九龙县| 青龙| 介休市| 泉州市| 吉安市| 讷河市| 石家庄市| 彰武县| 介休市| 基隆市| 天门市| 乌拉特中旗| 东港市| 曲麻莱县| 民勤县| 德州市| 健康| 南丰县| 白沙| 江油市| 祁连县| 曲阳县| 库伦旗| 平凉市| 麻江县|