国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺談網(wǎng)絡(luò)信息檢索的現(xiàn)狀及其發(fā)展趨勢

2013-08-15 00:44:35新疆農(nóng)墾科學(xué)院科技信息研究所依米娜克里木
電子世界 2013年16期
關(guān)鍵詞:信息檢索搜索引擎全文

新疆農(nóng)墾科學(xué)院科技信息研究所 依米娜·克里木

1.信息檢索概述

信息檢索(Information Retrieval)是指將信息按照一定的方式組織和存儲起來,并能根據(jù)信息用戶的需要指出其中相關(guān)信息的過程,因此它的全稱叫“信息存儲與檢索”。

隨著互聯(lián)網(wǎng)的發(fā)展,人類社會的信息化、網(wǎng)絡(luò)化進程大大加快。當(dāng)今出現(xiàn)的一系列新型檢索模式,包括網(wǎng)絡(luò)信息規(guī)范控制標(biāo)準等為網(wǎng)絡(luò)檢索技術(shù)的未來展現(xiàn)了新希望,與之相適應(yīng)的信息檢索的交流平臺也迅速轉(zhuǎn)移到以WWW為核心的網(wǎng)絡(luò)應(yīng)用環(huán)境中,信息檢索步入網(wǎng)絡(luò)化時代,網(wǎng)絡(luò)信息檢索已基本取代了手工檢索。

2.網(wǎng)絡(luò)信息檢索的現(xiàn)狀

對大多數(shù)讀者而言,檢索并不意味著發(fā)現(xiàn),而是獲得。人們希望不僅僅是提供寬泛的檢索結(jié)果,而應(yīng)該是計算機能試圖理解用戶提問的意圖,并對檢索結(jié)果進行適當(dāng)?shù)姆诸惡团判?。但是,現(xiàn)有的搜索引擎大多是基于簡單的關(guān)鍵詞匹配,不能真正理解用戶的檢索意圖;各個搜索引擎的信息搜集和索引建立有很大的不同,每個搜索引擎平均只能涉及到整個網(wǎng)上資源的30%~50%,而其中真正有用的信息也只占很小的比例,這就意味著使用任何一個搜索引擎都只能檢索到網(wǎng)絡(luò)中的部分資源。目前網(wǎng)絡(luò)檢索面臨一系列的挑戰(zhàn),網(wǎng)絡(luò)信息量迅猛增加,人工已經(jīng)無法對它們進行有效的分類、索引和利用;簡單的關(guān)鍵詞搜索,返回的信息量過大,已經(jīng)讓用戶無法承擔(dān);網(wǎng)絡(luò)信息組織的無序性;信息有用性評價困難;網(wǎng)絡(luò)信息日新月異的更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網(wǎng)信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專業(yè)化、多元化、多媒體化的網(wǎng)絡(luò)信息檢索工具出現(xiàn)的呼聲越來越高,并且有更多的人參與到其中來。如此種種,給當(dāng)今的網(wǎng)絡(luò)信息檢索研究帶來了發(fā)展機遇,也給了它無限的發(fā)展空間。

3.網(wǎng)絡(luò)信息檢索的現(xiàn)行模式

3.1 網(wǎng)絡(luò)全文數(shù)據(jù)庫檢索

網(wǎng)絡(luò)全文數(shù)據(jù)庫是以全文數(shù)據(jù)為數(shù)據(jù)庫對象,并在網(wǎng)上提供全文檢索服務(wù)的數(shù)據(jù)庫。按數(shù)據(jù)庫的生產(chǎn)機構(gòu)分類,可分為出版商全文期刊數(shù)據(jù)庫和生產(chǎn)商全文期刊數(shù)據(jù)庫。前者主要是那些期刊出版單位在其出版的印刷期刊基礎(chǔ)上建立的網(wǎng)絡(luò)電子期刊全文數(shù)據(jù)庫。而后者則是由數(shù)據(jù)庫生產(chǎn)商根據(jù)一定的主題或一定的收錄范圍整合一定數(shù)量的期刊出版物而產(chǎn)生的全文數(shù)據(jù)庫。國內(nèi)全文數(shù)據(jù)庫主要有中國學(xué)術(shù)期刊全文數(shù)據(jù)庫。

3.2 網(wǎng)絡(luò)搜索引擎檢索

搜索引擎是一個專門的系統(tǒng),它可以對互聯(lián)網(wǎng)信息資源進行搜索整理和分類,并將其儲存在網(wǎng)絡(luò)數(shù)據(jù)庫中供用戶查詢。搜索引擎包括搜集信息、分類和用戶查詢等三大部分。目前流行的搜索引擎有兩大類:關(guān)鍵詞全文檢索式搜索引擎和分類目錄式搜索引擎。

關(guān)鍵詞全文檢索式搜索引擎主要利用其內(nèi)部的搜索機器人和蜘蛛程序,自動搜索來自互聯(lián)網(wǎng)上的各種內(nèi)容,在每一個關(guān)鍵詞和所有相關(guān)的網(wǎng)頁之間按照網(wǎng)頁相關(guān)性原理建立一個對應(yīng)關(guān)系,儲存在其網(wǎng)絡(luò)服務(wù)器的數(shù)據(jù)庫中。用戶只要輸入關(guān)鍵詞就可以找到符合該關(guān)鍵詞特征的所有被索引的網(wǎng)頁,搜索結(jié)果以超鏈接的方式列表,搜索結(jié)果有簡單介紹,用戶點擊相應(yīng)的鏈接就可以進入相應(yīng)的網(wǎng)絡(luò)資源網(wǎng)站,從而找到所需信息。用這種方式搜索到的結(jié)果通常數(shù)以百萬計,但是相關(guān)性越高的信息,在搜索結(jié)果列表中的位置越靠前。分類目錄式搜索引擎將互聯(lián)網(wǎng)信息按照一定的標(biāo)準進行收集和分類,并編入相應(yīng)目錄,以層級和逐次分項的方式管理目錄,查找信息可以按照分類目錄一層層進入,最終找到所要的信息。

3.3 互聯(lián)網(wǎng)“超鏈接”搜索

Web信息以超文本鏈接方式組織,基本組織單元是信息節(jié)點而不是字符串,信息節(jié)點之間通過鏈接進行聯(lián)系。超鏈接是網(wǎng)頁必不可少的一個元素,同一主題或相關(guān)的信息因超鏈接構(gòu)成了信息網(wǎng)。超文本信息檢索技術(shù),以超文本信息節(jié)點之間的多種鏈接關(guān)系為基礎(chǔ),根據(jù)思維聯(lián)想或查找信息的需要,通過鏈接從一個信息節(jié)點轉(zhuǎn)到另一個信息節(jié)點。

4.網(wǎng)絡(luò)信息檢索的未來發(fā)展趨勢

網(wǎng)絡(luò)技術(shù)的發(fā)展,給網(wǎng)絡(luò)信息檢索及信息的網(wǎng)絡(luò)化帶來的極大的便利,進一步推動了網(wǎng)絡(luò)信息檢索理論和技術(shù)的快速發(fā)展。怎樣為網(wǎng)絡(luò)用戶提供高質(zhì)量、高效率的檢索方式是網(wǎng)絡(luò)信息檢索研究者的努力方向。信息檢索的對象已從傳統(tǒng)的文本信息擴展到如今開放、動態(tài)、分布廣泛的多媒體信息。那么,網(wǎng)絡(luò)信息檢索的發(fā)展趨勢如何呢?

4.1 智能化信息檢索

智能化信息檢索是基于自然語言處理的檢索形式。檢索工具是對用戶提供的以自然語言表達的檢索要求進行分析,從而形成檢索策略進行檢索。檢索工具智能化的內(nèi)涵在于檢索工具具有學(xué)習(xí)、分析、辨別和推理的能力。近年來,因特網(wǎng)上不斷涌現(xiàn)的人工智能產(chǎn)品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網(wǎng)絡(luò)信息檢索的智能化程度,促進智能信息檢索的發(fā)展。

網(wǎng)絡(luò)中的智能代理通常是一個專家系統(tǒng)、一個過程、一個模塊或一個求解單元。智能代理可以獲得用戶的信息需求,自動檢索信息和推送檢索結(jié)果信息。多智能代理系統(tǒng)還具有信息發(fā)現(xiàn)、信息篩選、信息推送和信息導(dǎo)航功能,可滿足專業(yè)研究人員的特定需求,實現(xiàn)網(wǎng)絡(luò)信息檢索與服務(wù)的智能化。

4.2 一站式信息檢索

一站式(One Stop)信息檢索是指用戶通過一個檢索工具能滿足自己所有的信息檢索需求。一站式信息檢索將是網(wǎng)絡(luò)信息檢索服務(wù)的一種發(fā)展模式。一站式檢索服務(wù)是人性化服務(wù)的重要體現(xiàn),它將大量節(jié)約用戶的檢索時間。全球最大的搜索引擎Google正在朝著一站式服務(wù)的方向發(fā)展。2004年12月,Google宣布與紐約公共圖書館和包括哈佛大學(xué)圖書館在內(nèi)的4個主要圖書館合作,將這些圖書館的大約1500萬冊藏書掃描進自己的數(shù)據(jù)主庫以提供網(wǎng)絡(luò)用戶檢索。目前,Google已經(jīng)為其用戶提供了某種程度上的一站式的檢索服務(wù)了。而其他越來越多的檢索服務(wù)提供商將向一站式檢索方向發(fā)展。

4.3 可視化

可視化指的是運用計算機圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術(shù)。據(jù)統(tǒng)計,獲取信息有70%~80%靠視覺,20%靠聽覺,10%靠觸覺。用圖像取代文字幫助人們檢索的優(yōu)點在于:圖像的表達更生動、結(jié)束語形象、準確,效率更高,具有交互性、多維性、可視性等特點,可以大大加快檢索速度,使時刻都在產(chǎn)生的海量數(shù)據(jù)得到有效利用。

4.4 商業(yè)化

目前網(wǎng)絡(luò)信息檢索系統(tǒng)已成為新的投資熱點,網(wǎng)絡(luò)信息檢索系統(tǒng)不再僅僅是一種檢索工具,而且是一種商業(yè)產(chǎn)品。2001年10月,全球最大的中文搜索引擎提供商百度(www.baidu.com)聯(lián)合新浪等多家中文門戶網(wǎng)站,共同推廣“搜索引擎競價排名”全新網(wǎng)絡(luò)商業(yè)服務(wù)模式。網(wǎng)絡(luò)信息檢索的商業(yè)化還體現(xiàn)在聯(lián)機和光盤檢索逐漸進入網(wǎng)絡(luò)環(huán)境。由于目前網(wǎng)絡(luò)信息檢索的檢準率低,聯(lián)網(wǎng)的收費聯(lián)機和光盤檢索依舊受到青睞,如世界著名的聯(lián)機信息系統(tǒng)DIALOG、OCLC、EBSCO、Silverplatter,國內(nèi)的萬方數(shù)據(jù)資源系統(tǒng)、中國學(xué)術(shù)期刊光盤、重慶維普公司系列光盤等都紛紛在網(wǎng)上設(shè)立自己的網(wǎng)絡(luò)檢索入口。許多著名科技期刊的上網(wǎng)豐富了網(wǎng)絡(luò)資源,它們大多數(shù)都是在提供印刷版的同時提供期刊的網(wǎng)上服務(wù),包括收費檢索。

5.小結(jié)

在的網(wǎng)絡(luò)信息資源中尋找自己所需要的信息資源是一件極具挑戰(zhàn)性的工作。為此,許多信息專家正在積極地研究探索,并且取得了不少成果。我們相信隨著科學(xué)技術(shù)的進步,網(wǎng)絡(luò)信息檢索發(fā)展會越來越快,人們所利用的檢索工具和手段的更替會更加頻繁。

[1]黃靜.網(wǎng)絡(luò)信息檢索發(fā)展方向展望[J].Journal of Library and Information Sciences in Agriculture,2008(1):15-19.

[2]霍小梅,王小蘭.網(wǎng)絡(luò)信息檢索的現(xiàn)狀及發(fā)展趨勢[J].圖書館論壇,2004(4):180-182.

[3]戴莉.網(wǎng)絡(luò)信息檢索的發(fā)展趨勢[J].情報探索,2005(2):52-54.

[4]徐謙.網(wǎng)絡(luò)信息檢索的智能化趨勢[J].圖書館理論與實踐,2006(2):63-65.

[5]謝新洲.網(wǎng)絡(luò)信息檢索技術(shù)與案例[M].北京:北京圖書館出版社,2005:9.

[6]易向軍.網(wǎng)絡(luò)信息檢索現(xiàn)狀及未來[J].合肥學(xué)院學(xué)報,2007(7):90-92.

猜你喜歡
信息檢索搜索引擎全文
全文中文摘要
全文中文摘要
青年再造
醫(yī)學(xué)期刊編輯中文獻信息檢索的應(yīng)用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
廣告主與搜索引擎的雙向博弈分析
構(gòu)思精巧余味無窮 諷刺鞭撻淋漓盡致——再談“虛榮”貫穿《項鏈》全文
語文知識(2014年5期)2014-02-28 21:59:59
教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實施
河南科技(2014年11期)2014-02-27 14:10:19
长沙市| 佳木斯市| 灌云县| 安溪县| 阜平县| 乐清市| 池州市| 临猗县| 信宜市| 汉中市| 宁津县| 广宗县| 兴海县| 巴南区| 盘锦市| 修武县| 益阳市| 苗栗县| 鄂托克前旗| 德钦县| 舞钢市| 泸州市| 临桂县| 治县。| 淮安市| 页游| 新宁县| 卫辉市| 房山区| 龙里县| 乌审旗| 南乐县| 前郭尔| 白山市| 岱山县| 湖州市| 柳江县| 威信县| 城固县| 洛川县| 米泉市|