畢歡
摘要:在網(wǎng)絡(luò)技術(shù)、計算機(jī)技術(shù)快速發(fā)展背景下,網(wǎng)絡(luò)信息檢索的價值日益凸顯,該文就從網(wǎng)絡(luò)信息檢索特點(diǎn)、檢索方式、檢索的效果、檢索的基本技術(shù)、檢索所用工具出發(fā)進(jìn)行研究,分析了網(wǎng)絡(luò)信息檢索所面臨的局限、日后發(fā)展方向以及發(fā)展趨勢。
關(guān)鍵詞:網(wǎng)絡(luò)信息檢索;技術(shù);發(fā)展趨勢
中圖分類號:TP393 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)10-0008-02
在信息數(shù)字化水平日益提高背景下,龐大的數(shù)字信息與人們獲取信息之間產(chǎn)生的矛盾越來越突出,只有不斷研究網(wǎng)絡(luò)信息檢索方法手段,找到更先進(jìn)的檢索途徑,才能夠消除二者之間的矛盾,讓人們可以更好地利用網(wǎng)絡(luò)信息,因此,現(xiàn)行社會背景下,分析網(wǎng)絡(luò)信息檢索技術(shù)及其發(fā)展趨勢具有一定的必要性。
1網(wǎng)絡(luò)信息檢索原理
網(wǎng)絡(luò)信息檢索是指人們通過網(wǎng)絡(luò)接口軟件,借助相關(guān)終端設(shè)備,在網(wǎng)絡(luò)上獲取信息資源的方式。通常情況下,進(jìn)行網(wǎng)絡(luò)信息檢索時,會根據(jù)用戶所提供的查詢要求,利用相應(yīng)檢索工具,從網(wǎng)絡(luò)信息數(shù)據(jù)庫中搜出與用戶需求相匹配的信息資料,隨著信息技術(shù)與網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)信息檢索原理也在發(fā)生著一定的變化。
現(xiàn)階段我們所使用的網(wǎng)絡(luò)信息檢索模型主要有以下幾種:一是向量空間模型,在該模型支持下,會將網(wǎng)絡(luò)信息數(shù)據(jù)庫中的文檔作為獨(dú)立向量詞條來看,針對不同詞條,重要程度會為其賦予一定權(quán)值,通過將詞條與該詞條權(quán)值作為坐標(biāo)系中坐標(biāo)軸和坐標(biāo)值,使得詞條可以組建出文檔向量空間,文檔成為坐標(biāo)系中的一個點(diǎn),當(dāng)用戶需求該文檔時,借助向量空間模型就會轉(zhuǎn)化為向量空間中矢量問題,此時更準(zhǔn)確的定位用戶所需求信息,提供的信息內(nèi)容匹配度較高;二是布爾邏輯模型,該種模型相對簡單,且匹配較為嚴(yán)格,因此在網(wǎng)絡(luò)信息檢索時也更加常用。在該模型運(yùn)轉(zhuǎn)時,常用的邏輯運(yùn)算有邏輯非、邏輯與以及邏輯或,這就使得最終所獲得內(nèi)容要么與查詢無關(guān),要么與查詢相關(guān)度十分高。三是模糊邏輯模型,該模型是根據(jù)貝葉斯概率原理提出的,其主要依據(jù)了文檔與詞條之間的內(nèi)在聯(lián)系,通過利用詞條與文檔之間、詞條與詞條之間的概率相依性開展檢索。在進(jìn)行網(wǎng)絡(luò)信息檢索過程中,通常會運(yùn)用不同檢索方法與不同結(jié)構(gòu)模型,但是最終都會根據(jù)用戶要求達(dá)到相應(yīng)的檢索目標(biāo),在實(shí)際檢索過程中,往往會將上述三種模型進(jìn)行有效混合,以便檢索效果達(dá)到最佳。
2網(wǎng)絡(luò)信息檢索方式
現(xiàn)階段進(jìn)行網(wǎng)絡(luò)信息檢索時,主要采用了兩種方式,分別為Web檢索與非Web檢索。
(1)Web檢索,該種檢索方式主要檢索對象為Web信息,同時,該種方式也運(yùn)用了Web,在該種檢索方式支持下主要有搜索引擎與瀏覽器兩種檢索方式,其中搜索引擎方式主要是指借助Internet所提供的公共信息檢索服務(wù)Web站點(diǎn),進(jìn)行網(wǎng)絡(luò)信息分析、理解、提取以及處理,通過形成相應(yīng)的數(shù)據(jù)庫,并沒用戶提供檢索平臺,使得用戶在輸入自己想要獲取的內(nèi)容時,能夠進(jìn)行關(guān)鍵詞匹配,詞組匹配以及短語匹配,快速在數(shù)據(jù)庫中調(diào)取出相應(yīng)信息。而瀏覽器檢索方式,主要是指用戶可以在進(jìn)入Internet后,就可以通過瀏覽器進(jìn)入Web界面,此時用戶可以訪問瀏覽器中的數(shù)據(jù)庫。
(2)非Web檢索方式,該種方式檢索對象主要為非Web資源,像Usenet、FTP、Telnet、Gopher等,所使用的檢索工具也為非Web工具,主要有廣域信息服務(wù)器工具、文件檢索服務(wù)器工具、Gopher工具等,其中用戶在利用廣域信息服務(wù)器工具時,可以獲取到多個圖書館聯(lián)機(jī)目錄,通過該工具所提供的幾百個數(shù)據(jù)庫,進(jìn)而對自己所要信息進(jìn)行檢索。文件檢索服務(wù)器工具是一種基于命令的信息檢索工具,在該工具支持下,用戶可以對網(wǎng)絡(luò)上已經(jīng)實(shí)現(xiàn)共享的文件進(jìn)行有效檢索。利用Gopher工具為用戶提供服務(wù)時主要采用了菜單式界面,通過為用戶提供檢索系統(tǒng)與文件查詢系統(tǒng),使得用戶能夠以文件或目錄的形式獲取到服務(wù)器中所有有關(guān)信息。
3網(wǎng)絡(luò)信息檢索的效果
目前在對網(wǎng)絡(luò)信息檢索效果進(jìn)行評價時,主要采用了輸出格式、查全率、收錄范圍、查準(zhǔn)率等幾個指標(biāo),其中查準(zhǔn)率與查全率最為重要。
查準(zhǔn)率指在網(wǎng)絡(luò)信息檢索過程中,所檢出與用戶需求有關(guān)的文獻(xiàn)在所有檢出文獻(xiàn)中所占的比率。而查全率是指在網(wǎng)絡(luò)信息檢索中,所檢出與用戶需求有關(guān)的文獻(xiàn)量與所有系統(tǒng)文獻(xiàn)庫中相關(guān)文獻(xiàn)總量的比率。以上兩項(xiàng)評價指標(biāo)可以有效評價出檢索系統(tǒng)檢驗(yàn)效果,若上述兩數(shù)值均相對較低,則說明網(wǎng)絡(luò)信息檢索效果不佳,反之則說明網(wǎng)絡(luò)信息檢索效果好,但是由于在實(shí)際操作過程中查全率的提高會在一定程度上限制查準(zhǔn)率,因而二者會呈現(xiàn)出一定矛盾性特點(diǎn)。
輸出形式指在進(jìn)行網(wǎng)絡(luò)信息檢索時所檢出相關(guān)信息的表達(dá)形式,通常情況下會有全文、文獻(xiàn)號、文摘等幾種。當(dāng)檢索后所輸出的信息內(nèi)容越多時,更容易用戶獲取自己所需的信息,也更便于用戶瀏覽。
輸入范圍則指網(wǎng)絡(luò)信息檢索所用數(shù)據(jù)庫的收錄范圍,當(dāng)數(shù)據(jù)庫涵蓋內(nèi)容多收錄文檔數(shù)據(jù)資料多時,在一定程度上,則可以為用戶提供更多有價值的信息,反之則會限制網(wǎng)絡(luò)信息檢索效果。
4網(wǎng)絡(luò)信息檢索的基本技術(shù)
現(xiàn)階段網(wǎng)絡(luò)信息檢索主要由以下幾項(xiàng)基本技術(shù)支持:⑴信息推拉技術(shù),該技術(shù)主要包含兩部分,分別為信息推送技術(shù)與信息拉取技術(shù),其中信息推送技術(shù)主要是將網(wǎng)絡(luò)中所擁有的信息主動推送給用戶,而信息拉取技術(shù)則是通過了解用戶需求,在用戶主動查詢數(shù)據(jù)庫中,為用戶拉取出相應(yīng)的信息,該技術(shù)可以提高檢索針對性與檢索效果。⑵Web挖掘技術(shù),在信息技術(shù)快速發(fā)展背景下,當(dāng)前網(wǎng)絡(luò)中所存在的信息量也不斷增加,雖然這會造成用戶利用信息與海量信息之間發(fā)生矛盾,導(dǎo)致用戶信息利用困難度有所提升,但是該技術(shù)通過利用新的挖掘手段,使得用戶對某方面信息提出需求后,可以得到深入挖掘,并獲取更精準(zhǔn)的信息。⑶信息過濾技術(shù)。使用信息過濾技術(shù),可以在對各種信息進(jìn)行加工與處理的基礎(chǔ)上,篩選出可靠性高、價值高的信息,保證用戶能夠在大量的網(wǎng)絡(luò)信息中篩選出與自己需求緊密相關(guān)的信息。⑷自然語言處理技術(shù),由于自然語言相對模糊,且具有一定的靈活性,因而計算機(jī)在理解與處理時難度更高,但是在應(yīng)用自然語言處理技術(shù)后,網(wǎng)絡(luò)中所擁有的信息更為全面,為網(wǎng)絡(luò)信息檢索提供了有力支持。
5網(wǎng)絡(luò)信息檢索的重要工具
目前在進(jìn)行網(wǎng)絡(luò)信息檢索時,主要應(yīng)用了搜索引擎這一工具,其具有檢索效率高的優(yōu)勢,受到廣大網(wǎng)民的歡迎,因而也成為當(dāng)前使用頻率最高的網(wǎng)絡(luò)信息檢索工具。根據(jù)不同搜索引擎特點(diǎn),按照用戶查找途徑,對搜索引擎進(jìn)行分類時,可以分為基于分類目錄的搜索引擎,基于關(guān)鍵詞的搜索引擎,以及綜合式的搜索引擎。
在運(yùn)用搜索引擎這一工具時,利用了數(shù)據(jù)組織機(jī)制、數(shù)據(jù)采集和標(biāo)引機(jī)制,以及用戶檢索機(jī)制,不同機(jī)制在檢索過程中發(fā)揮著不同的作用,但其核心目標(biāo)均為為用戶提供準(zhǔn)確網(wǎng)絡(luò)信息。隨著信息技術(shù),計算機(jī)技術(shù)的快速提高,互聯(lián)網(wǎng)的廣泛普及,搜索引擎在短短幾年之間已經(jīng)實(shí)現(xiàn)了從單一功能到多元功能的有效發(fā)展,且現(xiàn)階段網(wǎng)民主要應(yīng)用的搜索引擎數(shù)量也逐漸減少,可見,現(xiàn)階段所用的搜索引擎功能日益強(qiáng)大。
6網(wǎng)絡(luò)信息檢索所面臨的局限
雖然現(xiàn)階段所用的網(wǎng)絡(luò)信息檢索技術(shù)與工具為人們搜集信息、利用信息提供了較大的幫助,但是由于網(wǎng)絡(luò)信息資源特點(diǎn),以及檢索工具局限性,導(dǎo)致現(xiàn)階段網(wǎng)絡(luò)信息檢索仍然面臨一定的局限。
第一,在文本信息檢索方面的局限,其主要體現(xiàn)在網(wǎng)絡(luò)信息標(biāo)引準(zhǔn)確度不高上,這就使得在進(jìn)行網(wǎng)絡(luò)信息檢索后,檢準(zhǔn)信息與檢全信息時存在著較多的問題,部分用戶在檢索過程中發(fā)現(xiàn)自己所檢索出的信息標(biāo)題與內(nèi)容并不相關(guān)。與此同時,進(jìn)行文本信息檢索時,還存在搜索引擎查全率不高的問題,這就導(dǎo)致網(wǎng)絡(luò)信息檢索效果相對較差,用戶可以在海量信息中中獲取并利用的信息十分有限。除此以外,在文本信息檢索過程中,還存在著檢索方式有限、檢索查準(zhǔn)率不高,以及檢索對象數(shù)據(jù)結(jié)構(gòu)單一等幾方面問題。第二,在進(jìn)行多媒體信息檢索時存在局限,雖然現(xiàn)階段已經(jīng)出現(xiàn)了聲音、圖像、視頻等檢索技術(shù),但是尚未有任何搜索引擎能夠更好的解決多媒體信息檢索,這就影響了用戶利用多媒體信息,降低了網(wǎng)絡(luò)信息利用率以及其存在價值。
7網(wǎng)絡(luò)信息檢索未來發(fā)展方向及趨勢
盡管目前網(wǎng)絡(luò)信息檢索仍然存在著一定的局限,但隨著人們對信息需求的增加,相信未來網(wǎng)絡(luò)信息檢索會朝向以下方向及趨勢發(fā)展。
第一,檢索機(jī)制的完善與檢索效果的提升方向發(fā)展。一方面,有關(guān)人員會提出更加專業(yè)的搜索引擎,通過保證該引擎面向某一特定專業(yè)領(lǐng)域,使得該專業(yè)人員在運(yùn)用該引擎檢索相關(guān)信息時,查全率與查準(zhǔn)率能夠得到提升。另一方面,在社會分工更加細(xì)致的基礎(chǔ)上,也會保證數(shù)據(jù)庫所擁有信息更具有針對性,保證在檢索過程中,有關(guān)技術(shù)可以得到更精準(zhǔn)的使用。與此同時,檢索效果也會朝向綜合性方向發(fā)展,通過將多網(wǎng)站內(nèi)容整合到一起,使得用戶在進(jìn)行網(wǎng)絡(luò)信息檢索時能夠在同一界面中得到各種有關(guān)的查詢信息。
第二,朝向可視化效果方向發(fā)展?,F(xiàn)階段,在進(jìn)行網(wǎng)絡(luò)信息檢索后,通常會獲取到列表式的檢索結(jié)果,雖然這會為用戶提供關(guān)聯(lián)度大小順序,但是無法實(shí)現(xiàn)與用戶之間的交互,也無法對檢索結(jié)果之間關(guān)系進(jìn)行說明。因此,從該角度來看,實(shí)現(xiàn)檢索結(jié)果可視化有助于用戶快速定位自己所需信息,在未來有很大的發(fā)展空間,從另一角度來說,改善信息檢索呈現(xiàn)方式也是提高人們觀察信息、利用信息效果的重要途徑。
第三,智能化檢索的發(fā)展方向。造成當(dāng)前傳統(tǒng)檢索技術(shù)存在較大局限的主要原因是:該種檢索技術(shù)無法了解人的實(shí)際檢索請求,此時所提供檢索服務(wù)個性化程度并不強(qiáng),而實(shí)現(xiàn)智能化檢索,則可以通過檢索技術(shù)與人工智能的有效結(jié)合,更真實(shí)的模擬人腦,從而準(zhǔn)確了解用戶檢索需求,并為用戶提供個性化服務(wù)與個性化需求。
8總結(jié)
總之,目前網(wǎng)絡(luò)信息資源越來越多,要想在海量資源中找到自己所需要的信息是一件具有挑戰(zhàn)性的工作,這就使得網(wǎng)絡(luò)信息檢索備受重視,雖然目前網(wǎng)絡(luò)信息檢索工具已經(jīng)為人們搜索、利用網(wǎng)絡(luò)資源提供了極大便利,但是仍然存在著一些局限,相信在眾多信息專家努力下,會不斷完善與改進(jìn)網(wǎng)絡(luò)信息檢索手段與方法,在網(wǎng)絡(luò)信息檢索方面取得更大的突破,促使人們可以在網(wǎng)絡(luò)中獲取更多豐富生活的知識。