作者簡(jiǎn)介:胡守偉(1991—),男,漢族,安徽省滁州市人,安徽大學(xué)管理學(xué)院情報(bào)學(xué)專業(yè)。
摘 要:本文主要簡(jiǎn)單介紹影響網(wǎng)絡(luò)信息檢索的因素,以及面對(duì)現(xiàn)在互聯(lián)網(wǎng)的錯(cuò)綜復(fù)雜的環(huán)境下,對(duì)實(shí)現(xiàn)高效率的信息檢索提出幾點(diǎn)建議。
關(guān)鍵詞:網(wǎng)絡(luò)信息檢索;信息檢索;網(wǎng)絡(luò)信息
互聯(lián)網(wǎng)上的信息量是非常巨大的,隨著互聯(lián)網(wǎng)的技術(shù)和信息技術(shù)的不斷發(fā)展,人類接觸到的信息也是不斷變多,但是,由于在互聯(lián)網(wǎng)存在的信息資源的特點(diǎn),使得人們尋找自己想要的信息變的越來越難,人們更加迫切需要更好的檢索工具來幫助我們獲取自己想要的信息。信息社會(huì)離不開信息的作用,信息已經(jīng)是人類生活不可或缺的一部分。本文將介紹影響檢索信息的幾個(gè)因素,在此基礎(chǔ)上并提出幾點(diǎn)建議。
1.網(wǎng)絡(luò)信息檢索的現(xiàn)狀
網(wǎng)絡(luò)信息檢索最早是由國(guó)外學(xué)者Alan Emtage在1990年發(fā)明的Archie開始的,不過由于當(dāng)時(shí)網(wǎng)絡(luò)技術(shù)的應(yīng)用處于初級(jí)階段,應(yīng)用還是比較狹窄,只能簡(jiǎn)單的應(yīng)用于FTP文件的檢索。但是后來隨著萬維網(wǎng)的出現(xiàn)以及信息技術(shù)的不斷飛躍發(fā)展,網(wǎng)絡(luò)信息檢索開始了基于網(wǎng)頁(yè)的檢索,并且迅速發(fā)展。伴隨而來的問題就是網(wǎng)絡(luò)信息檢索的效率問題。隨著信息資源數(shù)字化的發(fā)展,人們?cè)絹碓揭揽繖z索來獲取自己想要的信息。但是,從目前的情況看,每天在互聯(lián)網(wǎng)上產(chǎn)生的信息量是相當(dāng)驚人的。用戶想要短時(shí)間獲取自己想要的信息已經(jīng)變得更加困難。
2.影響網(wǎng)絡(luò)信息檢索的因素
2.1 源于ICP的影響因素
ICP(即是Internet Content Provider 的簡(jiǎn)稱),它是指網(wǎng)絡(luò)信息提供者或者稱網(wǎng)站經(jīng)營(yíng)者[1]。某些ICP為了獲得額外的利潤(rùn)或是某種目的,當(dāng)用戶點(diǎn)擊某些優(yōu)質(zhì)的網(wǎng)頁(yè)的時(shí)候,在打開的同時(shí)會(huì)出現(xiàn)一些劣質(zhì)的網(wǎng)站,這些劣質(zhì)網(wǎng)站不夠規(guī)范而且存在的信息的準(zhǔn)確性也是有待商榷,另外這些ICP對(duì)采集的信息進(jìn)行頁(yè)面特征提取、主題分析并進(jìn)行相應(yīng)歸類,也即是以詞頻和詞出現(xiàn)位置的統(tǒng)計(jì)為依據(jù);這樣就為某些ICP 帶來可乘之機(jī),他們故意將一些無關(guān)的主題詞放置在重要的標(biāo)記內(nèi),或讓某些關(guān)鍵詞重復(fù)出現(xiàn)在重要的段落處,以提高其頁(yè)面被檢索的機(jī)率,然而這卻大大地影響用戶的檢準(zhǔn)率[1]。
2.2網(wǎng)絡(luò)信息資源質(zhì)量的因素
由于互聯(lián)網(wǎng)本身的特點(diǎn),即開放性,自由性和公開性導(dǎo)致了在互聯(lián)網(wǎng)上信息資源紛繁復(fù)雜,包括虛假的信息、淫穢的信息、暴力信息等等。同時(shí),在信息的發(fā)布端,如何控制信息源產(chǎn)生的信息準(zhǔn)確性。信息資源是不是能夠涵蓋某一方面,這些因素都會(huì)影響用戶進(jìn)行網(wǎng)絡(luò)信息檢索。
2.3檢索工具和方式的因素
傳統(tǒng)的信息資源標(biāo)引方式已經(jīng)不能適應(yīng)當(dāng)前復(fù)雜的網(wǎng)絡(luò)信息資源的類型,尤其在網(wǎng)絡(luò)新詞或是同義詞和近義詞,標(biāo)引方式就很難適應(yīng)這些新的變化,這也就導(dǎo)致了檢索工具不能檢索出未被標(biāo)引出來的信息資源,影響了檢索工具的檢全率。檢索工具的檢索方式也是多種多樣,按照布爾邏輯檢索、作者姓名,關(guān)鍵詞等方式進(jìn)行檢索,但是檢索的要求就會(huì)不一樣,使用的語言不具有統(tǒng)一性。這也是制約網(wǎng)絡(luò)信息檢索的重要因素。大多數(shù)搜索引擎的檢索方式比較單一,一般只提供分類檢索和關(guān)鍵詞檢索,這樣,一方面,檢索時(shí)不能從信息資源的多個(gè)方面對(duì)檢索提問進(jìn)行限制,只能就某一關(guān)鍵詞或概念進(jìn)行籠統(tǒng)的檢索[2]。
相比較早期的檢索內(nèi)容來看,隨著人們檢索的需求發(fā)生改變,現(xiàn)在的檢索內(nèi)容也發(fā)生了變化,從最開始的檢索文本信息到如今要檢索圖片,視頻,音頻等多種形式的內(nèi)容,而從信息技術(shù)的發(fā)展看,國(guó)內(nèi)目前還沒有專業(yè)的檢索工具,影響檢索的全面性。
3.用戶本身的影響
(1)自身語言的障礙。由于用戶本身學(xué)歷或是地域的限制,導(dǎo)致了用戶只能掌握自己的母語。想要利用國(guó)外的檢索工具進(jìn)行外文檢索,也是很難完成的。目前最新的科技成果都是用英文表現(xiàn)出來的。由于語言的限制,影響了用戶的檢索。
(2)檢索語言的障礙。隨著現(xiàn)代學(xué)科的分類越來越細(xì),新興學(xué)科、邊緣學(xué)科、交叉學(xué)科不斷涌現(xiàn),每門學(xué)科應(yīng)用的術(shù)語、符號(hào)也隨著專深、復(fù)雜,每個(gè)學(xué)科所使用的檢索語言要求也是更加嚴(yán)格[2]。檢索語言和檢索方法和技巧的不能掌握,導(dǎo)致了不能全面利用各種檢索工具和系統(tǒng)。
(3)檢索能力的障礙。由于自身的理解能力、信息把握能力,語言組織能力的缺乏,在輸入檢索詞的時(shí)候可能出現(xiàn)表達(dá)不清楚,檢索出來不是用戶想要的信息。另外,用戶自身的計(jì)算機(jī)水平有限制,缺乏必要的計(jì)算機(jī)基礎(chǔ)知識(shí),隨著現(xiàn)在信息技術(shù)更新?lián)Q代過于快速,檢索工具、應(yīng)用軟件還不能掌握,嚴(yán)重影響了用戶利用檢索工具獲取信息資源。
4.提高網(wǎng)絡(luò)信息檢索效率的建議
4.1 加強(qiáng)監(jiān)管,提高信息資源的質(zhì)量
ICP是網(wǎng)絡(luò)信息的主要來源,國(guó)家或是政府應(yīng)該制定相應(yīng)的法律法規(guī),來完善行業(yè)準(zhǔn)則,保證信息源頭不會(huì)出現(xiàn)虛假、暴力、淫穢等信息資源。加強(qiáng)對(duì)各類網(wǎng)站的監(jiān)控管理,對(duì)質(zhì)量差的網(wǎng)站應(yīng)該加以限制,提高該網(wǎng)站的規(guī)范化,標(biāo)準(zhǔn)化。與此同時(shí),網(wǎng)民也可以發(fā)揮自己的力量,堅(jiān)決抵制和舉報(bào)虛假的信息。最后,積極組織開發(fā)、研制相關(guān)軟件及應(yīng)用網(wǎng)絡(luò)新技術(shù),對(duì)網(wǎng)絡(luò)信息進(jìn)行技術(shù)上的篩選、過濾,建立安全屏障,最大限度防止不良信息的侵入[3]。
4.2對(duì)網(wǎng)絡(luò)檢索工具的改進(jìn)
(1)改變傳統(tǒng)的標(biāo)引隨意性。改變以往只是依靠機(jī)器進(jìn)行標(biāo)引,把人工標(biāo)引和機(jī)器標(biāo)引相結(jié)合。規(guī)范標(biāo)引的索引詞,制定統(tǒng)一的標(biāo)準(zhǔn),加強(qiáng)對(duì)檢索詞的語義理解,提高檢索的智能化。對(duì)出現(xiàn)在網(wǎng)絡(luò)上的信息資源不只是簡(jiǎn)單的收集、利用。而是需要將這些信息資源進(jìn)行分析歸類,深度加工,建立一種具有多種語言標(biāo)引識(shí)別,提高檢索效率。
(2)完善用戶信息搜索界面,方便使用。完善檢索界面,能夠使用戶獲得更好地使用體驗(yàn),一個(gè)友好的用戶界面要能支持用戶進(jìn)行多語言、多種邏輯方式和多種角度提問檢索,盡可能做到方便用戶使用[1]。改變檢索方式,使其更加自然、易懂,能適用于多種檢索平臺(tái)。
(3)改進(jìn)信息資源檢索的技術(shù),形成更加專業(yè)的檢索工具。面對(duì)多種信息資源的檢索,不能單獨(dú)只對(duì)文本信息的檢索,對(duì)于圖片、音頻、視頻等信息,需要采用更加合理的檢索工具來提高檢索效率,提高檢索的專業(yè)化。
4.3加強(qiáng)用戶檢索能力的培訓(xùn)[4]
對(duì)于用戶本身不具備的能力,需要通過不斷地學(xué)習(xí)來完善自己,才能掌握更多的語言和計(jì)算機(jī)的基礎(chǔ)知識(shí)。對(duì)于語言方面,用戶需要加強(qiáng)對(duì)語言的理解,能夠清楚地表達(dá)自己的信息需求,檢索的效率才能很好地體現(xiàn)出來。
檢索途徑,用戶需要了解更多檢索的方法,并不僅僅局限于只用關(guān)鍵詞進(jìn)行檢索,用戶為了獲取更多,更準(zhǔn)確的信息資源,力求掌握多種檢索途徑,進(jìn)行高級(jí)檢索。同時(shí),用戶可以進(jìn)行多個(gè)檢索平臺(tái)的檢索也是提高檢索效率的有效途徑之一,用戶利用多種語言在多個(gè)數(shù)據(jù)庫(kù)進(jìn)行檢索,提高用戶獲取信息資源的技能。
總之,面對(duì)信息的海洋,提高檢索的效率和檢全率是我們追求的目標(biāo)。影響網(wǎng)絡(luò)信息檢索的因素有許多方面,改進(jìn)的途徑也是非常多,但是,因特網(wǎng)是一個(gè)巨大的展示信息的平臺(tái),目前還是有許多地方存在一個(gè)不完善的地方,需要國(guó)家、政府以及個(gè)人不斷的努力,才能提高網(wǎng)絡(luò)信息檢索的效率。
(作者單位:安徽大學(xué)管理學(xué)院)
參考文獻(xiàn):
[1] 王淑群.影響網(wǎng)絡(luò)信息檢索的因素與對(duì)策[J].圖書館論壇;2006,26(2).197-199
[2] 王穎春.影響網(wǎng)絡(luò)信息檢索效率的因素與對(duì)策[J].現(xiàn)代情報(bào);2007(9).5-7
[3] 趙明臻。網(wǎng)絡(luò)信息檢索障礙及排除策略探論[J].圖書與情報(bào);2005(1),42-45
[4] 趙惠芳.網(wǎng)絡(luò)信息利用障礙分析[J].圖書館學(xué)刊,2003,(2);