劉偉
【摘 要】本文主要對(duì)網(wǎng)絡(luò)信息檢索進(jìn)行論述。
【關(guān)鍵詞】網(wǎng)絡(luò)信息;檢索
隨著信息技術(shù)的高速發(fā)展,信息資源的越來(lái)越顯得重要,而網(wǎng)絡(luò)信息資源也逐步成為這個(gè)信息時(shí)代的核心資源。信息檢索技術(shù)也很快得到發(fā)展,在此網(wǎng)絡(luò)信息檢索隨著網(wǎng)絡(luò)的發(fā)展也應(yīng)運(yùn)而生。網(wǎng)絡(luò)信息檢索,就是將描述特定用戶(hù)所需網(wǎng)絡(luò)信息的提問(wèn)特征,與信息儲(chǔ)存的檢索標(biāo)識(shí)進(jìn)行異同比較,從中找出與提問(wèn)一致或基本一致的網(wǎng)絡(luò)信息的過(guò)程。相對(duì)傳統(tǒng)文獻(xiàn)檢索,網(wǎng)絡(luò)信息檢索顯現(xiàn)出了很多的優(yōu)越性,如不受時(shí)間地點(diǎn)的限制,檢索方式多樣化,多元化等。但是我覺(jué)得網(wǎng)絡(luò)信息檢索的發(fā)展還不是十分完善,仍存在些問(wèn)題,如目前檢索工具在信息搜集缺乏統(tǒng)一的規(guī)范管理,檢索過(guò)程會(huì)出現(xiàn)很多雷同,甚至無(wú)用的垃圾信息等。以下從網(wǎng)絡(luò)信息檢索目前存在的問(wèn)題,及針對(duì)問(wèn)題面臨的以后的發(fā)展方向進(jìn)行了探討。
隨著網(wǎng)上信息資源的膨脹發(fā)展,一種搜索引擎,無(wú)論它多么完善都不可能滿(mǎn)足一個(gè)人所有的檢索需求。如果遇到文獻(xiàn)普查、專(zhuān)題查詢(xún)、新聞?wù){(diào)查與溯源、軟件及MP3下載地址搜索等情況,人們就更需要使用多種搜索引擎來(lái)比較、篩選和相互印證。為解決逐一登陸各搜索引擎,在各搜索引擎中分別多次輸入同一檢索請(qǐng)求等煩瑣操作,基于網(wǎng)絡(luò)檢索工具的檢索工具產(chǎn)生了。
目前這列檢索工具只要有兩種:集成搜索引擎和元搜索引擎。所謂集成搜索引擎是在一個(gè)檢索界面上鏈接若干種獨(dú)立的搜索引擎,檢索時(shí),一次檢索輸入,可以指定搜索引擎也可以要求多個(gè)引擎同時(shí)檢索,搜索結(jié)果由各搜索引擎分別以不同頁(yè)面提交的網(wǎng)絡(luò)檢索工具,其實(shí)是利用網(wǎng)站鏈接技術(shù)形成的搜索引擎集合。集成搜索引擎制作與維護(hù)技術(shù)簡(jiǎn)單,可隨時(shí)對(duì)所鏈接的搜索引擎進(jìn)行增刪調(diào)整和及時(shí)更新,尤其大規(guī)模專(zhuān)業(yè)搜索引擎集成鏈接,深受特定用戶(hù)群歡迎。如國(guó)內(nèi)天網(wǎng)搜霸和百度搜霸,國(guó)外比較著名的有“搜索之家” “網(wǎng)際瑞士軍刀”等。
另一個(gè)是元搜索引擎,用戶(hù)只需遞交一次檢索請(qǐng)求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個(gè)預(yù)先選定的獨(dú)立搜索引擎,并將所有查詢(xún)結(jié)果集中起來(lái)以整體統(tǒng)一的格式呈現(xiàn)到用戶(hù)面前。國(guó)外比較著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle等。目前國(guó)內(nèi)現(xiàn)在還沒(méi)有見(jiàn)到真正意義上的元搜索引擎。元搜索引擎雖沒(méi)有網(wǎng)頁(yè)搜尋機(jī)制,亦無(wú)獨(dú)立的索引數(shù)據(jù)庫(kù),但在檢索請(qǐng)求提交、檢索接口代理和檢索結(jié)果顯示等方面,均有自己研發(fā)的特色元搜索技術(shù)支持。目前元搜索引擎技術(shù)主要有并行處理式和串行處理式兩大類(lèi)。并行式元搜索引擎運(yùn)行時(shí)是將查詢(xún)請(qǐng)求同時(shí)發(fā)向各個(gè)獨(dú)立搜索引擎,然后將的結(jié)果按特定的順序呈現(xiàn)給用戶(hù);串行式元搜索引擎運(yùn)行時(shí)是將查詢(xún)請(qǐng)求先發(fā)向某個(gè)獨(dú)立搜索引擎,待其返回結(jié)果后再將請(qǐng)求發(fā)往另一個(gè)獨(dú)立搜索引擎。
從第一個(gè)元搜索引擎Metacrawler誕生至今,這一新型的網(wǎng)絡(luò)檢索工具異軍突起,發(fā)展迅速,目前可用的元搜索引擎已近百種。由于元搜索引擎的功能受著源搜索引擎和元搜索技術(shù)的雙重制約,元搜索引擎比較理想的并不多見(jiàn)。信息檢索專(zhuān)家邢志宇將元搜索引擎存在的問(wèn)題歸納如下:(1)大多元搜索引擎不支持多語(yǔ)種,尤其是漢語(yǔ)檢索;(2)一些元搜索引擎實(shí)現(xiàn)檢索語(yǔ)法轉(zhuǎn)換的能力有限,不支持指定字段檢索,不能充分發(fā)揮各個(gè)獨(dú)立搜索引擎的高級(jí)檢索功能;(3)部分元搜索引擎無(wú)源搜索引擎列表,用戶(hù)不能自主選擇和調(diào)用源搜索引擎;(4)大部分元搜索引擎僅支持調(diào)用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人為地限制了搜索資源的利用;(5)在檢索結(jié)果上,元搜索引擎只能返回十幾、數(shù)十條“相關(guān)度”較高的結(jié)果,大量可能有價(jià)值的源搜索引擎的檢索結(jié)果被忽視,影響檢索結(jié)果的全面性。
Internet的發(fā)展使信息采集、傳播和利用無(wú)論是從規(guī)模還是速度都達(dá)到了空前的水平。我覺(jué)得未來(lái)網(wǎng)絡(luò)信息檢索技術(shù)的發(fā)展方向如下:
1.智能化
現(xiàn)有的檢索引擎存在著查全率和查準(zhǔn)率低的問(wèn)題,未來(lái)的搜索引擎技術(shù)必須具有能及時(shí)挖掘新信息和及時(shí)能鏈接新增的信息,多途徑檢索功能,用戶(hù)可以交互式檢索,搜索出滿(mǎn)意的信息。提高網(wǎng)絡(luò)信息檢索技術(shù)水平并實(shí)現(xiàn)智能檢索,智能化是網(wǎng)絡(luò)信息檢索未來(lái)主要的發(fā)展方向。智能檢索是基于自然語(yǔ)言的檢索形式,機(jī)器根據(jù)用戶(hù)所提供的以自然語(yǔ)言表述的檢索要求進(jìn)行分析,而后形成檢索策略進(jìn)行搜索,智能檢索技術(shù)就是采用人工智能進(jìn)行信息檢索的技術(shù),它可以模擬人腦的思維方式,分析用戶(hù)以自然語(yǔ)言表達(dá)的檢索請(qǐng)求,自動(dòng)形成檢索策略進(jìn)行智能、快速、高效的信息檢索。最近幾年,智能信息檢索作為人工智能的一個(gè)獨(dú)立研究分支得到了迅速發(fā)展,而且目前已有一些搜索引擎支持智能檢索,但智能化程度還不高,這方面還有待進(jìn)一步的發(fā)展。
2.標(biāo)準(zhǔn)化
現(xiàn)在的網(wǎng)站信息瞬息萬(wàn)變,雜亂紛繁,很是需要進(jìn)行分類(lèi)整理。目前雖然有大量的搜索引擎,但還沒(méi)有一個(gè)統(tǒng)一嚴(yán)格的分類(lèi)方法來(lái)管理,網(wǎng)絡(luò)信息資源在組織分類(lèi)上需要制定一個(gè)統(tǒng)一的分類(lèi)標(biāo)準(zhǔn)。還要規(guī)范網(wǎng)絡(luò)術(shù)語(yǔ),提高資源共享的程度,這樣可以有效保證用戶(hù)的檢索效率。
3.個(gè)性化
科技的發(fā)展要以人為本,隨著科學(xué)技術(shù)的發(fā)展,個(gè)性化服務(wù)也將成為網(wǎng)絡(luò)信息檢索的一個(gè)發(fā)展方向。隨著互聯(lián)網(wǎng)的飛速發(fā)展,每個(gè)人的對(duì)信息的需求將不再滿(mǎn)足于標(biāo)準(zhǔn)化、單一化的大眾需求。不同的人需要不同的服務(wù),如殘疾人士對(duì)網(wǎng)絡(luò)信息檢索的要求就要區(qū)別于常人,要是信息檢索能很好的識(shí)別語(yǔ)音檢索就能很有效的滿(mǎn)足他們的信息需求。如何使用戶(hù)更方便、快捷地使用各種檢索工具,滿(mǎn)足用戶(hù)各種檢索要求,個(gè)性化服務(wù)也會(huì)成為網(wǎng)絡(luò)信息檢索重要的發(fā)展方向。
在這個(gè)知識(shí)大爆炸的時(shí)代,要想從浩如煙海的信息資源中快速準(zhǔn)確地找到自己所需的信息,就需要我們?cè)诓粩嘈畔z索實(shí)踐中總結(jié)及掌握一些檢索技巧。當(dāng)然也需要我們不斷的發(fā)現(xiàn)問(wèn)題,努力解決問(wèn)題。也由衷地希望隨著科技的發(fā)展,網(wǎng)絡(luò)信息檢索技術(shù)越來(lái)越成熟,能給人們帶來(lái)各式各樣的服務(wù),讓我們的生活更加便利。 [科]