摘 要:高等學(xué)校的“文獻檢索課”是一種快速變化的課程,從印刷型檢索到利用計算機聯(lián)機以及對互聯(lián)網(wǎng)資源的檢索,應(yīng)該與其檢索對象的大環(huán)境亦步亦趨,網(wǎng)絡(luò)信息資源日臻豐富,給高校的“文獻檢索課”帶來了新的內(nèi)涵,掌握一種新的實用高效的搜索引擎應(yīng)該是大學(xué)生“個人信息基礎(chǔ)架構(gòu)”的重要的部分。
關(guān)鍵詞:檢索;信息資源;信息素質(zhì)
1 引言
“信息素質(zhì)”(Information Literacy),國內(nèi)一般譯為信息認識,信息素質(zhì),信息素養(yǎng),信息能力等。信息素質(zhì)具有廣泛滲透性,涉及國家經(jīng)濟及社會發(fā)展各領(lǐng)域、各層次,是事關(guān)國家在信息社會的持續(xù)發(fā)展能力和綜合競爭力的一個重要概念。在信息化熱潮席卷全球,信息素質(zhì)在發(fā)達國家已被看作是有關(guān)國家興衰存亡的一個重要方面,并在許多發(fā)達國家的各教育階段全面開發(fā),有較為權(quán)威的教育政策文件、標準和面向各學(xué)科專業(yè)的信息素質(zhì)教育項目、計劃、課件等。
信息檢索一直是信息素質(zhì)相關(guān)教育中最受重視的部分,是構(gòu)成學(xué)習(xí)者信息能力的重要方面,我國目前實施信息素質(zhì)相關(guān)教育采用的最普遍、最主要的教學(xué)形式――高?!拔墨I檢索課”,其主要內(nèi)容包括:文獻信息的組織方法、檢索語言,各類檢索工具、檢索系統(tǒng)的檢索利用方法,各類文獻的檢索途徑等。隨著網(wǎng)絡(luò)的日益普及和Internet信息資源的深入人心,起來越多的人們把網(wǎng)絡(luò)作為日常獲得信息的重要手段,有關(guān)的調(diào)查和分析表明,對于教育和科技界用戶來說,通過網(wǎng)絡(luò)查詢、獲取信息的比例已超過利用圖書館的比例。高校圖書館的“文獻檢索課”在外延和內(nèi)涵上正經(jīng)歷著新的重大轉(zhuǎn)變。
1984年教育部作出了具有戰(zhàn)略意義的決策,在全國高校普遍開設(shè)“文獻檢索與利用”課程,文獻檢索課也從最初完全傳統(tǒng)的印刷型檢索工具開始,20世紀80年代后期逐步結(jié)合計算機聯(lián)機的知識,90年代中后期逐步結(jié)合計算機聯(lián)機檢索的內(nèi)容及其到如今網(wǎng)絡(luò)信息資源的檢索,在短短的十多年中發(fā)生了巨大的變化,這也是國內(nèi)教學(xué)內(nèi)容變化最快的課程,即便如此,然而,當(dāng)我們果真面臨洶涌澎湃的網(wǎng)絡(luò)信息大潮時,卻發(fā)現(xiàn)原有的教材已跟不上網(wǎng)絡(luò)發(fā)展的步伐,所以我們亟待補上這一門被“文獻檢索課”疏忽的實則不可或缺的一個章節(jié),掌握一種界面簡潔、友好,搜索功能強大的搜索引擎――Google。
互聯(lián)網(wǎng)是21世紀最重要的信息媒體,也是世界上最大的信息資源寶庫,掌握在網(wǎng)絡(luò)環(huán)境下的信息檢索方法是大學(xué)生讀者的需求,然而,網(wǎng)絡(luò)環(huán)境下的信息檢索與傳統(tǒng)信息環(huán)境下的檢索有很大不同,網(wǎng)絡(luò)信息資源范圍大、數(shù)量多,網(wǎng)絡(luò)檢索工具及檢索方法也是紛繁眾多,要迅速準確并相對全面完整地找到所需信息并不是很容易,往往會感到與自己的檢索目標不符合或差距太遠而放棄檢索。網(wǎng)絡(luò)信息檢索所具有的多樣性、靈活性遠遠超出了傳統(tǒng)的信息檢索,許多在過去的檢索過程中業(yè)已形成習(xí)慣的某些檢索思維,以及一些已成定勢的檢索方法,在網(wǎng)絡(luò)信息檢索空間往往行不通,或不能使檢索結(jié)果達到最優(yōu),所以,對一種實用的網(wǎng)絡(luò)搜索引擎獲取更深廣的認知很有必要。
2 我們?yōu)槭裁葱枰畔⑺阉饕?/p>
世界上的某些圖書館,特別是某些大學(xué)的圖書館,凡是正式出版的書,它們都網(wǎng)羅無遺,不過,這樣子的做法已不能維持多久。到2040年,世界上會有2億種不同的書,要存放這些書,就得要有5000英里長的書架,存放與編目工作的代價將是驚人的。顯然,我們時代的泛濫的信息需要通過電子方法來管理,各種論文、期刊、報道與其他信息的數(shù)量遠遠超過書的數(shù)量,這就給信息的整理工作帶來了更大的困難。
人們創(chuàng)造并保留下來的信息的數(shù)量是在印刷機發(fā)明以后開始增加起來的。開始時,增加的速度很慢,谷登堡印刷機的初始階段并沒有新書的創(chuàng)作,那時科學(xué)和學(xué)習(xí)只是對古老的書本內(nèi)容的研究和再研究,但是,文藝復(fù)興開辟了認識世界的新途徑,人們慢慢地開始掌握新的知識,第一本科學(xué)期刊是在十七世紀六十年代出版的,它比谷登堡發(fā)明印刷機要晚兩個世紀。到了1750年,世紀上已有10種科學(xué)期刊了,并且從那時起,每過五十年科學(xué)期刊的數(shù)量就增加到10倍。大約數(shù)字如下:
1750年科學(xué)期刊數(shù)量 10種
1800年科學(xué)期刊數(shù)量 100種
1850年科學(xué)期刊數(shù)量 1000種
1900年科學(xué)期刊數(shù)量 10,000種
1950年科學(xué)期刊數(shù)量 100,000種
到了二十世紀五十年代,有記錄的信息增長之快,被稱為信息爆炸,這種說法似乎并不確切,因為爆炸是很快就會結(jié)束的,而在二十世紀六十年代和以后的歲月中,電子技術(shù)以前人所不能想象的方式迅速提高了記錄信息的速度。
科學(xué)論文數(shù)目的增長速度大大地超過了期刊數(shù)目的增長,人類知識的總和在1950年是每十年就翻一番,在計算機無線電通信等領(lǐng)域尤甚。
正當(dāng)科學(xué)進展需要的時候,處理和傳遞信息的新技術(shù)及時出現(xiàn)了?;仡櫦夹g(shù)發(fā)展的歷史,人們發(fā)現(xiàn),某個研究領(lǐng)域里的一些重要發(fā)明往往正好是在其他領(lǐng)域的發(fā)展需要它們的時候出現(xiàn)的。例如,電子管出現(xiàn)在電信發(fā)展極其需要它們的時候,我們現(xiàn)在已經(jīng)進入人類知識的這樣一個階段:不借助計算機,所有工業(yè)部門管理和科學(xué)研究部門所創(chuàng)造的信息就根本無法處理。這種信息不會終止,只會更加加劇。
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)上信息資源日臻豐富,在浩如煙海的信息中尋找有用信息更成了一個非常棘手的問題,于是,搜尋信息方便性變得與提供信息本身同樣重要,互聯(lián)網(wǎng)除了提供信息,還提供方便的信息檢索服務(wù),實現(xiàn)后一種功能的主要手段就是利用搜索引擎。Google于是應(yīng)運而生。如果以毫不偏頗、毫不排外的眼光與情懷來看待這種風(fēng)靡全球的Google,它的確是最好的搜索引擎。
Gogle是由Larry Page與Sergey Brin于1998年9月在美國硅谷設(shè)計的搜索引擎。目前,已有Yahoo、AQL、網(wǎng)景和中國的網(wǎng)易等知名網(wǎng)站在內(nèi)的全球150多家公司采用了Google的搜索引擎技術(shù)。Google中文搜索引擎在某種程度上可以說是目前收錄范圍最廣、功能最強、準確度最高的搜索引擎。
3 Google的功能與特點
Google搜索引擎是是一個利用蜘蛛程序(Spider)以某種方法自動在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,并由索引器為搜集到的信息建立索引,從而提供面向網(wǎng)頁的全文檢索服務(wù)的互聯(lián)網(wǎng)查詢系統(tǒng),它主要有以下特點和功能:
1.采用了先進的網(wǎng)頁級別(Page Rank)技術(shù)。這種技術(shù)是指依據(jù)網(wǎng)絡(luò)自身結(jié)構(gòu),根據(jù)互聯(lián)網(wǎng)本身的鏈接結(jié)構(gòu)對相關(guān)網(wǎng)站用自動方法進行分類,整理混沌信息,整合組織資源,使網(wǎng)絡(luò)井然有序。這種技術(shù)打破了傳統(tǒng)網(wǎng)絡(luò)分類概念,它是基于網(wǎng)頁的自然結(jié)構(gòu),即任何網(wǎng)頁均可直接鏈接到另一網(wǎng)頁,無須任何媒介。從某種意義上說,該鏈接結(jié)構(gòu)自動地推動了互聯(lián)網(wǎng)的民主化,消除了等級,從而使信息與觀念在站點與站點之間暢通無阻。
2.在同一個界面下,可以定制語言和到何種網(wǎng)站中進行搜索。因為Google將多國語言的搜索引擎整合到同一個界面,選擇非常方便。它不像其他搜索引擎(如Yahoo)那樣,要搜索不同語言版本的網(wǎng)站,必須先進入相應(yīng)語言的網(wǎng)站。目前,Google已可以對包括中文在內(nèi)的26種語言進行搜索。
3.搜索結(jié)果通常會比其他搜索引擎來得更準確。對于現(xiàn)實中許多不諳搜索引擎復(fù)雜系統(tǒng)的使用方式和規(guī)則的檢索者,例如,不知道搜索引擎與分類目錄的差別,不懂使用邏輯運算符,只會用單一關(guān)鍵詞查詢等這些情況,Google都替他們考慮過。當(dāng)輸入關(guān)鍵字搜索時,它不僅會去搜索包含關(guān)鍵字的網(wǎng)頁,同時還會搜索和這些網(wǎng)頁高相關(guān)性的網(wǎng)頁。因為Google具有鏈接分析的功能,即根據(jù)網(wǎng)頁間彼此的連接關(guān)系,把一篇網(wǎng)頁被連接數(shù)目的多寡視為相關(guān)性的一項指標,并根據(jù)相關(guān)性的排列出次序,以確定謬論網(wǎng)頁的質(zhì)量或重要度。;
4.在查詢時,Google能夠通過提供多個關(guān)鍵字,將只提供包含所有關(guān)鍵字的網(wǎng)頁,其正文或指向它的鏈接包含所輸入的所有關(guān)鍵字。而且,Google還能遵從關(guān)鍵字的相對位置,對網(wǎng)頁關(guān)鍵詞接近度度進行分析,按照關(guān)鍵字的接近度區(qū)分搜索結(jié)果的優(yōu)先秩序。在顯示的結(jié)果中,只摘錄包含查詢字串的內(nèi)容作為網(wǎng)頁簡介,查詢字串高亮顯示。
5.Google是目前收集亞洲網(wǎng)站最多的搜索引擎之一,對中文的支持性強,相對于許多國內(nèi)研發(fā)的中文搜索引擎,Google不但大大提升了中文搜索引擎的相關(guān)性,還更好地 檢索字串與網(wǎng)頁中文字的語義上的匹配,從而提高了檢索效率。例如,它支持中英文混合檢索詞查詢,比如“甲A”,“F1一級方程式”等;它支持多種編碼,比如“朱镕基”的“镕”不在GB2312字符集中,但存在于GBK編碼中,許多傳統(tǒng)搜索引擎由于不支持GBK,便無法查到有關(guān)“朱镕基”的網(wǎng)頁,而Google則可以直接找到;此外,對于所輸入的中文關(guān)鍵字,Google不僅會去搜索中文簡體網(wǎng)站,還會找出相應(yīng)的中文繁體網(wǎng)站,甚至是日文網(wǎng)站。
6.Google的“手氣不錯”、“網(wǎng)頁快照”和“類似網(wǎng)頁”等功能。Google和一家名為Realnames(簡稱RN)的網(wǎng)絡(luò)關(guān)鍵字管理公司有合作關(guān)系,其網(wǎng)絡(luò)新名詞是指可以鏈接到網(wǎng)站的商標、產(chǎn)品、服務(wù)或者公司名稱,在網(wǎng)絡(luò)中起注冊商標的作用。當(dāng)關(guān)鍵詞與Google推薦的網(wǎng)站匹配時,在搜索結(jié)果中就會顯示“RN”標記。例如,查詢的目地是想進入一個特定的網(wǎng)站(如公司網(wǎng)站),只知道名稱和該網(wǎng)站的有關(guān)的一些局部信息(如該公司的產(chǎn)品等),這時,可通過的關(guān)鍵字來試試“手氣不錯”。
“網(wǎng)頁快照”是指Google保存應(yīng)急網(wǎng)頁內(nèi)容。它的作用是:當(dāng)所要檢索的網(wǎng)頁在實際上可能已經(jīng)過時或者已經(jīng)不存在了,而由于搜索引擎的更新需要一定的時間,無法跟得上那些更新快的網(wǎng)站,或是有時碰到網(wǎng)頁服務(wù)器的暫時中斷而找不到服務(wù)器,這時快照內(nèi)容便可暫解燃眉之急。此外,其速度也比常規(guī)鏈接快,但信息可能不是最新的。
到目前為止,Google依然存在以下一些令人遺憾的地方。其數(shù)據(jù)的更新速度無法進一步提高,由于數(shù)據(jù)量的龐大,使Google搜索引擎的數(shù)據(jù)庫更新無法早于30天,在一定程度上影響對信息的時效需求,目前這一瓶頸還無法突破。無法搜索動態(tài)生成的網(wǎng)頁,因為大多數(shù)負責(zé)搜索網(wǎng)頁的蜘蛛軟件都不敢去碰動態(tài)網(wǎng)頁,怕被變化無窮的動態(tài)系統(tǒng)黑洞吸進去出不來。Google這方面的研究雖然取得一些,但離真正的實用還有一段路要走。
4 結(jié)束語
源于信息教育的研究在我國才剛起步,對信息素質(zhì)教育的整體認識和理論上的準備還有待深化。由于對信息素質(zhì)概念缺乏全面認識,導(dǎo)致相關(guān)實踐中的偏頗,如引言中所述,高校中的“文獻檢索與利用”一課是我國信息教育的主要形式,盡管近年來已有研究人員對大學(xué)新形勢下“文獻檢索課”的名稱和內(nèi)容提出了質(zhì)疑和改革建議,但只是在原有教育內(nèi)容上增加機檢和網(wǎng)絡(luò)信息檢索極少部分的內(nèi)容,甚至一些信息檢索課還保存已在高校圖書館中淘汰的手工檢索式陳舊方法的教學(xué)內(nèi)容,整體上仍局限于在對圖書館信息資源利用的角度,所以,相關(guān)的教育實踐也停留在培養(yǎng)“圖書館素質(zhì)”(Library Literacy)和書目指導(dǎo)(Bibliographic Instruction)等階段,尚未進入到真正意義的信息素質(zhì)教育活動,希望被廣泛應(yīng)用的搜索能力極強的Google,有利于大學(xué)生讀者建立“個人信息基礎(chǔ)架構(gòu)(Personal Intormation Infaastructure)。
參考文獻
[1]賀志則 李修波,現(xiàn)代化檢索信息檢索[M].山東科學(xué)技術(shù)出版社 2003年: 183-185
[2]符紹宏等,信息檢索[M]北京:高等教育出版社,2004年:405-407
[3]范并思,二十世紀西方與中國的圖書館學(xué)[M]北京:北京圖書館出版社,2004年:5-7
[4]馬丁,信息化社會漫話[M]上海:科學(xué)技術(shù)出版社,1985年:73-75
作者簡介
鄭祖芬(1975-),女,廣西桂林人,研究生畢業(yè),桂林電子科技大學(xué)圖書館工作,主要從事圖書館學(xué)研究。