李凌莉
(淮安自然資源和規(guī)劃局,江蘇 淮安 223005)
在大數(shù)據(jù)時代,網(wǎng)絡(luò)中存有的情報信息浩如煙海,令人無所適從,為了提高用戶在互聯(lián)網(wǎng)上查找情報信息的效率,可以積極借助搜索引擎技術(shù)的幫助,通過使用關(guān)鍵詞、高級語法等檢索方式,快速檢索相關(guān)度情報信息資料。
在互聯(lián)網(wǎng)中,如果用戶沒有明確的檢索意圖的情況下要獲取相關(guān)情報信息資料,建議使用全文搜索引擎。全文搜索引擎是利用爬蟲程序抓取互聯(lián)網(wǎng)上所有信息條目和相關(guān)文章予以索引的搜索方式,相對來說使用起來最為簡捷,方便,實際應(yīng)用難度低,普通用戶的使用率較高,用戶體驗感較強,可以快速查找并獲得自己需要查找的相關(guān)信息。但是實際檢索出來的信息非常多,過于龐雜,無法與用戶的精確需求相匹配,需要用戶自己結(jié)自身對情報信息資料的需求進行二次篩選,逐一甄別。所有搜索引擎中都具有全文搜索引擎的特征。
目錄搜索引擎相對于全文搜索引擎來說,目錄搜索引擎對于用戶檢索信息的要求更高,要求用戶在減速時,需要按照目錄進行檢索。如果沒有完整的目錄,使用分類目錄也能得到用戶想要得到的情報信息。目錄搜索引擎的工作原理是指在對應(yīng)網(wǎng)站內(nèi)將所有已經(jīng)檢索出來的情報信息加以分析和整合,最終以目錄的方式將情報信息以目錄的形式呈現(xiàn)給用戶,相對來說目錄搜索引擎需要互聯(lián)網(wǎng)公司提供大量的人力和資金的支持來維護服務(wù)器,以保證為用戶提供更加優(yōu)質(zhì)的查詢服務(wù)體驗。目前來說,最具代表性的目錄搜索引擎有國內(nèi)的Soho、Sina、Yahoo等搜索引擎,總體來說目錄索引最大的優(yōu)點是情報信息查詢的準確率高,查全率低,為用戶提供的情報信息檢索范圍較小。
元搜索引擎是一種可以調(diào)用其他獨立搜索引擎的引擎,亦稱“搜索引擎之母”、“源搜索引擎”。元搜索引擎主要是對多個獨立搜索引擎的整合、調(diào)用、控制和優(yōu)化利用。即當用戶在元搜索引擎輸入一個關(guān)鍵詞,元搜索就會將關(guān)鍵詞的搜索請求發(fā)送至多個其他搜索引擎,通過電子信息技術(shù)內(nèi)不同的數(shù)據(jù)計算方式,和相關(guān)算法對這些關(guān)鍵詞搜索的搜索引擎返回的情報信息資料加以收集、整合、根據(jù)與用戶需求信息匹配程度加以排序,最終呈現(xiàn)給用戶。元搜索引擎包括Webcrawler、Dogpile、All4one等 可 以 同 時 調(diào) 用Google、Yahoo、Ask Jeeves About、LookSmart、TeomaOverture、等搜索引擎。元搜索引擎還具有以下特點,可以根據(jù)用戶檢索需求,像網(wǎng)頁名稱、URL、文摘等相關(guān)內(nèi)容向用戶提供詳盡全面的情報信息資料;同時,強大的元搜索引擎支持世界中多種國家語言檢索,像中文搜索、英文搜索、俄語搜索、日語搜索等??梢詫Ω鱾€所搜引擎搜索的情報信息資料結(jié)果自動分類;針對不同用戶提供個性化服務(wù)等特點,使用功能非常強大。
垂直搜索引擎相對于全文搜索引擎來說,需要用戶提供在某一個行業(yè)內(nèi)更加具體的需求進行情報信息資料搜索,對某一專業(yè)領(lǐng)域相關(guān)信息的拓展和延伸,主要應(yīng)用在用戶購買火車票、機票、查詢視頻、音頻等,能夠為用戶提供更加精準的搜索體驗。垂直搜索引擎具有上手操作快,操作方式簡單,兼容性強,可以適用于多種瀏覽器的瀏覽模式等優(yōu)點,深受用戶的喜愛。
在情報信息資料收集的過程中,利用搜索引擎進行情報信息搜索情報信息時,情報信息資料收集工作人員應(yīng)結(jié)合自身想要查找的情報信息資料具體內(nèi)容,選擇合適的搜索引擎,結(jié)合搜尋引擎的特征,選擇合適的方式進行搜索。目前來說互聯(lián)網(wǎng)上有非常多。就目前而言,互聯(lián)網(wǎng)上有非常多種的搜索引擎。搜索引擎都有自己的搜索信息的獨特方式和特征,為了提高情報信息工作人員情報信息搜索效率,應(yīng)選擇合適的搜索引擎。比如如果情報信息資料搜集工作人員擁有明確的檢索信息,那么可以使用Yahoo、Google等搜索引擎;如果情報信息資料搜集工作人員沒有明確的檢索信息,那么可以使用百度、Soho等搜索引擎。
在互聯(lián)網(wǎng)中進行情報信息資料收集工作時,情報信息資料收集工作人員可以積極利用電子信息技術(shù)中網(wǎng)絡(luò)數(shù)據(jù)庫查找相應(yīng)的情報信息資料。數(shù)據(jù)庫顧名思義,就是將互聯(lián)網(wǎng)中海量、沒有信息資源管理組織的數(shù)據(jù)資源加以分析、整合和儲存在網(wǎng)絡(luò)數(shù)據(jù)庫中。網(wǎng)絡(luò)數(shù)據(jù)庫主要具有以下三個方面的特征:數(shù)據(jù)庫中所有的數(shù)據(jù)資源,可以實現(xiàn)資源共享,只要有網(wǎng)絡(luò)的地方就可以將數(shù)據(jù)庫中的資源上傳和下載;積極利用互聯(lián)網(wǎng)的優(yōu)勢,采取C/S方式,縮減系統(tǒng)使用成本,提高了信息資源的利用率;在數(shù)據(jù)庫中可以根據(jù)檢索信大批量地處理情報信息資料,提高情報信息資料收集效率。由此情報信息資料收集工作人員可以利用電子信息技術(shù)以及網(wǎng)絡(luò)數(shù)據(jù)庫的特征查找和收集情報信息資料。
很多時候在情報信息資料工作人員查找情報信息資料時,都是從相關(guān)書籍上進行查找,能夠最大限度保障情報信息資料的準確性和嚴謹性。因此,為了提高情報信息資料的準確性,提高情報信息資料查找效率,情報信息資料工作人員可以在借助電子信息技術(shù),建立和使用當?shù)氐臄?shù)字圖書館,在圖書館中通過翻閱相關(guān)文獻查找相關(guān)資料。在數(shù)字圖書館中主要是針對當?shù)氐臍v史文化、當?shù)貙嶋H社會發(fā)展情況、以及民俗風情,地區(qū)特色等相關(guān)書籍進行儲存。內(nèi)涵豐富的文獻資源,情報信息資料收集工作人員可以適量在數(shù)字圖書館中翻閱相關(guān)書籍,使得自己查找的情報信息更具專業(yè)性。
隨著社會經(jīng)濟不斷發(fā)展,互聯(lián)網(wǎng)水平不斷提高,互聯(lián)網(wǎng)中各個搜索引擎中有上千萬條信息資源,涉及日常生活中的各個行業(yè),根據(jù)行業(yè)發(fā)展水平相關(guān)信息也在不斷發(fā)生排位的變化。情報信息資料收集工作人員在對相關(guān)情報信息資料進行檢索和收集時,可以適量的找到專業(yè)行業(yè)網(wǎng)站,在網(wǎng)站上對相關(guān)專業(yè)的行業(yè)動態(tài),市場行情,行業(yè)政策法規(guī)等信息進行整理、分析和匯總。比如情報信息資料收集工作人員在收集、整理無人機相關(guān)信息時,可以到大疆無人機官網(wǎng)上信息查詢相關(guān)情報信息資料,詳細了解大江品牌無人機的特點和特性、各項參數(shù),然后再與其他品牌的無人機特性和參數(shù)進行對比,了解我國無人機行業(yè)具體發(fā)展形勢,作出相關(guān)報告。通過在專業(yè)科技類情報網(wǎng)站中收集情報資料能夠快速準確的查找到相關(guān)專業(yè)信息,提高情報信息的精準度和查詢效率。
在現(xiàn)代社會中,隨著信息技術(shù)不斷發(fā)展,每天最不缺乏的就是社會熱點,社會熱點之所以被稱為時社會熱點,主要就是因為這件事情時廣大群眾都關(guān)注的事情,比如最近非?;鸨纳鐣狳c話題新聞“新冠疫情疫苗研發(fā)成功之際,中小學開學了”等多條新聞,極大的振奮廣大群眾,學校開學意味著我國新冠疫情防控已經(jīng)取得階段性成功,極大提高廣大群眾對政府工作成效的認可,提高對國家的信任和全民凝聚力。在類似這樣的熱點話題中情報信息資料收集工作人員可以查找關(guān)鍵人物的信息和事跡,收集關(guān)鍵人物的言論等信息凝練出背后蘊含的深刻含義,或者通過多種渠道方式如QQ、微信、微博、豆瓣、知乎等平臺上紛雜的熱點信息中心,摘取網(wǎng)民的觀點,通過電子信息技術(shù)對其加以分析,比如熱評數(shù)量,轉(zhuǎn)發(fā)數(shù)量,在看人數(shù)推論話題背后其他蘊含的信息,加以拓展和延伸。
綜上所述,通過對互聯(lián)網(wǎng)中各個類型搜索引擎使用方式和特點進行分析,情報信息資料收集工作人員應(yīng)結(jié)合自身想要查詢的信息資料內(nèi)容以及自己對情報信息掌握情況,結(jié)合電子信息技術(shù)選擇合適的搜索引擎查找相關(guān)情報信息,提高情報信息收集效率,提高情報信息精確度。同時情報信息資料收集工作人員可以充分利用電子信息技術(shù)中網(wǎng)絡(luò)數(shù)據(jù)庫,數(shù)字圖書館,以及專業(yè)科技類情報網(wǎng)站和社會熱點進行情報信息檢索,積極利用信息技術(shù)推動情報學不斷發(fā)展。