王瑋
(沈陽市科學(xué)技術(shù)情報研究所,遼寧 沈陽110003)
信息技術(shù)的快速崛起促進了情報處理系統(tǒng)的大踏步發(fā)展,互聯(lián)網(wǎng)的應(yīng)用更是使情報收集、檢索和分析面臨著前所未有的海量信息處理壓力。因此情報的智能化處理需求變得越來越迫切,同時情報的智能處理也能為決策部門提供更加科學(xué)、客觀的依據(jù)。然而,在大數(shù)據(jù)時代,信息的海量性、異構(gòu)性和無序性使得情報的即時獲取、智能解析和準(zhǔn)確評價等方面都存在著許多困難。
另一方面,情報學(xué)作為一門新興學(xué)科,與其他學(xué)科一樣具有一些帶有普遍意義的、基礎(chǔ)性的思想和原則,這些思想和原則主導(dǎo)著情報學(xué)的發(fā)展,我們稱其為情報學(xué)的基本原理。無論時代怎么發(fā)展,技術(shù)怎樣創(chuàng)新,這些基本原理作為獨立的理論或規(guī)律在情報學(xué)中的作用和地位是不會改變的。
由此可以得出,情報的智能化處理機制和系統(tǒng)的建立,一定要基于情報學(xué)的基本原理,否則將使情報工作陷于紛繁復(fù)雜的泥淖之中不能自拔。情報應(yīng)該是對關(guān)注對象所處環(huán)境與狀態(tài)的全面監(jiān)測過程,即通過廣泛搜集相關(guān)的大量信息,經(jīng)過篩選、提煉和綜合分析,對關(guān)注對象進行綜合評定,進而提出相應(yīng)對策的過程。這是一個計算機高效處理性能與情報分析人員判斷相結(jié)合的智能系統(tǒng),從智能處理的系統(tǒng)性和情報學(xué)的基本原理出發(fā),可以將智能情報處理系統(tǒng)分為信息/數(shù)據(jù)層、邏輯業(yè)務(wù)層和功能層三個層次,而情報學(xué)的基本原理在這三個層次中都有不同程度的運用和體現(xiàn)。
信息/數(shù)據(jù)層,是將分布在世界各地的感興趣的信息資源采集下來并進行初步處理,形成網(wǎng)絡(luò)信息資源庫,進一步按照所屬領(lǐng)域構(gòu)建相關(guān)的知識庫。這項工作是情報智能化處理機制的基礎(chǔ)部分,工作量巨大,且時效性很強,因此可交由計算機按照事先設(shè)定好的程序自動檢索完成。其檢索程序的設(shè)計應(yīng)遵循情報的離散分布原理。
信息、知識和情報是以離散形式分布的,在離散的基礎(chǔ)上趨于集中。情報的離散分布現(xiàn)象是全部情報活動的基石,因此對情報分散規(guī)律的研究不僅有助于信息資源庫和知識庫的建立,也將對情報學(xué)的發(fā)展起到奠基性的作用。迄今為止對情報離散分布現(xiàn)象研究最富盛名的成果是布拉福德(Bradford)定律,它與描述科學(xué)生產(chǎn)率分布的洛特卡(Lotka)定律,詞頻分布的齊夫(Zipf)定律,文獻增長老化的指數(shù)定律具有共同的淵源和機理。布拉德定律在研究中創(chuàng)造了頻次-等級排序法:按某一具體事項(如標(biāo)題、作者、關(guān)鍵詞等)在其主體來源(如期刊、作者集合等)中出現(xiàn)的頻次按遞減順序排列,就會導(dǎo)出布拉德福分布,其特點在于所考察的具體對象大多數(shù)都集中于少數(shù)主體來源[1]。例如,某一主題的科學(xué)論文約三分之二集中在少數(shù)期刊上。導(dǎo)致這種結(jié)果的主要原因是,作者在寫文章或發(fā)表文章時,總是希望選擇常用的、傳遞功能強的詞匯和期刊。這種現(xiàn)象實際上是情報離散分布基礎(chǔ)上形成的核心趨勢,是成功經(jīng)驗積累的結(jié)果,也是“馬太效應(yīng)”的表現(xiàn)形式。
因此,在運用計算機自動檢索技術(shù)搜集情報過程中,應(yīng)充分考慮情報的這一基本原理,首先選擇相關(guān)領(lǐng)域的權(quán)威期刊或網(wǎng)站,這些期刊或網(wǎng)站往往集中了大量的有價值的知識和情報。以這些期刊或網(wǎng)站作為相關(guān)領(lǐng)域情報的主要來源,不僅能提高情報檢索的效率,而且能保證所搜集情報的質(zhì)量。
搜集到信息資源庫或知識庫里的“情報”,準(zhǔn)確的說還不能稱之為情報,只能稱其為有價值的但未經(jīng)處理的信息。按照情報智能化處理機制的要求,接下來在信息資源庫和知識庫的支持下,計算機將完成信息的邏輯計算,包括對相關(guān)信息的進一步分/聚類、信息的訪問與傳遞、信息的業(yè)務(wù)管理,以及為情報分析人員提供交互工具、評估工具、建模環(huán)境等,這部分工作在情報智能化處理機制中稱之為邏輯業(yè)務(wù)層,由計算機和情報分析人員共同完成,其工作的機理同樣需要遵循情報學(xué)的基本原理——有序性。
情報結(jié)構(gòu)無論是以自然系統(tǒng)存在還是以人工系統(tǒng)存在,都具有某種“序性”。研究和揭示這種“序性”是設(shè)計最優(yōu)情報系統(tǒng)的基礎(chǔ)。情報的有序性結(jié)構(gòu)既來自情報創(chuàng)造過程的機理,也來自知識體系自身的組織功能。在知識體系結(jié)構(gòu)中具有不同的功能,但都會通過知識的自組織而形成有序性結(jié)構(gòu)。20世紀(jì)70年代中期,布魯克斯曾提出描述情報作用的基本方程式:
式中K[S]為原有的知識結(jié)構(gòu),K[S+ΔS]為吸收情報以后的知識結(jié)構(gòu),ΔI為增加的情報。這個方程式說明新的知識結(jié)構(gòu)形成是由于吸收情報的結(jié)果。30多年來這個以偽數(shù)學(xué)形式表達的簡單方程式引起了人們廣泛的興趣和關(guān)注,認(rèn)為它對描述情報的概念和作用是最基本的。
情報不僅僅是簡單的邏輯計算,更重要的是情報分析人員對信息的解讀和加工。這種對情報的“深加工”是以新知識結(jié)構(gòu)的產(chǎn)生為目的,是以人為中心的信息處理過程。因此情報智能處理系統(tǒng)的設(shè)計應(yīng)利用情報的有序性原理,模擬情報人員工作時的動態(tài)思維過程,綜合人的認(rèn)知判斷能力與計算機的邏輯運算能力。這不僅需要通常意義上的算法、建模與仿真,更重要的是啟發(fā)人們對新知識結(jié)構(gòu)的認(rèn)知,為進一步的科學(xué)決策提供有價值的和有競爭力的情報服務(wù)。
情報最突出的特點就是“智慧”,它不是簡單的數(shù)據(jù)堆積,也不是簡單的信息加工,而是要注入許多創(chuàng)造性的智力勞動,從反映客觀事物的信息中,通過識別、分析、評價,最終形成新的增值情報產(chǎn)品,并服務(wù)于科學(xué)決策[2]。因此,智能情報處理機制必須要面向?qū)嶋H應(yīng)用,為用戶提供如標(biāo)準(zhǔn)事件、可能性事件、突發(fā)事件等多種應(yīng)對方案,以及決策性咨詢服務(wù)等。
在此過程中應(yīng)體現(xiàn)出情報的準(zhǔn)確性、預(yù)見性和易用性原理。隨著獲取信息渠道的不斷拓寬以及信息智能處理技術(shù)的研發(fā),情報服務(wù)也從最初的“比多比全”發(fā)展為現(xiàn)代的“比精比準(zhǔn)”[3]。情報的準(zhǔn)確性,不僅指情況的真實、數(shù)據(jù)的準(zhǔn)確,更重要的是分析判斷的準(zhǔn)確。這種提前的判斷體現(xiàn)了情報的預(yù)見性。情報是為計劃、決策提供依據(jù)的,是為將要實施的行動服務(wù)。因此,情報的準(zhǔn)確性和預(yù)見性,是情報服務(wù)的最高價值體現(xiàn)。
此外,在提供情報服務(wù)過程中,還應(yīng)充分考慮其易用性的原理。人類交流、獲取和利用信息、知識、情報,總是趨向簡捷、方便、易用和省力。穆爾斯定律指出,一個情報檢索系統(tǒng),如果用戶從它取得情報比不取得情報更傷腦筋和麻煩的話,這個系統(tǒng)就不會得到利用。因此,智能情報處理機制一定是從用戶的角度出發(fā),建立在易于存取、易于利用的基礎(chǔ)之上的,甚至在某些情況下用戶對于情報的易用性比情報本身的要求都高。
綜上所述,智能情報處理機制應(yīng)該是以情報學(xué)基本原理為基礎(chǔ)建立和發(fā)展的,網(wǎng)絡(luò)信息技術(shù)為智能情報服務(wù)系統(tǒng)的開發(fā)提供了實踐的土壤。相信在不遠(yuǎn)的未來,以情報學(xué)基本原理為基礎(chǔ)、以用戶實際需求為導(dǎo)向的智能情報服務(wù)系統(tǒng)必將得到長足的發(fā)展和廣泛的應(yīng)用。
[1]馬費成.論情報學(xué)的基本原理及理論體系構(gòu)建[J].情報學(xué)報,2007(1).
[2]呂志堅,王冠宇,崔霞.網(wǎng)絡(luò)環(huán)境下情報智能處理機制研究[C]//北京科學(xué)技術(shù)情報學(xué)會年會.,2009,12.
[3]陳佳.網(wǎng)絡(luò)信息智能處理技術(shù)在企業(yè)競爭情報系統(tǒng)的應(yīng)用[C]//第十八屆全國計算機信息管理學(xué)術(shù)研討會論文集.2004,10.