情報學(xué)基本原理在其智能化處理機制中的運用

2015-02-10 11:35王瑋

科技視界 2015年20期

王瑋

（沈陽市科學(xué)技術(shù)情報研究所，遼寧沈陽110003）

0 引言

信息技術(shù)的快速崛起促進了情報處理系統(tǒng)的大踏步發(fā)展，互聯(lián)網(wǎng)的應(yīng)用更是使情報收集、檢索和分析面臨著前所未有的海量信息處理壓力。因此情報的智能化處理需求變得越來越迫切，同時情報的智能處理也能為決策部門提供更加科學(xué)、客觀的依據(jù)。然而，在大數(shù)據(jù)時代，信息的海量性、異構(gòu)性和無序性使得情報的即時獲取、智能解析和準(zhǔn)確評價等方面都存在著許多困難。

另一方面，情報學(xué)作為一門新興學(xué)科，與其他學(xué)科一樣具有一些帶有普遍意義的、基礎(chǔ)性的思想和原則，這些思想和原則主導(dǎo)著情報學(xué)的發(fā)展，我們稱其為情報學(xué)的基本原理。無論時代怎么發(fā)展，技術(shù)怎樣創(chuàng)新，這些基本原理作為獨立的理論或規(guī)律在情報學(xué)中的作用和地位是不會改變的。

由此可以得出，情報的智能化處理機制和系統(tǒng)的建立，一定要基于情報學(xué)的基本原理，否則將使情報工作陷于紛繁復(fù)雜的泥淖之中不能自拔。情報應(yīng)該是對關(guān)注對象所處環(huán)境與狀態(tài)的全面監(jiān)測過程，即通過廣泛搜集相關(guān)的大量信息，經(jīng)過篩選、提煉和綜合分析，對關(guān)注對象進行綜合評定，進而提出相應(yīng)對策的過程。這是一個計算機高效處理性能與情報分析人員判斷相結(jié)合的智能系統(tǒng)，從智能處理的系統(tǒng)性和情報學(xué)的基本原理出發(fā)，可以將智能情報處理系統(tǒng)分為信息/數(shù)據(jù)層、邏輯業(yè)務(wù)層和功能層三個層次，而情報學(xué)的基本原理在這三個層次中都有不同程度的運用和體現(xiàn)。

1 基于離散分布原理選擇信息源

信息/數(shù)據(jù)層，是將分布在世界各地的感興趣的信息資源采集下來并進行初步處理，形成網(wǎng)絡(luò)信息資源庫，進一步按照所屬領(lǐng)域構(gòu)建相關(guān)的知識庫。這項工作是情報智能化處理機制的基礎(chǔ)部分，工作量巨大，且時效性很強，因此可交由計算機按照事先設(shè)定好的程序自動檢索完成。其檢索程序的設(shè)計應(yīng)遵循情報的離散分布原理。

信息、知識和情報是以離散形式分布的，在離散的基礎(chǔ)上趨于集中。情報的離散分布現(xiàn)象是全部情報活動的基石，因此對情報分散規(guī)律的研究不僅有助于信息資源庫和知識庫的建立，也將對情報學(xué)的發(fā)展起到奠基性的作用。迄今為止對情報離散分布現(xiàn)象研究最富盛名的成果是布拉福德（Bradford）定律，它與描述科學(xué)生產(chǎn)率分布的洛特卡（Lotka）定律，詞頻分布的齊夫（Zipf）定律，文獻增長老化的指數(shù)定律具有共同的淵源和機理。布拉德定律在研究中創(chuàng)造了頻次-等級排序法：按某一具體事項（如標(biāo)題、作者、關(guān)鍵詞等）在其主體來源（如期刊、作者集合等）中出現(xiàn)的頻次按遞減順序排列，就會導(dǎo)出布拉德福分布，其特點在于所考察的具體對象大多數(shù)都集中于少數(shù)主體來源[1]。例如，某一主題的科學(xué)論文約三分之二集中在少數(shù)期刊上。導(dǎo)致這種結(jié)果的主要原因是，作者在寫文章或發(fā)表文章時，總是希望選擇常用的、傳遞功能強的詞匯和期刊。這種現(xiàn)象實際上是情報離散分布基礎(chǔ)上形成的核心趨勢，是成功經(jīng)驗積累的結(jié)果，也是“馬太效應(yīng)”的表現(xiàn)形式。

因此，在運用計算機自動檢索技術(shù)搜集情報過程中，應(yīng)充分考慮情報的這一基本原理，首先選擇相關(guān)領(lǐng)域的權(quán)威期刊或網(wǎng)站，這些期刊或網(wǎng)站往往集中了大量的有價值的知識和情報。以這些期刊或網(wǎng)站作為相關(guān)領(lǐng)域情報的主要來源，不僅能提高情報檢索的效率，而且能保證所搜集情報的質(zhì)量。

2 利用有序性原理對情報進行“深加工”

搜集到信息資源庫或知識庫里的“情報”，準(zhǔn)確的說還不能稱之為情報，只能稱其為有價值的但未經(jīng)處理的信息。按照情報智能化處理機制的要求，接下來在信息資源庫和知識庫的支持下，計算機將完成信息的邏輯計算，包括對相關(guān)信息的進一步分/聚類、信息的訪問與傳遞、信息的業(yè)務(wù)管理，以及為情報分析人員提供交互工具、評估工具、建模環(huán)境等，這部分工作在情報智能化處理機制中稱之為邏輯業(yè)務(wù)層，由計算機和情報分析人員共同完成，其工作的機理同樣需要遵循情報學(xué)的基本原理——有序性。

情報結(jié)構(gòu)無論是以自然系統(tǒng)存在還是以人工系統(tǒng)存在，都具有某種“序性”。研究和揭示這種“序性”是設(shè)計最優(yōu)情報系統(tǒng)的基礎(chǔ)。情報的有序性結(jié)構(gòu)既來自情報創(chuàng)造過程的機理，也來自知識體系自身的組織功能。在知識體系結(jié)構(gòu)中具有不同的功能，但都會通過知識的自組織而形成有序性結(jié)構(gòu)。20世紀(jì)70年代中期，布魯克斯曾提出描述情報作用的基本方程式：

式中K[S]為原有的知識結(jié)構(gòu)，K[S+ΔS]為吸收情報以后的知識結(jié)構(gòu)，ΔI為增加的情報。這個方程式說明新的知識結(jié)構(gòu)形成是由于吸收情報的結(jié)果。30多年來這個以偽數(shù)學(xué)形式表達的簡單方程式引起了人們廣泛的興趣和關(guān)注，認(rèn)為它對描述情報的概念和作用是最基本的。

情報不僅僅是簡單的邏輯計算，更重要的是情報分析人員對信息的解讀和加工。這種對情報的“深加工”是以新知識結(jié)構(gòu)的產(chǎn)生為目的，是以人為中心的信息處理過程。因此情報智能處理系統(tǒng)的設(shè)計應(yīng)利用情報的有序性原理，模擬情報人員工作時的動態(tài)思維過程，綜合人的認(rèn)知判斷能力與計算機的邏輯運算能力。這不僅需要通常意義上的算法、建模與仿真，更重要的是啟發(fā)人們對新知識結(jié)構(gòu)的認(rèn)知，為進一步的科學(xué)決策提供有價值的和有競爭力的情報服務(wù)。

3 面向?qū)嶋H應(yīng)用提供多功能情報服務(wù)

情報最突出的特點就是“智慧”，它不是簡單的數(shù)據(jù)堆積，也不是簡單的信息加工，而是要注入許多創(chuàng)造性的智力勞動，從反映客觀事物的信息中，通過識別、分析、評價，最終形成新的增值情報產(chǎn)品，并服務(wù)于科學(xué)決策[2]。因此，智能情報處理機制必須要面向?qū)嶋H應(yīng)用，為用戶提供如標(biāo)準(zhǔn)事件、可能性事件、突發(fā)事件等多種應(yīng)對方案，以及決策性咨詢服務(wù)等。

在此過程中應(yīng)體現(xiàn)出情報的準(zhǔn)確性、預(yù)見性和易用性原理。隨著獲取信息渠道的不斷拓寬以及信息智能處理技術(shù)的研發(fā)，情報服務(wù)也從最初的“比多比全”發(fā)展為現(xiàn)代的“比精比準(zhǔn)”[3]。情報的準(zhǔn)確性，不僅指情況的真實、數(shù)據(jù)的準(zhǔn)確，更重要的是分析判斷的準(zhǔn)確。這種提前的判斷體現(xiàn)了情報的預(yù)見性。情報是為計劃、決策提供依據(jù)的，是為將要實施的行動服務(wù)。因此，情報的準(zhǔn)確性和預(yù)見性，是情報服務(wù)的最高價值體現(xiàn)。

此外，在提供情報服務(wù)過程中，還應(yīng)充分考慮其易用性的原理。人類交流、獲取和利用信息、知識、情報，總是趨向簡捷、方便、易用和省力。穆爾斯定律指出，一個情報檢索系統(tǒng)，如果用戶從它取得情報比不取得情報更傷腦筋和麻煩的話，這個系統(tǒng)就不會得到利用。因此，智能情報處理機制一定是從用戶的角度出發(fā)，建立在易于存取、易于利用的基礎(chǔ)之上的，甚至在某些情況下用戶對于情報的易用性比情報本身的要求都高。

4 結(jié)束語

綜上所述，智能情報處理機制應(yīng)該是以情報學(xué)基本原理為基礎(chǔ)建立和發(fā)展的，網(wǎng)絡(luò)信息技術(shù)為智能情報服務(wù)系統(tǒng)的開發(fā)提供了實踐的土壤。相信在不遠(yuǎn)的未來，以情報學(xué)基本原理為基礎(chǔ)、以用戶實際需求為導(dǎo)向的智能情報服務(wù)系統(tǒng)必將得到長足的發(fā)展和廣泛的應(yīng)用。

［1］馬費成.論情報學(xué)的基本原理及理論體系構(gòu)建[J].情報學(xué)報,2007（1）.

［2］呂志堅,王冠宇,崔霞.網(wǎng)絡(luò)環(huán)境下情報智能處理機制研究[C]//北京科學(xué)技術(shù)情報學(xué)會年會.,2009,12.