我們正處在一個(gè)知識(shí)爆炸的時(shí)代。應(yīng)當(dāng)看到,面對(duì)知識(shí)爆炸時(shí)代的到來,一場(chǎng)學(xué)習(xí)方式的革命正在悄然興起。其中按知識(shí)點(diǎn)進(jìn)行檢索和閱讀,就是近年來出現(xiàn)的一種新的閱讀方式。越來越多的人們正在超越“一字一句”“一本一篇”的閱讀方式的局限,習(xí)慣于通過計(jì)算機(jī)網(wǎng)絡(luò)查詢,按知識(shí)點(diǎn)進(jìn)行閱讀。作為以傳播圖書為主要內(nèi)容的出版業(yè)網(wǎng)站,必須把握好這一閱讀方式發(fā)展的大趨勢(shì)。
知識(shí)點(diǎn)閱讀是時(shí)代發(fā)展的必然趨勢(shì)
自古以來,人類隨著知識(shí)資源積累的增多,十分重視開發(fā)文獻(xiàn)的檢索閱讀功能。檢索是對(duì)文獻(xiàn)內(nèi)容進(jìn)行挖掘和發(fā)現(xiàn)的一種重要手段。文獻(xiàn)內(nèi)容的檢索深度,向來是由一定物質(zhì)技術(shù)條件下的檢索方式所決定的。據(jù)考證,有史以來,按照對(duì)文獻(xiàn)內(nèi)容檢索發(fā)現(xiàn)的深度不同,先后形成了三種不同形態(tài)的檢索閱讀方式。
第一種形態(tài):分類檢索。也就是按知識(shí)類型對(duì)文獻(xiàn)進(jìn)行檢索閱讀。我國古代隨著甲骨文、石刻文、竹簡(jiǎn)文等文字的產(chǎn)生,就產(chǎn)生了文獻(xiàn)分類檢索方法。這種方法雖然能夠揭示每本文獻(xiàn)的知識(shí)屬性,幫助人們找到某一本文獻(xiàn)的所在位置,但它無法更多地揭示文獻(xiàn)的語義內(nèi)容,用戶無法實(shí)現(xiàn)對(duì)文獻(xiàn)中語義內(nèi)容的檢索。
第二種形態(tài):主題檢索。也就是按主題思想對(duì)文獻(xiàn)內(nèi)容進(jìn)行檢索閱讀。主題檢索伴隨著造紙和印刷術(shù)的發(fā)明而產(chǎn)生。造紙和印刷術(shù)發(fā)明之后,由于人類處理和使用文字信息的效率大大提高,從而帶來文獻(xiàn)題目和目錄的演變,人們?cè)絹碓蕉嗟赜靡痪湓捝踔翈拙湓捵鳛槲墨I(xiàn)的題目和目錄。這種主題檢索的方法,在揭示文獻(xiàn)內(nèi)容的深度上大大超過了分類檢索。
第三種形態(tài):知識(shí)點(diǎn)檢索。也就是按知識(shí)點(diǎn)對(duì)文獻(xiàn)內(nèi)容進(jìn)行檢索閱讀。以往人們采用傳統(tǒng)的檢索方式,通常只能檢索發(fā)現(xiàn)以“本冊(cè)”“章節(jié)”為單位存在的知識(shí),而難以檢索發(fā)現(xiàn)以“字”“詞”“句”等為單位存在的知識(shí)點(diǎn)。也就是,目錄樹狀結(jié)構(gòu)的末端只能連接到書目或章節(jié)題目,而不能連接到“字”“詞”“句”。讀者通過目錄至多只能了解到某一本書或某一章節(jié)在何處,而難以了解到某個(gè)詞、某句話或某段話在哪里。計(jì)算機(jī)信息技術(shù)的運(yùn)用突破了這些局限,大大提高了檢索的專指性和直接性,使目錄可以直接連接到文獻(xiàn)中的所有大大小小的知識(shí)點(diǎn),我們有可能按知識(shí)點(diǎn)進(jìn)行閱讀。
U+y307tDGnHZpxZc+7Nofd7ne+EVe0gsE7pzrkY/+ZU=
引入文獻(xiàn)編目方法是實(shí)現(xiàn)知識(shí)點(diǎn)閱讀的有效形式
計(jì)算機(jī)知識(shí)點(diǎn)檢索,即語義自動(dòng)識(shí)別,這是國內(nèi)外專家普遍研究的一個(gè)難點(diǎn)課題。多年來的探索雖然取得了一系列成效,但從目前網(wǎng)上的檢索系統(tǒng)來看,檢索結(jié)果的準(zhǔn)確率和有效性還比較低。主要問題:一是“錯(cuò)”,查到的信息與輸入檢索詞在語義內(nèi)容上對(duì)不上號(hào);二是“多”,無法從中選擇所需;三是“亂”,查得信息缺乏排序。筆者認(rèn)為,把傳統(tǒng)的文獻(xiàn)編目方法引入計(jì)算機(jī)自動(dòng)檢索,也就是對(duì)計(jì)算機(jī)檢索到的知識(shí)點(diǎn)進(jìn)行編目,這是實(shí)現(xiàn)知識(shí)點(diǎn)檢索的有效形式。具體說,就是對(duì)某一檢索詞檢索到知識(shí)點(diǎn),讓計(jì)算機(jī)進(jìn)行自動(dòng)分類,并按一定次序列出款目,供用戶選擇點(diǎn)擊,達(dá)到縮小范圍、查閱所需的目的。
近三年來,人民出版社在開發(fā)建設(shè)“中國共產(chǎn)黨思想理論資源數(shù)據(jù)庫”的過程中,采用知識(shí)點(diǎn)編目的方法,研發(fā)出“人民金典語義查詢”“人民金典概念關(guān)聯(lián)”“人民金典模糊找句”三個(gè)查詢系統(tǒng)。這三個(gè)系統(tǒng)分別模擬了人腦在思考問題、探索未知時(shí)的三種思維狀態(tài)(即:從事物之上認(rèn)知事物、從事物之外認(rèn)知事物、從事物之中認(rèn)知事物),可以提供人們從不同的角度、按不同的需要進(jìn)行知識(shí)點(diǎn)查詢。目前已經(jīng)可以提供馬列著作、領(lǐng)袖著作和中央文件文獻(xiàn)的1000多萬個(gè)知識(shí)點(diǎn)的查詢。這些系統(tǒng)在“人民出版社”網(wǎng)上經(jīng)過一年多的運(yùn)行,證明其知識(shí)點(diǎn)檢索的語義準(zhǔn)確率可達(dá)到70%以上,其中“人民金點(diǎn)語義查詢”系統(tǒng)的準(zhǔn)確率可達(dá)95%以上。上述系統(tǒng)的常用用戶已達(dá)到1萬余人。實(shí)踐證明了引入文獻(xiàn)編目方法,對(duì)于提高語義自動(dòng)識(shí)別效率,實(shí)現(xiàn)知識(shí)點(diǎn)閱讀的有效性和可行性。
知識(shí)點(diǎn)閱讀必將帶來知識(shí)加工業(yè)的蓬勃興起
知識(shí)點(diǎn)閱讀有賴于知識(shí)加工。全民知識(shí)點(diǎn)閱讀的興起,一定會(huì)帶動(dòng)知識(shí)加工這一新興產(chǎn)業(yè)的誕生和發(fā)展。面對(duì)這一新的文化發(fā)展趨勢(shì),筆者向有關(guān)方面發(fā)出四點(diǎn)呼吁。
呼吁同行們加強(qiáng)交流與合作。目前,國內(nèi)從事知識(shí)深加工的機(jī)構(gòu),有傳統(tǒng)圖書館、相關(guān)互聯(lián)網(wǎng)站、辭書編輯出版機(jī)構(gòu)、知識(shí)產(chǎn)權(quán)管理部門等。這些機(jī)構(gòu)進(jìn)行知識(shí)加工的內(nèi)容和做法各不相同,對(duì)知識(shí)加工以及知識(shí)點(diǎn)的內(nèi)涵、外延理解也不一樣,應(yīng)當(dāng)以一定的形式聯(lián)合起來,加強(qiáng)工作交流和理論研究,相互學(xué)習(xí),共同開拓前行。
呼吁內(nèi)容工作者大軍進(jìn)入數(shù)字出版行列。目前,數(shù)字出版存在單純依靠技術(shù)工作者的“單打一”現(xiàn)象。筆者認(rèn)為,知識(shí)加工本質(zhì)上是個(gè)內(nèi)容問題,必須堅(jiān)持“內(nèi)容當(dāng)家”。內(nèi)容工作大軍參與之時(shí),就是數(shù)字出版興旺之日,也是知識(shí)加工業(yè)興起之日。我們的編輯人員、資深學(xué)者必須打破對(duì)技術(shù)的“神秘感”,積極投入數(shù)字出版以及知識(shí)的數(shù)字化加工工作。
呼吁傳統(tǒng)出版為數(shù)字出版及知識(shí)深加工做好接口。知識(shí)點(diǎn)檢索和閱讀,對(duì)傳統(tǒng)紙質(zhì)書的編輯、排版、版權(quán)以及電子文件的管理等提出了一系列新要求。紙質(zhì)書編輯出版中的“舉手之勞”,往往可以省去數(shù)字化加工中的“千辛萬苦”“千金萬銀”。 因此,紙質(zhì)書編輯出版應(yīng)當(dāng)按照數(shù)字出版以及知識(shí)深加工的要求,重新規(guī)范有關(guān)工作程序和標(biāo)準(zhǔn)。
呼吁政府有關(guān)部門對(duì)知識(shí)加工這一新興行業(yè)的發(fā)展提供政策支持和服務(wù)。利用目前國家支持文化產(chǎn)業(yè)發(fā)展的有利時(shí)機(jī),制定相關(guān)政策,對(duì)知識(shí)加工的創(chuàng)新項(xiàng)目提供一定的經(jīng)費(fèi)資助。知識(shí)加工和開發(fā)牽涉大量的標(biāo)準(zhǔn)和規(guī)范問題,建議有關(guān)部門加快推進(jìn)電子書以及其他有關(guān)的標(biāo)準(zhǔn)化建設(shè)。(作者單位系人民出版社)