張新華 趙婧
(張新華,湖南出版投資控股集團(tuán)有限公司博士后、北京大學(xué)新聞與傳播學(xué)博士后、北京印刷學(xué)院新聞出版學(xué)院副教授;趙婧,人民出版社編輯)
出版物所承載的知識之間存在著普遍的、多元的、復(fù)雜的聯(lián)系。在數(shù)字化環(huán)境下,利用一定的技術(shù)手段把相互關(guān)聯(lián)的出版物及其知識內(nèi)容鏈接起來,就構(gòu)成了出版物知識網(wǎng)絡(luò)。
對于出版社來說,構(gòu)建出版物知識網(wǎng)絡(luò)不僅是順應(yīng)數(shù)字環(huán)境下知識消費(fèi)需求的有效措施,也是提升其數(shù)字出版產(chǎn)業(yè)競爭優(yōu)勢的必然選擇。
中美兩國有關(guān)機(jī)構(gòu)的研究表明,數(shù)字時(shí)代知識消費(fèi)者的需求和行為相對過去發(fā)生了很大變化:知識獲取上,需要無縫鏈接和自助服務(wù);知識內(nèi)容上,需要從簡單文獻(xiàn)獲取轉(zhuǎn)移到知識發(fā)現(xiàn),甚至支持知識創(chuàng)新;知識檢索上,需要一站式、個(gè)性化、全文化、可下載;成本上,需要最快、最省力。傳統(tǒng)出版業(yè)通過書、刊等出版物向社會傳播知識,一本(套、系列)書、一份期刊都是一個(gè)體系完整而又獨(dú)立的知識集合體。在一種書刊的內(nèi)部,知識之間通過“目錄”、“索引”等方式建立起粗略的結(jié)構(gòu)鏈接和字詞鏈接;而書刊與書刊之間的知識關(guān)聯(lián),由于受物理載體的局限,除了運(yùn)用“注釋”、“參考文獻(xiàn)”等有限的技術(shù)手段表明知識關(guān)聯(lián)外,知識之間的鏈接無法建立起來。為了打破書刊知識的這種片段性、孤立性存在方式,歷史上的編輯家和出版家們發(fā)明了叢書、類書、套書、大百科全書等圖書體裁,主要通過分類、集合等方式建立起出版物知識的鏈接。但這些鏈接所反映的知識之間的關(guān)聯(lián)比較單一、膚淺、片面和有限,根本無法滿足數(shù)字環(huán)境下讀者對知識消費(fèi)的需要。可見,為順應(yīng)知識消費(fèi)方式的轉(zhuǎn)變,出版社需要改變傳統(tǒng)的知識提供和知識服務(wù)模式,建立起規(guī)模龐大的、功能健全的、相互之間可互通互聯(lián)的知識網(wǎng)絡(luò)。
相對于圖書館界和信息搜索行業(yè)來說,出版行業(yè)的知識網(wǎng)絡(luò)建設(shè)遠(yuǎn)遠(yuǎn)落后。圖書館界在情報(bào)學(xué)理論的指引下,在上世紀(jì)后半期就開始了數(shù)字圖書館建設(shè),努力構(gòu)建囊括人類所有現(xiàn)有文獻(xiàn)知識在內(nèi)的知識網(wǎng)絡(luò);以谷歌和百度為代表的新興信息搜索服務(wù)公司,先后推出了基于知識關(guān)聯(lián)的學(xué)術(shù)搜索和知識圖譜功能。近年來,數(shù)字圖書館和搜索型IT公司依靠強(qiáng)大的知識網(wǎng)絡(luò)提供便捷優(yōu)質(zhì)的服務(wù)而獲得高額的經(jīng)濟(jì)回報(bào)。而在絕大部分出版社,基于出版物的知識網(wǎng)絡(luò)還沒有建立起來。在數(shù)字化轉(zhuǎn)型中,一些出版社雖然嘗試提供電子書刊、數(shù)據(jù)庫等數(shù)字化產(chǎn)品,但在知識組織和產(chǎn)品開發(fā)上仍拘泥于傳統(tǒng)的編輯出版方式,或改變知識載體和傳播方式,或改變知識的存在單元,而對傳統(tǒng)以(書)本、(刊)期、(論文)篇等為存在單元的知識內(nèi)部及相互之間深入、本質(zhì)的關(guān)聯(lián)缺乏有效關(guān)注。這種知識網(wǎng)絡(luò)建設(shè)的落后局面使出版社在與其他企業(yè)的競爭中陷入被動(dòng)局面,大部分出版社淪落為數(shù)字出版產(chǎn)業(yè)鏈上內(nèi)容提供商的角色,在商業(yè)博弈中往往處于大型圖書館和谷歌、百度等公司的下風(fēng),無法體現(xiàn)出版社在知識生產(chǎn)和傳播中的先導(dǎo)地位,出版社的經(jīng)濟(jì)利益也一再受損。所以,通過構(gòu)建出版物知識網(wǎng)絡(luò),占據(jù)數(shù)字出版產(chǎn)業(yè)鏈的高端位置,是傳統(tǒng)出版社參與數(shù)字出版產(chǎn)業(yè)競爭、提高競爭優(yōu)勢的必要途徑。
在知識網(wǎng)絡(luò)結(jié)構(gòu)中,知識節(jié)點(diǎn)是由在認(rèn)識上可以相對獨(dú)立存在的各種知識單體形態(tài),即在認(rèn)識上具有獨(dú)立性的知識元、知識單元構(gòu)成。傳統(tǒng)以(書)本、(刊)期為基本物理單位的出版物是一個(gè)由多層次知識單元構(gòu)成的知識集合體,其知識內(nèi)容具有相對的完整性、系統(tǒng)性和獨(dú)立性。但從載體形式特點(diǎn)和內(nèi)容組織看,單個(gè)出版物的知識單元可分為三個(gè)基本層次:出版物、篇章和知識元。(1)出版物。如一本書、一期期刊、一份報(bào)紙等。(2)篇章。一個(gè)出版物的內(nèi)容由數(shù)量豐富、顆粒更小的知識單元組成,其中,書籍內(nèi)容的基本構(gòu)成單元是章節(jié),期刊的基本構(gòu)成單元是單篇的文章;出版物內(nèi)部的這些篇章也是相對獨(dú)立的知識單元。(3)知識元。當(dāng)知識單元被切分到“不可再分割的具有完備知識表達(dá)”的程度時(shí),就達(dá)到了出版物知識的最小單元,即知識元。知識元“是構(gòu)成知識結(jié)構(gòu)的最小獨(dú)立單元”,用來表示一個(gè)個(gè)針對特定問題的解決方案。根據(jù)主題或表達(dá)的內(nèi)容,知識元又可分為三種類型:理論與方法型知識元、事實(shí)型知識元和數(shù)值型知識元。在如上三個(gè)層次的知識單元中,知識元是最基本、最活躍的知識體,知識元之間的排列和組合方式的變化是新知識生產(chǎn)的一個(gè)重要途徑。
由于出版物具有物質(zhì)和精神雙重屬性,出版物的三層知識網(wǎng)絡(luò)節(jié)點(diǎn)也具有內(nèi)在和外在雙重屬性。內(nèi)在屬性指出版物內(nèi)容知識的本質(zhì)屬性,反映知識與它所描述的客觀事物的關(guān)系,從這個(gè)角度也可將出版物中的知識節(jié)點(diǎn)稱為“概念”、“事物”、“規(guī)律”、“規(guī)則”、“學(xué)科”等。外在屬性是由于知識內(nèi)容的表達(dá)、識別、傳播和版權(quán)歸屬等需要所附帶的知識,包括名稱(標(biāo)題)、作者、出版者、出版時(shí)間、出版地區(qū)(網(wǎng)址)、類型、載體形式等信息,這些信息實(shí)際上組成了獨(dú)立知識節(jié)點(diǎn)的“身份識別系統(tǒng)”,反映它所對應(yīng)的知識內(nèi)容的客觀存在性,是知識的知識,在數(shù)據(jù)庫中被稱為關(guān)于知識的“元數(shù)據(jù)”。
知識關(guān)聯(lián)是指構(gòu)成知識網(wǎng)絡(luò)的知識節(jié)點(diǎn)之間的聯(lián)系,即各相關(guān)節(jié)點(diǎn)間形成意義系統(tǒng)的聯(lián)系。出版知識網(wǎng)絡(luò)中的知識關(guān)聯(lián)是指出版物的知識單元(包括出版物,出版物中的篇章,知識元、句子、詞語等知識內(nèi)容)之間存在的各種聯(lián)系的總和?!叭?何一種知識的屬性都可能作為一種關(guān)聯(lián)屬性構(gòu)成知識網(wǎng)絡(luò)”。由于出版物知識節(jié)點(diǎn)具有雙重屬性,出版物知識單元之間的關(guān)聯(lián)也包括內(nèi)在屬性關(guān)聯(lián)和外在屬性關(guān)聯(lián)兩種。(1)出版物知識的內(nèi)在屬性關(guān)聯(lián)是知識所描述的事物之間相互內(nèi)在的聯(lián)系性決定的,這種內(nèi)在的聯(lián)系一般表現(xiàn)為知識單元之間具有的同一、隸屬和相關(guān)等三種屬性的關(guān)聯(lián)。同一性關(guān)聯(lián)指知識節(jié)點(diǎn)間具有的某種相同性質(zhì)所形成的關(guān)聯(lián),是知識節(jié)點(diǎn)繼承性的表現(xiàn);它導(dǎo)致具有相同性質(zhì)的知識節(jié)點(diǎn)以同一性構(gòu)成聯(lián)系并相聚形成學(xué)科、專業(yè)的知識單元集合、網(wǎng)絡(luò)。隸屬性關(guān)聯(lián)指某一知識單元或知識單元集合隸屬于某一概念、范疇和類別的邏輯關(guān)系;它反映了知識單元之間一般和個(gè)別、總體和部分的內(nèi)在關(guān)系。相關(guān)性關(guān)聯(lián)是指在同一、隸屬關(guān)系之外知識單元間所具有的相互依存、相互滲透、相互制約、相互作用、互為中介的關(guān)系,一般是指相反、相對、因果、引用、應(yīng)用、影響等各種關(guān)系。(2)出版物知識的外在屬性關(guān)聯(lián)就是知識的外在屬性之間的各種聯(lián)系,如學(xué)術(shù)論文作者之間的聯(lián)系、某學(xué)術(shù)問題研究的時(shí)間和地區(qū)分布等。通常來說,外在屬性關(guān)系簡單明確,很容易被發(fā)現(xiàn)識別并加以利用;而內(nèi)在屬性關(guān)系復(fù)雜多樣,動(dòng)態(tài)性較強(qiáng),有的知識關(guān)系只能由專家發(fā)現(xiàn)和建立。
知識鏈接是指利用數(shù)字技術(shù)手段,將具有內(nèi)在或外在屬性關(guān)聯(lián)的出版物知識單元鏈接起來,構(gòu)成序列化或結(jié)構(gòu)化的知識網(wǎng)絡(luò)的一種知識組織方式。在出版物所構(gòu)建的知識世界里,知識之間的關(guān)聯(lián)既有顯性的,也有隱性的;通過知識鏈接,可以使隱性關(guān)聯(lián)顯性化,實(shí)現(xiàn)知識之間的互聯(lián)互通,同時(shí)還可以發(fā)現(xiàn)新的知識。在當(dāng)下的信息技術(shù)條件下,不同知識單元聯(lián)系在一起的技術(shù)和方法有:傳統(tǒng)的目錄法、索引法、引用法,現(xiàn)代的超文本鏈接、主題網(wǎng)關(guān)、參考鏈接等。按照知識單元從大到小來劃分,出版物知識單元之間的鏈接形式可分為基于出版物單元的知識鏈接(也稱為參考文獻(xiàn)鏈接或引文鏈接)、基于信息單元的知識鏈接(也稱為知識屬性鏈接)和基于知識元的知識鏈接(也稱為知識邏輯鏈接或語義鏈接)。
從知識節(jié)點(diǎn)的顆粒度、屬性和鏈接方式看,目前國內(nèi)由出版社主導(dǎo)或參與建設(shè)的出版物知識網(wǎng)絡(luò)主要有三類:元數(shù)據(jù)知識網(wǎng)絡(luò)、全文知識網(wǎng)絡(luò)和知識元網(wǎng)絡(luò),它們各有特點(diǎn)。
元數(shù)據(jù)是規(guī)定出版物外在屬性的附屬性知識,由這些知識集合并按照一定需要建立起鏈接關(guān)系的知識體系即是元數(shù)據(jù)知識網(wǎng)絡(luò)。該類知識網(wǎng)絡(luò)源自出版社紙質(zhì)版的圖書目錄或期刊題錄等,伴隨著網(wǎng)絡(luò)發(fā)行渠道的興起而產(chǎn)生。在互聯(lián)網(wǎng)上讀者可以通過它方便地查閱到其中的圖書信息及圖書之間的外部屬性聯(lián)系,如書刊名、(期刊中文章)標(biāo)題、作者、出版時(shí)間、學(xué)科分類、定價(jià)等;但通過這些信息還不能鏈接到它所指向的知識內(nèi)容本身。目前一些出版社已實(shí)現(xiàn)了此類知識網(wǎng)絡(luò)的開發(fā)和利用,其中最具代表性的是中國出版集團(tuán)公司于2006年開始建設(shè)的“中國可供書目數(shù)據(jù)庫”。到2011年,該庫收入書目數(shù)據(jù)200多萬條,覆蓋了90%的出版社的80%以上的品種;實(shí)現(xiàn)了全國書目信息動(dòng)態(tài)采集、更新、發(fā)布和服務(wù),具備瀏覽與檢索的全部功能,可以及時(shí)向市場傳播圖書產(chǎn)品信息,更新產(chǎn)品可供應(yīng)的狀態(tài)。元數(shù)據(jù)知識網(wǎng)絡(luò)雖然還沒有涉及出版物的知識內(nèi)容,但也打破了出版物孤立、靜止的存在狀態(tài),使傳統(tǒng)出版物借助該知識網(wǎng)絡(luò)實(shí)現(xiàn)了傳播范圍的擴(kuò)大和生命周期的延伸。
出版社為了實(shí)現(xiàn)知識內(nèi)容的多渠道發(fā)布、多介質(zhì)傳播,以整本出版物(包含全部的知識內(nèi)容及附屬信息)或出版物的篇章為節(jié)點(diǎn)構(gòu)建全文知識網(wǎng)絡(luò),實(shí)現(xiàn)了知識元數(shù)據(jù)和知識內(nèi)容本身的同步網(wǎng)絡(luò)傳播。此類知識網(wǎng)絡(luò)是目前國內(nèi)出版社建設(shè)的主要形式。例如,人民交通出版社研發(fā)的“中國交通知識服務(wù)數(shù)字出版平臺”,到2012年底已經(jīng)上線該社電子書11798種,外購電子資源45819種;上線交通專業(yè)科技詞典類工具書68種,交通標(biāo)準(zhǔn)1584種;形成交通標(biāo)準(zhǔn)、工具書、史書、教材教輔等6大交通專業(yè)數(shù)據(jù)庫。在功能上,可以通過關(guān)鍵詞跨庫檢索、全文閱讀和下載。此外,有代表性的全文知識網(wǎng)絡(luò)還有科學(xué)出版社的科學(xué)文庫、社會科學(xué)文獻(xiàn)出版社的皮書數(shù)據(jù)庫等。該類知識網(wǎng)絡(luò)實(shí)現(xiàn)了出版物內(nèi)容與外部屬性信息之間的關(guān)聯(lián)和鏈接,也打破了傳統(tǒng)出版物以本(冊)為單元的傳播方式,使知識節(jié)點(diǎn)細(xì)化到篇章層次。但是,構(gòu)成知識節(jié)點(diǎn)的知識單元顆粒仍然太大,知識鏈接主要依據(jù)知識外部屬性之間的關(guān)聯(lián)發(fā)出,知識之間內(nèi)在的本質(zhì)聯(lián)系還沒有被挖掘出來。
知識元網(wǎng)絡(luò)就是以知識元為基本知識節(jié)點(diǎn)所構(gòu)成的知識體系,其中,知識元之間的關(guān)聯(lián)是通過語義鏈接實(shí)現(xiàn)的。知識元語義鏈接表示的是知識之間內(nèi)在屬性的邏輯關(guān)聯(lián)(也稱為語義關(guān)聯(lián)),在此基礎(chǔ)上所構(gòu)建的內(nèi)容交互的邏輯知識網(wǎng)絡(luò)能還原知識關(guān)聯(lián)的本來面目;它有益于消除信息孤島,提升知識自由集成服務(wù)能力,是用戶挖掘知識、組合知識、利用知識和創(chuàng)新知識的有力工具。知識元網(wǎng)絡(luò)對用戶的知識利用和知識創(chuàng)新的價(jià)值超過其他類型的知識網(wǎng)絡(luò),是知識網(wǎng)絡(luò)建設(shè)的最高層次,但也是建設(shè)難度最大的一類。目前可見的一個(gè)知識元網(wǎng)絡(luò)是“醫(yī)學(xué)知識庫”。它是由人民軍醫(yī)出版社、解放軍醫(yī)學(xué)圖書館聯(lián)合研發(fā)的醫(yī)學(xué)類專業(yè)知識網(wǎng)絡(luò),它抽取醫(yī)學(xué)圖書中的知識元并將其重組,進(jìn)行結(jié)構(gòu)形式上的歸納、選擇、整理,以疾病為知識核心,包括疾病、藥品、手術(shù)、輔助檢查、循證證據(jù)、疾病研究進(jìn)展、醫(yī)保藥品、手術(shù)圖譜、臨床操作規(guī)范等相關(guān)知識,并且通過這些知識之間的內(nèi)在聯(lián)系將其有機(jī)地結(jié)合起來。從知識節(jié)點(diǎn)及知識鏈接看,“醫(yī)學(xué)知識庫”以疾病及其相關(guān)領(lǐng)域的知識元為節(jié)點(diǎn),主要通過庫內(nèi)知識超鏈接的方式,實(shí)現(xiàn)知識間的關(guān)聯(lián),知識獲取的精準(zhǔn)性和便捷性很高;但該庫還是一個(gè)相對封閉的體系,庫內(nèi)知識元無法與外部知識進(jìn)行鏈接;同時(shí),其中的知識元及其鏈接都是預(yù)先設(shè)定的,不能根據(jù)用戶需求生成新的知識元及其與其他知識間的鏈接??梢?,“醫(yī)學(xué)知識庫”還是一個(gè)“入門級”的知識元網(wǎng)絡(luò)。
人都聚集到了北壩兩座山包間谷口處。遲恒驚慌失措趕到,不知道自己能做什么。狂潑的雨如同充滿仇恨的怨婦,歇斯底里要用她的淚與嗚咽去吞噬所有。他看見有人在架水泵、挖放泵的水洼,有人向壩堤外側(cè)鋪又長又寬的塑料布以作臨時(shí)水渠,避免泄水沖涮砂質(zhì)堤壩,遲恒趕緊過去幫著鋪。很快,四臺水泵開始抽吸庫面積水往外吐。他從壩坡爬上來,水如蛇一樣陰冷地已繞上腳根,不遠(yuǎn)處,魏昌龍蹲在壩旁一動(dòng)不動(dòng)死死盯著邊線水位。遲恒剛想過去,突然想到極度緊張的人,很容易暴躁失控。
以上三類知識網(wǎng)絡(luò)分別代表了我國出版物知識網(wǎng)絡(luò)建設(shè)的基礎(chǔ)階段、過渡階段和目標(biāo)階段的發(fā)展水平。由于這些知識網(wǎng)絡(luò)的建設(shè)大多以單個(gè)出版社資源為基礎(chǔ),知識網(wǎng)絡(luò)的規(guī)模普遍較小,知識網(wǎng)絡(luò)內(nèi)部的知識鏈接路徑有限,不同的知識網(wǎng)絡(luò)之間不能互聯(lián)互通,既不利于讀者們的知識利用,也無法充分實(shí)現(xiàn)出版物的知識價(jià)值。所以,在未來的數(shù)字化轉(zhuǎn)型過程中,出版社需要以這三類知識網(wǎng)絡(luò)為基礎(chǔ),繼續(xù)提高知識網(wǎng)絡(luò)的建設(shè)水平。
*該文受北京市教師基地(中國人民大學(xué))2012研修項(xiàng)目支持。
注釋:
① 文庭孝,劉曉英,劉進(jìn)軍. 知識關(guān)聯(lián)的理論基礎(chǔ)研究[J]. 圖書館,2010(4).
② 肖希明,黃連慶. 以需求為導(dǎo)向的數(shù)字信息資源開發(fā)[J]. 中國圖書館學(xué)報(bào),2007(6).
③ Chaos. 百度疑似推出“知識圖譜”功能,搜索結(jié)果百科全書化[EB/OL].百道網(wǎng),2012-12-12.http://www.bookdao.com/article/56301/
④ 趙蓉英.論知識網(wǎng)絡(luò)的結(jié)構(gòu)[J].圖書情報(bào)工作,2007(9).
⑤ 朱慶華.《知識元挖掘》評介[J].情報(bào)科學(xué),2006(12).
⑥ 姜永常,楊宏巖,張麗波. 基于知識元的知識組織及其系統(tǒng)服務(wù)功能研究[J]. 情報(bào)理論與實(shí)踐,2007(1).
⑦⑨趙蓉英. 論知識網(wǎng)絡(luò)的結(jié)構(gòu)[J]. 圖書情報(bào)工作,2007(9).
⑧ 周曉英. 知識網(wǎng)絡(luò)、知識鏈接和知識服務(wù)研究[J]. 情報(bào)資料工作,2010(2).
⑩ 該概念借鑒了情報(bào)學(xué)學(xué)者 姜永常的說法。參看姜永常.知識網(wǎng)絡(luò)鏈接的理論基礎(chǔ)與基本原則[J]. 圖書館,2012(2).
11 12 中國出版集團(tuán)網(wǎng)站. 中國可供書目數(shù)據(jù)庫[EB/OL]. http://www.cnpubg.com/digital/2011/1027/8908.shtml
13 中國知網(wǎng)醫(yī)學(xué)知識庫[EB/OL].http://pmmp.cnki.net/index.aspx