国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語義出版:數(shù)字時代科學(xué)交流系統(tǒng)新模型

2012-12-29 00:00:00王曉光陳孝禹
出版科學(xué) 2012年4期


  [摘 要] 語義出版是基于傳統(tǒng)互聯(lián)網(wǎng)技術(shù)和語義網(wǎng)技術(shù),結(jié)合自然語言處理、本體和信息可視化技術(shù)而發(fā)展起來的一種新興出版形態(tài),代表著數(shù)字出版的前沿。本文梳理語義出版的多種表現(xiàn)形式,分析其功能特征,進(jìn)而提出語義出版的DBIU層次模型。最后,本文就語義出版在科學(xué)研究范式變革、科學(xué)出版商角色轉(zhuǎn)變、科研工作方式、用戶“戰(zhàn)略閱讀”和“宏知識”獲取方面的影響和意義進(jìn)行了深入探討。
  [關(guān)鍵詞] 語義出版 科學(xué)交流 義網(wǎng) “宏知識” 戰(zhàn)略閱讀
  [中圖分類號] G237  [文獻(xiàn)標(biāo)識碼] A  [文章編號] 1009-5853(2012) 04-0081-06
  1 引 言
  1980年代,隨著計算機(jī)網(wǎng)絡(luò)應(yīng)用的普及,科學(xué)交流系統(tǒng)發(fā)生了巨大變化,先進(jìn)的信息導(dǎo)航技術(shù),面向特定學(xué)科的智能搜索、瀏覽和分析工具,自動超鏈接技術(shù),實時數(shù)據(jù)圖表,機(jī)器可讀的數(shù)據(jù)對象,結(jié)構(gòu)化的注釋以及互操作技術(shù)等逐漸浮現(xiàn)[1]。1990年代,在互聯(lián)網(wǎng)技術(shù)與現(xiàn)實需求的雙重推動下,科學(xué)出版發(fā)生革命性變革:學(xué)術(shù)期刊相繼在互聯(lián)網(wǎng)上發(fā)布電子版本,并逐漸取代傳統(tǒng)的印刷期刊成為科學(xué)交流的主流載體[2-3]。
  進(jìn)入21世紀(jì)后,計算機(jī)和互聯(lián)網(wǎng)的廣泛應(yīng)用在改變科學(xué)研究基礎(chǔ)架構(gòu)的同時也帶來了科研數(shù)據(jù)和信息的爆炸式增長。大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)字資源充斥科學(xué)研究的各個環(huán)節(jié),閱讀、分析、組織、存儲和發(fā)布這些數(shù)字資源讓傳統(tǒng)的科學(xué)交流系統(tǒng)難以勝任。除此之外,隨著跨學(xué)科研究的興起,科研人員在跨域合作研究過程中對數(shù)據(jù)語義和復(fù)雜度的要求也越來越高。面對海量的科研信息以及復(fù)雜的情報任務(wù),如何通過自動化和智能化方式輔助科研人員快速發(fā)現(xiàn)新知識并進(jìn)行正確決策,成為當(dāng)代科學(xué)交流系統(tǒng)設(shè)計者面臨的最嚴(yán)峻挑戰(zhàn)。
  增加數(shù)據(jù)和信息之間的關(guān)聯(lián)不僅能夠提高數(shù)據(jù)和信息的獲取效率,更能方便用戶發(fā)現(xiàn)、學(xué)習(xí)和理解復(fù)雜的知識體系。為了應(yīng)對以上挑戰(zhàn),一線科研人員、科學(xué)情報組織、圖書館與學(xué)術(shù)出版機(jī)構(gòu)不約而同地將目光投向語義信息技術(shù),包括XML語言(XSLT、XQuery、XPath)、語義網(wǎng)(RDF、OWL、SPARQL)和本體技術(shù)?;谡Z義技術(shù)的信息發(fā)布、集成與交互架構(gòu)設(shè)計逐漸成為科學(xué)交流系統(tǒng)發(fā)展的前沿。語義出版(Semantic Publishing)作為一種新穎的和對科學(xué)交流系統(tǒng)具有顛覆性意義的出版形式日益浮現(xiàn)[4-5]。
  2  語義出版的概念與表現(xiàn)形式
  2.1 語義出版的概念
  期刊出版是科研成果公開發(fā)表的首要途徑,也是科學(xué)研究的重要環(huán)節(jié),對于標(biāo)識科學(xué)假設(shè)和科學(xué)成果的首發(fā)權(quán)具有重要意義。期刊出版通常要經(jīng)過同行評議。這種方式不僅實現(xiàn)了同行交流,更為期刊質(zhì)量提供了保障。自350年前科學(xué)期刊產(chǎn)生以來,其基本形式幾乎從未發(fā)生過變化,一直都是線性結(jié)構(gòu),每期包括幾篇或十幾篇文章,按先后順序編排。在文章中,作者總是通過各種實驗數(shù)據(jù)、調(diào)查資料或邏輯推斷證明自己的假設(shè)或觀點。文中既有各種圖表,又有各種觀點匯總和引文線索;既有各種專業(yè)基礎(chǔ)詞匯,又有各種學(xué)科的前沿術(shù)語。
  目前,大多數(shù)期刊出版商都提供PDF版本或網(wǎng)頁版本的期刊文章。PDF版本的電子文檔缺乏詳細(xì)的語義標(biāo)注和互動功能,所以主要適合印刷和離線閱讀,不便于機(jī)器理解和獲取其中的數(shù)據(jù)單元。單篇PDF文檔類似于互聯(lián)網(wǎng)上的數(shù)據(jù)孤島,相互之間缺乏必要的豐富的“數(shù)據(jù)橋梁”,難于實現(xiàn)數(shù)據(jù)的自動整合、鏈接和交互性解釋。
  基于語義技術(shù)及其他相關(guān)信息技術(shù),通過語義標(biāo)記豐富期刊文章表現(xiàn)形式及顯性內(nèi)容,提高文章信息可操作性和交互性,增強文章關(guān)聯(lián)度,改進(jìn)出版流程,實現(xiàn)智能化出版的方式可以稱為“語義出版”。語義出版是在傳統(tǒng)互聯(lián)網(wǎng)技術(shù)和語義網(wǎng)技術(shù)基礎(chǔ)上,結(jié)合自然語言處理、本體和信息可視化技術(shù)發(fā)展起來的一種新興出版形態(tài)。早在2001年,蒂姆·伯納斯-李就指出語義網(wǎng)將有可能用人們無法想象的方式改變科學(xué)知識的生產(chǎn)和共享[6]。2009年,牛津大學(xué)動物學(xué)系圖像生物信息學(xué)研究小組的大衛(wèi)·香頓(David Shotton)等人在多項實驗基礎(chǔ)上首次較系統(tǒng)地提出了語義出版的概念[7]。語義出版的目標(biāo)就是要實現(xiàn)在線文檔資源中的數(shù)據(jù)、信息和知識可以很容易地被發(fā)現(xiàn)、抽取、整合與再利用。
  2.2 語義出版的功能與表現(xiàn)形式
  語義出版的實質(zhì)是在線信息服務(wù)提供商和大型學(xué)術(shù)出版機(jī)構(gòu)運用語義網(wǎng)的核心思想與相關(guān)技術(shù)向用戶提供科學(xué)知識的智能化發(fā)布、個性化獲取和共享處理機(jī)制。目前,這套機(jī)制主要包括:基礎(chǔ)性的結(jié)構(gòu)化處理、專業(yè)本體庫的建立、XML標(biāo)注和開放性的應(yīng)用接口等。根據(jù)這套機(jī)制,語義出版主要實現(xiàn)以下功能:
  ·自動識別文章內(nèi)的本體,生成攜帶語義數(shù)據(jù)的原始文檔;
  ·自動識別文章內(nèi)的實體,建立與外部資源的鏈接,為實體增加額外信息;
  ·通過高亮文本條目、標(biāo)簽樹(tag tree)、標(biāo)簽云(tag cloud)等可視化形式勾勒文章結(jié)構(gòu);
  ·借助XML語言,提供可操作和可下載的原始數(shù)據(jù),如可重排的參考文獻(xiàn)列表、交互式圖表、XML版文檔、關(guān)聯(lián)數(shù)據(jù)集(linked data set)等;
  ·運用開放應(yīng)用程序接口,開展多種類型的信息混合(mushup);
  ·借助開放鏈接機(jī)制,將文章的參考文獻(xiàn)指向文章原文;
  ·借助瀏覽器插件,對客戶端文本進(jìn)行語義增強;
  ·以用戶為中心,開展個性化推薦服務(wù);
  ·借助專用的閱讀終端進(jìn)行智能化閱讀。
  自2009年以來,Shotton等人針對期刊文章的HTML版本進(jìn)行了語義增強實驗[8-9],Pafilis等人利用文本挖掘技術(shù)自動識別HTML文章中的命名實體并給予語義標(biāo)注[10],Wan等人研究從文章引文處獲取情景信息[11],Attwood開發(fā)了智能PDF閱讀終端Utopia[12], Silvio Peroni與Shotton聯(lián)合開發(fā)了語義出版與參考本體SPAR[13-14]。
  語義出版作為語義網(wǎng)技術(shù)的應(yīng)用性實踐,除了得到學(xué)者關(guān)注外,還得到許多知名學(xué)術(shù)出版機(jī)構(gòu)和信息服務(wù)商的關(guān)注。如英國皇家化學(xué)會(RSC)實施了Prospect項目[15],愛思維爾開展了Article of the Future[16]和Pensoft[17]項目,湯森·路透集團(tuán)提供OpenCalais服務(wù)[18],PLoS實施了Semantic Enrichment計劃,維基百科使用97種不同的語言為多達(dá)350萬的條目設(shè)置了特征標(biāo)簽和摘要,谷歌也聯(lián)合微軟、雅虎和Yandex推出了網(wǎng)頁語義化處理標(biāo)準(zhǔn)[19]。
  2.3 語義出版的特征
  語義出版是數(shù)字出版的高級形態(tài)。它大量使用語義技術(shù)和網(wǎng)絡(luò)開放服務(wù)協(xié)議,在出版內(nèi)容、形式和服務(wù)上呈現(xiàn)以下五種特征。
 ?。?)內(nèi)容結(jié)構(gòu)化。大量非結(jié)構(gòu)化內(nèi)容的存在是在線信息再利用效率低下的原因之一。語義網(wǎng)的發(fā)展目標(biāo)正是通過XML、RDF、OWL、Linked Data等技術(shù)與標(biāo)準(zhǔn)從源頭上把大量非結(jié)構(gòu)化信息變成結(jié)構(gòu)化信息。語義出版通過用元數(shù)據(jù)描述出版信息,給文章內(nèi)容添加語義標(biāo)簽,把文章分解成多個互相關(guān)聯(lián)的、彼此間有明確層次結(jié)構(gòu)的組成部分,以便于實現(xiàn)文本內(nèi)容的智能化分析處理和自動化獲取與融合。
  (2)數(shù)據(jù)融合化。將不同站點或應(yīng)用程序、不同內(nèi)容描述方式、不同來源的數(shù)據(jù)資源加以融合,能夠提高閱讀和理解效率。在科研領(lǐng)域尤其如此。語義出版通過語義標(biāo)記、可操作性的數(shù)據(jù)和交互性的圖片,利用開放的谷歌地圖應(yīng)用程序編程接口(Google Maps API),實現(xiàn)了地理空間數(shù)據(jù)與其他類型數(shù)據(jù)之間的融合;同時支持功能更加強大的RSS服務(wù),改變大量研究數(shù)據(jù)利用方式單一和信息孤島等問題。信息融合既是語義出版的特征,也是未來進(jìn)一步改進(jìn)語義出版的著力點之一。
  (3)信息可視化。在信息爆炸時代,紛繁復(fù)雜的信息給人們理解、查詢和獲取知識帶來沉重的負(fù)擔(dān)。通過對抽象信息提供計算機(jī)支持的、交互式的、可視化的表示形式,能夠增強人們對于復(fù)雜信息的認(rèn)知能力。語義出版強化了學(xué)術(shù)信息與科研成果的可視化能力,提供具有縮放功能的高清晰圖片、化學(xué)結(jié)構(gòu)的三維動態(tài)顯示、高亮文本條目、語義標(biāo)簽云、標(biāo)簽樹等內(nèi)容形式。這些新型的可視化形式能夠有效地提高讀者的閱讀、理解和記憶效率。
  (4)對象關(guān)聯(lián)化。在互聯(lián)網(wǎng)上,數(shù)字對象之間的關(guān)聯(lián)主要靠超鏈接實現(xiàn)。這些超鏈接多是靜態(tài)的,難于更新,而且主要靠手工添加,成本較高。語義出版可以借助語義技術(shù)實現(xiàn)數(shù)字對象和知識單元之間豐富的、多層次的、自動化的相互關(guān)聯(lián)。這使得出版對象不再是孤立的,相互之間的鏈接也不是一成不變,而是動態(tài)更新的。由此形成的信息網(wǎng)絡(luò)使讀者的閱讀成為情景化的和上下文相關(guān)的,便于讀者在信息空間內(nèi)定位與導(dǎo)航,開展溯源閱讀和擴(kuò)展閱讀。
 ?。?)閱讀個性化。個性化是信息服務(wù)的發(fā)展趨勢。不同的讀者和用戶對信息的需求存在明顯差異。以往數(shù)字對象之間的關(guān)聯(lián)主要考慮主題之間的相似性。為了滿足讀者的個性化信息需求,語義出版不僅關(guān)注數(shù)字對象之間的相關(guān)性,更考慮讀者與數(shù)字對象之間的相關(guān)性。為此必須識別和跟蹤讀者的興趣,以讀者為中心動態(tài)地組織和提供出版物內(nèi)容及服務(wù)資源,由此實現(xiàn)閱讀的個性化,提升讀者的工作效率。
  語義出版在改進(jìn)用戶閱讀和利用科學(xué)文獻(xiàn)體驗的同時,也在期刊數(shù)字化基礎(chǔ)上進(jìn)一步提升了科學(xué)交流系統(tǒng)的功能與效率。
  3 語義出版的層次模型
  語義出版的核心是借助語義網(wǎng)、自然語言處理、本體、信息可視化、網(wǎng)絡(luò)開放協(xié)議等相關(guān)技術(shù)與標(biāo)準(zhǔn),構(gòu)建一個增強型學(xué)術(shù)出版系統(tǒng)框架,進(jìn)而實現(xiàn)科學(xué)交流的革命。從技術(shù)體系來看,語義出版系統(tǒng)的架構(gòu)可以分為四個層次,分別為數(shù)據(jù)層(Data)、業(yè)務(wù)層(Business)、交互層(Interaction)和用戶層(User),簡稱為DBIU模型,如圖1所示。
  數(shù)據(jù)層 數(shù)據(jù)層是語義出版系統(tǒng)框架的基礎(chǔ),用于存儲大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的文檔與數(shù)據(jù)。在語義出版系統(tǒng)中,數(shù)據(jù)層的數(shù)據(jù)類型更加多樣,除了傳統(tǒng)的以單篇文獻(xiàn)為存儲單元的文獻(xiàn)數(shù)據(jù)庫以外,大量具有完備知識表達(dá)和重用潛能的“知識單元”將單獨存儲,成為獨立的知識庫。如原始數(shù)據(jù)、表格、圖片、摘要、結(jié)論、引文等。在知識服務(wù)領(lǐng)域,人們一直希望通過有效的知識組織方式改變知識的組織結(jié)構(gòu),實現(xiàn)知識的自由存取、自由重組、自由利用,以提高知識服務(wù)的效應(yīng),為人類知識學(xué)習(xí)和創(chuàng)新提供方法[20]。語義出版就是要將出版單位從文獻(xiàn)細(xì)化到文獻(xiàn)中的知識單元,實現(xiàn)從出版物基礎(chǔ)(Item-based)到內(nèi)容基礎(chǔ)(Content-based)的轉(zhuǎn)變。在數(shù)據(jù)層建立知識庫而非簡單的文獻(xiàn)庫是推動信息服務(wù)向知識服務(wù)過渡的基礎(chǔ)。
  業(yè)務(wù)層 在數(shù)據(jù)層的基礎(chǔ)上,業(yè)務(wù)層主要實現(xiàn)更細(xì)粒度的知識單元的識別,以及各個層面的知識單元的自動關(guān)聯(lián),以此來構(gòu)建龐大而密集的知識網(wǎng)絡(luò)。在傳統(tǒng)互聯(lián)網(wǎng)上,數(shù)字對象之間的關(guān)聯(lián)主要靠超鏈接實現(xiàn),這些超鏈接多是靜態(tài)的,難于更新。語義出版則要求借助XML語言實現(xiàn)數(shù)字對象之間豐富的、多層次的、自動化的相互關(guān)聯(lián)。這些關(guān)聯(lián)包括文獻(xiàn)層面之間的關(guān)聯(lián),如當(dāng)前文檔與相關(guān)文獻(xiàn)的鏈接;文檔內(nèi)部各部分之間的關(guān)聯(lián),如“參見圖1”或“參見公式1”等指向文章內(nèi)的圖或公式的鏈接;知識單元與文獻(xiàn)之間的關(guān)聯(lián),如文后參考文獻(xiàn)與被引文獻(xiàn)全文之間的鏈接;知識單元與外部解釋性資源之間的關(guān)聯(lián),如概念術(shù)語與外部知識庫和本體庫之間的鏈接等。在語義出版系統(tǒng)中,業(yè)務(wù)層使得出版對象能夠擺脫孤立狀態(tài),建立起根據(jù)資源和用戶使用行為動態(tài)更新的知識網(wǎng)絡(luò)。
  交互層 交互層是語義出版系統(tǒng)的前臺展示及用戶交互界面,主要用于指導(dǎo)用戶發(fā)現(xiàn)、閱讀和使用站內(nèi)資源。交互層是語義出版系統(tǒng)框架中直接面向用戶的部分。在信息爆炸的時代,紛繁復(fù)雜的信息給人們理解、查詢和獲取知識帶來沉重負(fù)擔(dān)。借助語義標(biāo)簽、信息可視化和在線交互技術(shù),語義出版系統(tǒng)提供更全面的文檔層面或更細(xì)微的知識單元層面的概述和透視功能,以增強人們對于復(fù)雜信息的認(rèn)知能力。
  用戶層 用戶層主要用于識別用戶需求、構(gòu)建用戶興趣網(wǎng)絡(luò)和提供個性化服務(wù)。在語義出版系統(tǒng)框架中,系統(tǒng)將借助Web日志挖掘識別和分析各個用戶的信息需求和Web行為特征,進(jìn)而構(gòu)建興趣圖譜,向系統(tǒng)用戶推薦具有相似興趣的用戶以及用戶可能感興趣的資源,從而提高系統(tǒng)和資源的利用水平和績效。
  4 語義出版對科學(xué)交流的影響
  科學(xué)交流是科研活動中必不可少的環(huán)節(jié),文獻(xiàn)出版則是科學(xué)交流體系重要的組成部分。作為一種先進(jìn)的出版形態(tài),語義出版所實現(xiàn)的數(shù)據(jù)關(guān)聯(lián)、互操作、數(shù)據(jù)挖掘、信息可視化、智能檢索與個性化服務(wù)等功能正掀起新一波的學(xué)術(shù)交流革命,其影響和意義主要表現(xiàn)在以下幾個方面。
  (1)語義出版將大量由單個用戶獨立完成的信息搜尋和文獻(xiàn)整理分析等活動轉(zhuǎn)移給了出版系統(tǒng),減輕了科研人員的負(fù)擔(dān),有利于科學(xué)交流效率的整體性提升。
  從科研活動的整個流程來看,搜尋特定科研主題相關(guān)資料并整理和閱讀它們是科研人員的日常工作之一??蒲腥藛T一方面通過發(fā)表文章來告知同行其工作進(jìn)展與成果;另一方面也通過閱讀知曉同行的研究方向與研究進(jìn)程,并學(xué)習(xí)和掌握學(xué)科前沿知識。當(dāng)科研人員搜索和瀏覽各種學(xué)術(shù)資源時,他們總是不停地修改和完善搜索詞匯以找到所需的參考文獻(xiàn),通過理解、分析、做筆記、復(fù)制等方法提取并積累具體的信息與知識,如假設(shè)、觀點、方程式、數(shù)據(jù)集和研究結(jié)論等知識單元。在此過程中,他們要對文章的相關(guān)性、影響力和質(zhì)量做出快速判斷,完成文獻(xiàn)篩選和過濾。科研人員查詢文獻(xiàn)的目的不是要找到某一篇文章,而是通過組織聚合和分析整理多篇文章找到關(guān)鍵知識與信息,進(jìn)而激發(fā)新的觀點和想法,為后期科學(xué)研究做準(zhǔn)備。
  美國科學(xué)基金會(National Science Foundation,NSF)的統(tǒng)計顯示一名科研人員花費在查找和消化科研資料上的時間需占全部科研時間的51%,計劃、思考占8%,實驗研究占32%,書面總結(jié)占9%[21]。長期以來,資料搜集、整理、分析與閱讀工作主要由單個用戶獨立完成。每個科研人員都在獨立重復(fù)上述活動,相互之間難于共享勞動成果。從協(xié)同共贏視角來看,這種分散式勞動不利于提高科研效率,尤其在今天這個強調(diào)團(tuán)隊合作和協(xié)同攻關(guān)的年代。
  語義出版的出現(xiàn)有望改變現(xiàn)狀。從Bj€謗k的科學(xué)交流系統(tǒng)模型來看,在“交流結(jié)果”與“應(yīng)用知識”之間,出版商的增值性知識服務(wù)將給科研人員帶來極大便利[22]。語義出版正是一種增值性知識服務(wù),它把那些曾經(jīng)由科研人員各自獨立承擔(dān)的活動轉(zhuǎn)移給了出版商。與科研人員相比,學(xué)術(shù)出版商對于信息的深加工擁有天然優(yōu)勢:他們和作者聯(lián)系緊密,掌握大量原始資源,又擁有群體性的專業(yè)編輯。另外,出版機(jī)構(gòu)之間的合作相比于用戶個體之間的合作更加常規(guī)和便利。因此有能力的出版商借助元數(shù)據(jù)、自然語言處理、語義網(wǎng)、本體等技術(shù),能夠從源頭上做好基礎(chǔ)工作,實現(xiàn)信息的結(jié)構(gòu)化、關(guān)聯(lián)化、混合化、可操作化、可視化,把文章的理解、分析、綜述、聚合等活動先于用戶完成,使得科研人員能夠以盡可能少的搜索與整理工作獲得最多的可用科研信息。
  更為重要的是,由出版商來完成上述工作,實現(xiàn)了個體知識的社會化和知識共享。語義出版正在推動學(xué)術(shù)出版商從文獻(xiàn)提供者向知識服務(wù)者的角色轉(zhuǎn)變。它將普通科研人員從繁重的資料查找、組織和整理任務(wù)中解脫出來,減少其在資料查找環(huán)節(jié)消耗時間。這也正是增值性服務(wù)的價值所在。
 ?。?)語義出版將出版對象從論文擴(kuò)展到原始數(shù)據(jù),適應(yīng)了“數(shù)據(jù)密集型科學(xué)研究”信息共享的現(xiàn)實需要。
  數(shù)據(jù)密集型科學(xué)研究被學(xué)術(shù)界稱為科研的“第四范式”。它是指利用計算機(jī)軟件處理由各種儀器和模擬實驗產(chǎn)生的大量數(shù)據(jù),并將得到的知識和信息存儲在計算機(jī)中的科學(xué)研究方法[23]。對于數(shù)據(jù)密集型科學(xué)研究,數(shù)據(jù)共享有助于檢驗原始科學(xué)結(jié)論的正確性,并為多主體、新方法的數(shù)據(jù)挖掘提供可能,有利于提高龐大科學(xué)數(shù)據(jù)資源的利用率。為了滿足用戶對信息二次利用的需求,一些科技出版商開始借助XML語言在數(shù)字出版平臺上向用戶提供具有可操作性的原始數(shù)據(jù),如對各種報告、書籍和期刊中的數(shù)據(jù)表格提供原始表單數(shù)據(jù)、XML版式文檔和關(guān)聯(lián)數(shù)據(jù)集等。正如圖靈獎獲得者吉姆·格雷所說,互聯(lián)網(wǎng)的數(shù)據(jù)共享范圍并不限于研究論文全文的可獲取性,原則上,它能把所有的科學(xué)數(shù)據(jù)與文獻(xiàn)統(tǒng)一,創(chuàng)建數(shù)據(jù)和文獻(xiàn)的交互操作。科研用戶可以在閱讀某篇論文的同時查看原始數(shù)據(jù),甚至可以重做數(shù)據(jù)分析或者一邊查看數(shù)據(jù)一邊查閱這一數(shù)據(jù)的所有相關(guān)文獻(xiàn)。上述行為有利于提高科學(xué)的“信息速度”,并提高研究人員的科學(xué)生產(chǎn)力。語義出版將信息共享范圍從論文擴(kuò)展到具有可操作性的數(shù)據(jù),適應(yīng)了數(shù)據(jù)密集型科學(xué)研究的現(xiàn)實需要。
 ?。?) 語義出版將科學(xué)出版與知識組織單位由“文獻(xiàn)”細(xì)化到“知識單元”,豐富了科學(xué)交流系統(tǒng)中的資源類型,為知識組織與知識服務(wù)奠定了基礎(chǔ)。
  科學(xué)研究是一個依賴信息及其分析處理的過程。數(shù)字科學(xué)時代帶來了科技創(chuàng)新模式、知識形態(tài)、知識處理方式與科學(xué)交流形式的重大變化,導(dǎo)致了知識創(chuàng)造方式的改變以及科研工作流程的重大變革,由此呼吁新興知識服務(wù)機(jī)制的出現(xiàn)。面對日益復(fù)雜的科學(xué)問題,交叉融匯研究、轉(zhuǎn)移轉(zhuǎn)換型研究和戰(zhàn)略性創(chuàng)新要求知識架構(gòu)師能夠把跨領(lǐng)域的研究人員、信息內(nèi)容和分析過程有機(jī)融匯起來,形成新的知識基礎(chǔ)設(shè)施[24]。這些需求都在推動語義出版的產(chǎn)生和發(fā)展,學(xué)術(shù)出版機(jī)構(gòu)以往是、未來也將是知識基礎(chǔ)設(shè)施的重要構(gòu)建者。
  傳統(tǒng)學(xué)術(shù)出版中,科學(xué)工作者把在科學(xué)研究中取得的發(fā)現(xiàn)、發(fā)明、經(jīng)驗和教訓(xùn)等知識創(chuàng)新點組織成以篇為單位的文獻(xiàn)發(fā)表,基于文獻(xiàn)單元的知識共享和科學(xué)交流模式成為常規(guī)。隨著技術(shù)的進(jìn)步,一方面人類的認(rèn)知粒度和閱讀習(xí)慣發(fā)生了變化;另一方面,人們逐漸認(rèn)識到將知識控制單位由“文獻(xiàn)單元”深化到“知識單元”具有極大價值。1990年代,美國情報學(xué)家D. 斯萬森(D.Swanson)教授發(fā)現(xiàn)并證實了文獻(xiàn)間隱性關(guān)聯(lián)遠(yuǎn)多于顯性的由引文體現(xiàn)的關(guān)聯(lián),而這種隱性關(guān)聯(lián)的發(fā)現(xiàn)比情報本身的增長更有意義。揭示這種隱性知識網(wǎng)絡(luò)并實現(xiàn)知識單元的組織而非文獻(xiàn)單元的組織一直是情報學(xué)的終極目標(biāo)[25]。語義出版借助各種語義技術(shù)從文獻(xiàn)中抽取結(jié)構(gòu)組件構(gòu)成各種知識單元,并建立單獨的數(shù)據(jù)庫,為實現(xiàn)知識單元的自由存取、重組和利用創(chuàng)造了條件。在知識單元數(shù)據(jù)庫基礎(chǔ)上,通過知識單元語義鏈接和知識單元自由集成兩大系統(tǒng)[20],語義出版將在知識組織和知識服務(wù)發(fā)展道路上向前邁進(jìn)一大步。
  (4)語義出版為“戰(zhàn)略性閱讀”提供幫助,并為“宏知識”的發(fā)現(xiàn)與收割帶來便利。
  面對日益復(fù)雜的科學(xué)問題,科研人員越來越依賴“戰(zhàn)略性閱讀”(Strategicreading)。他們用索引和引文作為參考文獻(xiàn)的提示,摘要和評論作為論文全文的替代,以盡可能少的閱讀量快速瀏覽、評估和挖掘文章信息,同時搜索、過濾、比較、評注、分析多篇相關(guān)文章的內(nèi)容以發(fā)現(xiàn)特定領(lǐng)域的科研發(fā)展方向、路徑與趨勢[26]。這種閱讀的目的不是解決單一微觀問題,而是要獲得某一領(lǐng)域的“宏知識(MetaKnowledge)”[27]。宏知識的獲取顯然屬于一種高級的知識需求,需要更強大的科學(xué)交流系統(tǒng)作支撐。為了支持“常規(guī)性閱讀”和“戰(zhàn)略性閱讀”,語義出版系統(tǒng)通過文章自動關(guān)聯(lián)和本體捕捉工具,在多個層面建立多種形式的知識網(wǎng)絡(luò)以實現(xiàn)知識的自動整合、比對和分析,并利用增強型閱讀終端輔助科研人員快速和高效率地透視、學(xué)習(xí)和掌握宏知識。語義出版通過自動化和智能化手段提高了科研人員收割“宏知識”的效率,進(jìn)而使得他們有能力針對海量學(xué)術(shù)資源開展“戰(zhàn)略性閱讀”。語義出版正使得科學(xué)交流從過去發(fā)現(xiàn)一篇文章后的常規(guī)性閱讀向未來面向更宏觀問題的戰(zhàn)略性閱讀過渡。
  5 結(jié) 語
  從印刷期刊到電子期刊再到語義出版,科學(xué)交流系統(tǒng)的嬗變是革命性的。在語義出版這樣的破壞性和顛覆性技術(shù)的推動下,大型學(xué)術(shù)出版商建立的在線出版平臺不僅實現(xiàn)了知識組織和知識服務(wù),更配合科研“大數(shù)據(jù)”推動著“第四范式”的到來。在此過程中,語義出版將成為科研人員實施戰(zhàn)略閱讀和獲取學(xué)科“宏知識”的基礎(chǔ)平臺。
  目前,雖然在技術(shù)運用、表現(xiàn)方式和運營模式上,語義出版尚有諸多不完善,但是從發(fā)展趨勢來看,語義出版代表著學(xué)術(shù)出版發(fā)展的方向和科學(xué)交流的未來,它對科學(xué)交流系統(tǒng)的影響將是顛覆性的和深遠(yuǎn)的。
  注 釋
  [1]Renear A.H., Palmer C.L. Strategic reading and scientific discourse[C]. Workshop on Semantic Web Applications in Scientific Discourse. 8 the International Semantic Web Conference (ISWC 2009), 2009.10, Washington, DC
  [2]徐麗芳. 數(shù)字科學(xué)信息交流研究[M]. 武漢:武漢大學(xué)出版社,2008
  [3]Hurd J.M. The transformation of scientific communication: A model for 2020[J]. Journal of the American Society for Information Science,2000,51(14): 1279-1283
  [4]王曉光,陳孝禹.語義出版的概念與形式[J].出版發(fā)行研究,2011(11):54-56
  [5]張曉林. 顛覆數(shù)字圖書館的大趨勢[J]. 中國圖書館學(xué)報, 2011(37):4-11
  [6]肖衛(wèi)東,黃凱歌,徐振宇. 語義信息模型及應(yīng)用[M].北京:電子工業(yè)出版社,2002
  [7]Shotton D. Semantic Publishing: the coming revolution in scientific journal publishing[J]. Learned Publishing, 2009(22): 85-94
  [8]Shotton D., Portwin K., Graham K., Alistair M.. Adventures in Semantic Publishing: Exemplar Semantic Enhancements of a Research Article[J]. PLoS ComputationdcCidx9XqwAxQ9vDNYk2KIOR4iYMnBdcZL55W3yhQi0=al Biology 2009,5(4): e1000361
  [9]Shotton D., Portwin K.. Technical implementation of the semantic enhancements applied to Reis et al. Impact of environment and social gradient on Leptospira infection in urban slums[J]. PLoS Neglected Tropical Diseases,2009,2(4): e228
  [10]Pafilis E., O''Donoghue S.I., Jensen L.J., Horn H., Kuhn M., Brown N.P. and Schneider R. Reflect — augmented browsing for the life scientist[J]. Nature Biotechnology, 2009(27): 508-510
  [11] Wan S., Paris C. and Dale R.. Supporting browsing-specific information needs: Introducing the Citation-Sensitive In-Browser Summariser[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2010(8): 196-202
  [12]Attwood T.K., Kell D.B., McDermott P., Marsh J., Pettifer S.R. and Thorne D. Utopia documents: linking scholarly literature with research data[J]. Bioinformatics,2010,26: 568-574
  [13]Shotton D.. CiTO, the Citation Typing Ontology[J/OL]. [2012-03-05]. Journal of Biomedical Semantics,2010, 1(Suppl 1):S6.http://dx.doi.org/10.1186/2041-1480-1-S1-S6
  [14]Peroni S.,Shotton D.. FaBiO and CiTO: ontologies for describing bibliographic resources and citations [OL]. [2011-03-10] .http://imageweb.zoo.ox.ac.uk/pub/2011/publications/fabiocito_ontology_paper_PREPRINT.pdf
  [15]http://www.rsc.org/Publishing/Journals/ProjectProspect/
  [16]http://www.articleofthefuture.com/
  [17]http://www.pensoft.net/
  [18]http://www.opencalais.com/
  [19]http://www.schema.org/
  [20][26]溫有奎,焦玉英.基于知識元的知識發(fā)現(xiàn)[M]. 西安:西安電子科技大學(xué)出版社,2011
  [21]肖月. 一流的科學(xué)信息 推動一流的科學(xué)研究[OL]. [2012-03-10]. http://202.117.122.28/old/newindex/eresource/SCI-XDU-1205.pdf
  [22] Bjrk B.C. A model of scientific communication as a global distributed information system[J]. Information Research, 2007,12(2): 307
  [23]郎楊琴,孔麗華. 科學(xué)研究的第四范式:吉姆·格雷的報告“e-Science:一種科研模式的變革”簡介[J].科研信息化技術(shù)與應(yīng)用, 2010(20):92-94
  [24]張曉琳. 研究圖書館2020:嵌入式協(xié)作化知識實驗室[J]. 中國圖書館學(xué)報,2012,38(197):11-20
  [25]王曉光. 科學(xué)知識網(wǎng)絡(luò)的形成與演化(Ⅰ):共詞網(wǎng)絡(luò)方法的提出[J]. 情報學(xué)報,2009, 28(4): 599-605
  [27]Renear A H, Carole L P, Strategic Reading, Ontologies, and the Future of Scientific Publishing[J]. Science, 2009, 325
  [28]James A. Evans, Jacob G. Foster. Metaknowledge [J]. Science, 2011,331(6018): 721-7

筠连县| 仪陇县| 全州县| 米易县| 新昌县| 礼泉县| 磐安县| 景泰县| 西畴县| 长岭县| 廉江市| 磐安县| 平原县| 垦利县| 平南县| 十堰市| 岳阳市| 平原县| 遂昌县| 甘德县| 建水县| 岳西县| 秦皇岛市| 锡林郭勒盟| 黎川县| 桂东县| 图木舒克市| 乐昌市| 韩城市| 磴口县| 将乐县| 嘉鱼县| 冕宁县| 日土县| 台江县| 德令哈市| 名山县| 伽师县| 威信县| 老河口市| 高阳县|