杜偉 張靜
[摘 要] 分析數(shù)據(jù)出版遇到的挑戰(zhàn),介紹用知識(shí)螺旋模型出版數(shù)據(jù)的簡(jiǎn)單過(guò)程,并探討數(shù)據(jù)存儲(chǔ)庫(kù)如何采集高質(zhì)量數(shù)據(jù)。
[關(guān)鍵詞] 科學(xué)研究數(shù)據(jù) 數(shù)據(jù)出版 數(shù)據(jù)獲取
[中圖分類號(hào)] G237 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1009-5853 (2013) 06-0086-04
[Abstract] Analyze the issues faced by data publication,introduce the simple data publication process based on the knowledge spiral model,and expound how data repositories collect and store high-quality scientific research data.
[Key words] Research data Data publication Data acquiring
不僅 “大科學(xué)”有所謂的海量數(shù)據(jù)現(xiàn)象,所有學(xué)科都有產(chǎn)生大量原生數(shù)據(jù)和派生數(shù)據(jù)的趨勢(shì)。在科學(xué)技術(shù)飛速發(fā)展的今天,科學(xué)研究數(shù)據(jù)的作用越來(lái)越大,在數(shù)據(jù)發(fā)揮核心作用的所有研究中,對(duì)數(shù)據(jù)可驗(yàn)證性的期望不斷增加[1],而且為了進(jìn)行進(jìn)一步的研究,對(duì)現(xiàn)有數(shù)據(jù)集進(jìn)行重組或重新利用的需求也在不斷增加[2]。世界范圍內(nèi)的科學(xué)數(shù)據(jù)共享勢(shì)在必行,要實(shí)現(xiàn)共享就要做好科學(xué)數(shù)據(jù)的出版工作。國(guó)內(nèi)對(duì)此也有研究,王萍等提出基于網(wǎng)格技術(shù)的科學(xué)數(shù)據(jù)存儲(chǔ)與共享[3]。但是,目前數(shù)據(jù)出版還處于發(fā)展階段,數(shù)據(jù)文獻(xiàn)的狀況在各研究領(lǐng)域和各個(gè)學(xué)科有著很大差別。
1 數(shù)據(jù)出版中的問(wèn)題
和傳統(tǒng)的文字出版物相比,數(shù)據(jù)出版更具有挑戰(zhàn)性。每當(dāng)人們談及學(xué)期論文或畢業(yè)論文時(shí),考慮的幾乎都是文字出版物的類型,比如期刊論文、書(shū)籍等,很少會(huì)想到數(shù)據(jù)。而數(shù)據(jù)出版作為新生事物,在以下諸多方面都面臨著亟待解決的問(wèn)題。
1.1 文件格式
文字出版物的格式,如TXT、HTML、RTF、Word、OpenOffice、PDF、LaTeX等,已經(jīng)被全世界所有學(xué)科的研究人員廣泛使用。
科學(xué)研究數(shù)據(jù)也有幾種格式,如XML、電子表格、二進(jìn)制格式等,要根據(jù)某一領(lǐng)域的需要選擇所需要的格式。個(gè)別格式用標(biāo)準(zhǔn)工具不能打開(kāi),需要安裝專門的分析和可視化軟件。
1.2 內(nèi)容特征
科學(xué)研究數(shù)據(jù)比純文字研究論文的目的性更強(qiáng)。研究論文具有主觀性特征,因?yàn)閷?xiě)論文的目的就是傳播知識(shí)。為此,作者建立了具有邏輯性和引導(dǎo)性的結(jié)構(gòu),突出重要方面,解釋數(shù)據(jù),使用表格、數(shù)字和圖片來(lái)進(jìn)行具體陳述。
而數(shù)據(jù)文件往往直接或間接由計(jì)算機(jī)或儀器產(chǎn)生。一般情況下,對(duì)文件有嚴(yán)格的標(biāo)準(zhǔn)要求,并由計(jì)算機(jī)輸出和進(jìn)行優(yōu)化處理。因此,數(shù)據(jù)文件客觀而清晰,一般情況下不需要人工檢查。
1.3 科學(xué)質(zhì)量保障
文字性出版物的科學(xué)質(zhì)量保障,一般以同行評(píng)審方式來(lái)實(shí)現(xiàn)。對(duì)一篇論文來(lái)說(shuō),編輯主要審閱作者的主張、邏輯性及對(duì)其他出版物的引用。同行評(píng)審即審閱人,其往往是同一領(lǐng)域的專家,要對(duì)主題有深刻理解。此外,由于論文是為了讓讀者閱讀,所以要對(duì)其進(jìn)行優(yōu)化,并且還對(duì)頁(yè)碼有限制。
比較而言,數(shù)據(jù)是龐大的,而且數(shù)據(jù)存儲(chǔ)方式不可能優(yōu)化到使讀者都容易接受的程度。所以,多數(shù)情況下,數(shù)據(jù)的科學(xué)質(zhì)量保障不能做到完全使人滿意,而且一般都要依賴于計(jì)算機(jī)的幫助。怎樣對(duì)數(shù)據(jù)進(jìn)行科學(xué)質(zhì)量保障還不是很明確。此外,數(shù)據(jù)的科學(xué)質(zhì)量保障在很大程度上還要看數(shù)據(jù)類型及其所屬的研究領(lǐng)域。而除了原始數(shù)據(jù)本身,還需要對(duì)元數(shù)據(jù)進(jìn)行審核??傊?,科學(xué)數(shù)據(jù)的審閱人員必須具有相應(yīng)的能力和軟件工具使用技能才可能進(jìn)行質(zhì)量控制。由于上述困難,對(duì)數(shù)據(jù)質(zhì)量的控制往往不是靠同行評(píng)審,而是靠作者自己。
1.4 版式質(zhì)量保障和技術(shù)質(zhì)量保障
文字性出版物的版式質(zhì)量保障主要集中在處理文字、排版和結(jié)構(gòu)方面。一般來(lái)說(shuō),這個(gè)過(guò)程審閱人不需要對(duì)內(nèi)容有更深的理解。它是科學(xué)出版物質(zhì)量保障的一小部分內(nèi)容。
對(duì)于數(shù)據(jù)文件,應(yīng)該稱為技術(shù)質(zhì)量保障。這個(gè)過(guò)程要對(duì)數(shù)據(jù)進(jìn)行驗(yàn)證,確保數(shù)據(jù)從源頭到目標(biāo)位置的無(wú)差錯(cuò)傳輸。在此過(guò)程中,評(píng)審員要檢查數(shù)據(jù)是否完整,是否有異常。
1.5 瀏覽和檢索
研究論文直接包含檢索詞,而且有明確的元數(shù)據(jù),分類和索引過(guò)程相對(duì)簡(jiǎn)單。數(shù)據(jù)庫(kù)支持所有前面提到的文本文件格式。
如果數(shù)據(jù)文件格式不能被搜索引擎識(shí)別,或者數(shù)據(jù)本身非常大,那么數(shù)據(jù)文件的索引就必須限制在給定的元數(shù)據(jù)中,因此,數(shù)據(jù)文件的元數(shù)據(jù)是瀏覽和檢索的關(guān)鍵。
1.6 存儲(chǔ)地址
純文字文獻(xiàn),即使是綜合出版物也可以保存為單個(gè)文獻(xiàn),并存儲(chǔ)在倉(cāng)儲(chǔ)中。因此,倉(cāng)儲(chǔ)可作為長(zhǎng)期存放地址,直接滿足用戶獲取論文的需求。
數(shù)據(jù)文件處理時(shí),面對(duì)的往往是千兆字節(jié)或萬(wàn)兆字節(jié)的龐大數(shù)據(jù)文件。文件的大小帶來(lái)存儲(chǔ)空間、帶寬、備份系統(tǒng)及成本方面的問(wèn)題。通常情況下,文本庫(kù)不能滿足管理龐大數(shù)據(jù)文件的需要。數(shù)據(jù)文件允許鏈接到外部資源,但伴隨著打不開(kāi)鏈接及同步發(fā)展等問(wèn)題[4]。
2 數(shù)據(jù)出版過(guò)程
2.1 知識(shí)獲取
知識(shí)獲取是全人類特別是研究人員不可或缺的。知識(shí)以隱性知識(shí)和顯性知識(shí)兩種形式存在。這兩種形式通過(guò)社會(huì)化、內(nèi)部化、外部化及其融合進(jìn)行轉(zhuǎn)化。就出版物而言,有內(nèi)部化和外部化兩個(gè)相關(guān)轉(zhuǎn)化。內(nèi)部化描述從顯性知識(shí)到隱性知識(shí)的轉(zhuǎn)化。外部化是用顯性知識(shí)表達(dá)隱性知識(shí)的過(guò)程。對(duì)研究人員來(lái)說(shuō),可以把閱讀出版物和觀看演示從而接受各種信息并從中學(xué)習(xí)稱為內(nèi)部化。外部化指?jìng)€(gè)人的信息傳播,例如會(huì)議中的演示或出版學(xué)術(shù)論文等。
從公眾角度來(lái)看,一些研究人員的內(nèi)部化狀態(tài)和其他研究人員的外部化狀態(tài)可以相互產(chǎn)生作用。這種情況出現(xiàn)在某一研究人員的需求正好是其他研究人員提供的信息產(chǎn)品的場(chǎng)合。
Nonaka等強(qiáng)調(diào)知識(shí)創(chuàng)新的關(guān)鍵在于隱性知識(shí)的調(diào)用和轉(zhuǎn)化,并提出著名的知識(shí)螺旋模型。知識(shí)的獲取被比喻成旋轉(zhuǎn)的螺旋。假設(shè)在每一個(gè)繞組中,研究人員首先處于內(nèi)部化狀態(tài),在此狀態(tài)下,他必須學(xué)習(xí),如通過(guò)讀書(shū)或聽(tīng)報(bào)告(和其他人員的外部化輸出相對(duì)應(yīng));然后轉(zhuǎn)移到外部化狀態(tài),在這種狀態(tài)下,研究人員寫(xiě)文章或作演示[5]。
2.2 數(shù)據(jù)出版周期
Andreas Hense等根據(jù)上面提到的螺旋單繞組,得到一個(gè)簡(jiǎn)化的數(shù)據(jù)出版過(guò)程,即:內(nèi)部化——搜索和瀏覽、審核和學(xué)習(xí)、實(shí)驗(yàn);外部化——解釋和注釋數(shù)據(jù)、執(zhí)行質(zhì)量保障、出版和展示數(shù)據(jù)(如圖1所示)[6]。
圖1 數(shù)據(jù)出版周期
2.2.1 搜索和瀏覽
新的研究往往開(kāi)始于對(duì)相關(guān)數(shù)據(jù)的檢索和瀏覽。研究人員的出發(fā)點(diǎn)和工具取決于研究人員的研究領(lǐng)域和個(gè)人習(xí)慣。使用特定數(shù)據(jù)庫(kù),最明顯的取舍標(biāo)準(zhǔn)是數(shù)據(jù)庫(kù)收錄條目的質(zhì)量和數(shù)量,這直接決定數(shù)據(jù)庫(kù)的質(zhì)量。研究人員是否給數(shù)據(jù)存儲(chǔ)庫(kù)提交研究成果,取決于存儲(chǔ)庫(kù)是否有吸引力,而存儲(chǔ)庫(kù)是否有吸引力很明顯取決于其質(zhì)量,如功能、設(shè)計(jì)、性能、穩(wěn)定性、易用性等,但同時(shí)也受使用參數(shù)、可接受性和社會(huì)聲譽(yù)等因素的影響。
2.2.2 審核和學(xué)習(xí)
獲取數(shù)據(jù)后,研究人員審核數(shù)據(jù)及處理數(shù)據(jù),包括熟悉及學(xué)習(xí)數(shù)據(jù)的各種活動(dòng)。這是內(nèi)部化階段的基本程序,因?yàn)樵谶@一階段有一個(gè)明顯的隱性知識(shí)向顯性知識(shí)轉(zhuǎn)化的過(guò)程。
2.2.3 實(shí) 驗(yàn)
研究人員在此活動(dòng)中,把新學(xué)到的知識(shí)應(yīng)用于新的研究。這可以通過(guò)開(kāi)展新型實(shí)驗(yàn)或從不同角度處理數(shù)據(jù)來(lái)完成。因此,研究人員可能會(huì)獲得新數(shù)據(jù),并展開(kāi)新研究。
2.2.4 解釋和注釋數(shù)據(jù)
這項(xiàng)活動(dòng)涉及數(shù)據(jù)公布的準(zhǔn)備工作,因此是外部化階段的首個(gè)活動(dòng)。由于數(shù)據(jù)文件非常簡(jiǎn)單,研究人員需要對(duì)這些數(shù)據(jù)進(jìn)行解釋或注釋,以吸引其他科研人員。這個(gè)工作可通過(guò)編寫(xiě)一個(gè)數(shù)據(jù)文件來(lái)完成,要強(qiáng)調(diào)有意義的部分。為了將來(lái)使用或者在存儲(chǔ)庫(kù)中能夠檢索,必須增加元數(shù)據(jù)。
2.2.5 執(zhí)行質(zhì)量保障
質(zhì)量保障最簡(jiǎn)單的方式是由作者自己執(zhí)行,但眾所周知,作者很難發(fā)現(xiàn)自己的錯(cuò)誤。更高級(jí)的方式是同行評(píng)審,一個(gè)或多個(gè)研究人員審查文章和數(shù)據(jù),如果不能達(dá)到格式或科學(xué)的質(zhì)量標(biāo)準(zhǔn),可以拒絕接受。這種方法被多數(shù)存儲(chǔ)庫(kù)和科技期刊采用。對(duì)于要出版的數(shù)據(jù)文件來(lái)說(shuō),可以延伸為對(duì)數(shù)據(jù)及其元數(shù)據(jù)的質(zhì)量控制。
2.2.6 出版和展示數(shù)據(jù)
數(shù)據(jù)文件及其元數(shù)據(jù)和附加文件的質(zhì)量得到保證后,就要出版或者存儲(chǔ)這些數(shù)據(jù)。“出版”指存儲(chǔ)在一個(gè)公眾共享并可長(zhǎng)期利用的空間,并分配一個(gè)可長(zhǎng)期使用的標(biāo)識(shí)符號(hào),如DOI或URN等。而“展示”指的是上傳到搜索引擎或存儲(chǔ)庫(kù)目錄中,并能夠被檢索。數(shù)據(jù)出版后想改變數(shù)據(jù)雖然說(shuō)在技術(shù)上是可行的,但常用的做法是這些數(shù)據(jù)會(huì)被鎖定(具有不變性),只能再發(fā)布新版本的修正數(shù)據(jù)。此項(xiàng)活動(dòng)結(jié)束后,另一個(gè)研究人員可以開(kāi)始新的數(shù)據(jù)出版周期,再次從“搜索”和“瀏覽”開(kāi)始。
3 數(shù)據(jù)存儲(chǔ)庫(kù)如何采集高質(zhì)量數(shù)據(jù)
數(shù)據(jù)存儲(chǔ)庫(kù)怎樣才能獲取高質(zhì)量的研究數(shù)據(jù)?首先存儲(chǔ)庫(kù)要對(duì)研究人員有吸引力,包括在內(nèi)部化和外部化階段都應(yīng)如此。只有存儲(chǔ)庫(kù)能吸引足夠的研究人員提交高質(zhì)量的研究數(shù)據(jù),才會(huì)有越來(lái)越多的研究人員利用這些數(shù)據(jù)集。存儲(chǔ)庫(kù)是否有吸引力有賴于下面3個(gè)因素:聲譽(yù),如果一個(gè)存儲(chǔ)庫(kù)擁有研究數(shù)據(jù)質(zhì)量高的聲譽(yù),其出版的數(shù)據(jù)將獲得很高的知名度,對(duì)研究者來(lái)說(shuō)就具有很高價(jià)值??煽啃?,如果存儲(chǔ)庫(kù)的運(yùn)營(yíng)得到機(jī)構(gòu)資助并有著悠久的傳統(tǒng),研究人員會(huì)相信它們的數(shù)據(jù)存儲(chǔ)是安全和長(zhǎng)期的。過(guò)程,如果提交數(shù)據(jù)的過(guò)程和質(zhì)量保障過(guò)程有據(jù)可查,并且用戶界面友好,并能降低數(shù)據(jù)提交者的工作量,研究人員就會(huì)產(chǎn)生信任。
根據(jù)前面提到的數(shù)據(jù)出版周期,高質(zhì)量的數(shù)據(jù)采集主要發(fā)生在外部化階段,所以下面主要介紹“解釋和注釋數(shù)據(jù)”“執(zhí)行質(zhì)量保障”“出版和展示數(shù)據(jù)”三個(gè)環(huán)節(jié)的工作。
3.1 解釋和注釋數(shù)據(jù)
首先要考慮研究人員是否愿意公開(kāi)自己的研究數(shù)據(jù)。有些研究人員對(duì)數(shù)據(jù)公開(kāi)的意義還不是很明確,但不久的將來(lái),在以數(shù)據(jù)為中心的學(xué)科,對(duì)其研究人員的評(píng)價(jià)將不僅通過(guò)他們的文字出版物也要通過(guò)數(shù)據(jù)出版物以及相應(yīng)的引文來(lái)進(jìn)行[6]。
很多研究人員往往不知道在哪里可以永久存儲(chǔ)數(shù)據(jù),數(shù)據(jù)出版對(duì)他們來(lái)說(shuō)是困難和昂貴的。著名的澳大利亞研究協(xié)作服務(wù)(Australian Research Collaboration Service, ARCS)項(xiàng)目提供了成功的案例。該項(xiàng)目旨在給澳大利亞研究人員提供數(shù)據(jù)存儲(chǔ)、傳輸、訪問(wèn)和共享的工具和服務(wù)。其中 “數(shù)據(jù)組織” 服務(wù)提供免費(fèi)的數(shù)據(jù)存儲(chǔ)功能,數(shù)據(jù)還可以共享。這項(xiàng)服務(wù)旨在盡快把數(shù)據(jù)存儲(chǔ)在“數(shù)據(jù)組織”中以優(yōu)化協(xié)作,減少數(shù)據(jù)冗余,并避免滯后傳輸增加的步驟?!皵?shù)據(jù)組織”還有一個(gè)顯著特點(diǎn)即操作系統(tǒng)集成,并可在其他網(wǎng)站上進(jìn)行數(shù)據(jù)備份[7]。太陽(yáng)能、地球物理及相關(guān)的環(huán)境數(shù)據(jù)可存儲(chǔ)在“世界數(shù)據(jù)中心系統(tǒng)”(World Data Center System,為WDC)。這些學(xué)科的研究人員可以進(jìn)入該數(shù)據(jù)中心。中心分布在世界各地,提交的數(shù)據(jù)可長(zhǎng)期存檔[8]。
除了數(shù)據(jù)存儲(chǔ)以外,還要用元數(shù)據(jù)對(duì)原始數(shù)據(jù)進(jìn)行注釋。為了避免出現(xiàn)錯(cuò)誤,應(yīng)盡可能早地捕獲元數(shù)據(jù),即在原始數(shù)據(jù)收割時(shí)就加入元數(shù)據(jù)。
3.2 執(zhí)行質(zhì)量保障
科學(xué)數(shù)據(jù)的質(zhì)量保障有科學(xué)質(zhì)量保障和技術(shù)質(zhì)量保障之分。其中技術(shù)質(zhì)量保障程序通過(guò)技術(shù)規(guī)范,如可接受的文件格式或具體的XML架構(gòu)來(lái)執(zhí)行。技術(shù)質(zhì)量保障是一個(gè)系統(tǒng)化的程序??茖W(xué)質(zhì)量保障需要計(jì)算機(jī)支持,特別是批量或大量數(shù)據(jù)的處理。原始數(shù)據(jù)的質(zhì)量保障一般主要靠作者自己。這個(gè)過(guò)程中作者可借助軟件工具,例如檢查數(shù)據(jù)工具、可視化數(shù)據(jù)工具及數(shù)據(jù)的異常提示工具等。
由德國(guó)研究基金會(huì)(German Research Foundation,DFG)資助的研究項(xiàng)目“環(huán)境數(shù)據(jù)公布”(Publication of Environmental Data),在實(shí)施過(guò)程中開(kāi)發(fā)了獨(dú)立的審查氣象數(shù)據(jù)的軟件包。該軟件包根據(jù)用戶參數(shù)對(duì)異常數(shù)據(jù)和其他偏差進(jìn)行檢測(cè),然后經(jīng)過(guò)分析撰寫(xiě)XML報(bào)告。這個(gè)報(bào)告和數(shù)據(jù)一起提交到可長(zhǎng)期存放的存儲(chǔ)庫(kù)中,這就是保障科學(xué)質(zhì)量的措施[9]。
核查元數(shù)據(jù)是科學(xué)質(zhì)量保障的另一個(gè)重要組成部分。上述研究項(xiàng)目也涉及這個(gè)問(wèn)題。一個(gè)基于萬(wàn)維網(wǎng)的軟件從相關(guān)長(zhǎng)期存放庫(kù)中讀取現(xiàn)有元數(shù)據(jù),并以一系列主題分化的形式呈現(xiàn)元數(shù)據(jù),用戶可以逐步跟進(jìn),其功能類似于一個(gè)軟件安裝向?qū)А?/p>
3.3 出版與展示數(shù)據(jù)
數(shù)據(jù)的出版過(guò)程即數(shù)據(jù)的存儲(chǔ)和識(shí)別,數(shù)據(jù)的展示過(guò)程即在存儲(chǔ)庫(kù)儲(chǔ)存后用搜索引擎可以查詢。澳大利亞“國(guó)家數(shù)據(jù)服務(wù)”(Australian National Data Service,ANDS )旨在幫助研究人員發(fā)布、挖掘、訪問(wèn)和利用研究數(shù)據(jù)。有些特殊服務(wù)如“發(fā)布我的數(shù)據(jù)(Publish My Data)”服務(wù),幫助研究員用元數(shù)據(jù)出版研究數(shù)據(jù);“注冊(cè)我的數(shù)據(jù)(Register My Data)”服務(wù),協(xié)助研究人員和研究機(jī)構(gòu)宣傳他們的研究數(shù)據(jù);“識(shí)別我的數(shù)據(jù)(Identify My Data)”服務(wù),給研究人員的數(shù)據(jù)提供永久標(biāo)識(shí)符[10-11]。
科學(xué)是無(wú)國(guó)界的。這也正是幾個(gè)國(guó)家機(jī)構(gòu)于2010年1月聯(lián)合建立國(guó)際性的DataCite的原因。DataCite是一個(gè)不以盈利為目的的機(jī)構(gòu),如果組織注冊(cè)研究數(shù)據(jù)集,就將分配到一個(gè)永久標(biāo)識(shí)符。這將減少基礎(chǔ)設(shè)施成本,更好地整合國(guó)家基礎(chǔ)設(shè)施和先進(jìn)的搜索功能,以改善研究人員的數(shù)據(jù)集意識(shí)。
4 小 結(jié)
科學(xué)數(shù)據(jù)出版在我國(guó)還是一個(gè)嶄新的研究領(lǐng)域。我國(guó)科學(xué)數(shù)據(jù)出版和共享在實(shí)踐中還存在許多問(wèn)題。針對(duì)科學(xué)數(shù)據(jù)重復(fù)生成、投入大,科研單位輕視科學(xué)數(shù)據(jù)的出版和管理,科學(xué)數(shù)據(jù)流失嚴(yán)重,科學(xué)數(shù)據(jù)獲取困難等問(wèn)題,本文介紹了一個(gè)簡(jiǎn)單的數(shù)據(jù)出版過(guò)程,并指出數(shù)據(jù)存儲(chǔ)庫(kù)是科學(xué)數(shù)據(jù)存儲(chǔ)和獲取的一種重要方式。
注 釋
[1]Steve Androulakis, Ashley M Buckle, Ian Atkinson, et al. Archer — e-research tools for research data management[J]. The International Journal of Digital Curation,2009(1):22-33
[2]Plale B, Gannon D, Alameda J. Active management of scientific data[J]. Internet Computing, IEEE, 2005,9(1):27-34
[3]王萍,趙丹陽(yáng),王玉超. 基于網(wǎng)格技術(shù)的科學(xué)數(shù)據(jù)存儲(chǔ)與共享[J].圖書(shū)情報(bào)工作,2011(13):63-66
[4]Andrew Treloar, David Groenewegen, Cathrine Harboe-Ree. The Data Curation Continuum: Managing Data Objects in Institutional Repositories[J/OL]. [ 2012-10-20]. http://www.dlib.org/dlib/september07/treloar/09treloar.html
[5]Nonaka Ikujiro, Toyama Ryoko, Noboru Konno. SECI, Ba and Leadership: a Unified Model of Dynamic Knowledge Creation[J].Long Range Planning,2000,33(1):5-34
[6]Andreas Hense, Florian Quadt. Acquiring High Quality Research Data[J/OL]. [ 2012-11-20].http://www.dlib.org/dlib/january11/hense/01hense.html
[7]ARCS. Data Services Overview[EB/OL]. [2012-12-01].http://www.arcs.org.au/index.php/services/data-services
[8]ICSU. World Data System[EB/OL]. [2012-03-01].http://www.icsu-wds.org/
[9]Andreas N Hense. Publication of Environmental Data[EB/OL]. [2012-12-08].http://misc.jisc.ac.uk/vre/projects/publication-environmental-data
[10]Adrian Burton, Andrew Treloar. Publish my data: A composition of services from ANDS and ARCS[C].In 2009 Fifth IEEE International Conference on e-Science. United Kingdom: Oxford, 2009 :164-170
[11]Stefanie Kethers, Xiaobin Shen, Andrew E, et al. Discovering Australia's Research Data[C/OL].[2012-10-01].http://andrew.treloar.net/research/publications/jcdl2010/jcdl158-kethers.pdf
(收稿日期:2013-03-23)