国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

社會科學(xué)數(shù)據(jù)管理與服務(wù)平臺研究

2020-11-06 07:27王丹丹任婧媛吳思潔
現(xiàn)代情報 2020年11期
關(guān)鍵詞:數(shù)據(jù)平臺社會科學(xué)德國

王丹丹 任婧媛 吳思潔

基金項目:國家社會科學(xué)基金項目“社會科學(xué)科研數(shù)據(jù)的管理服務(wù)研究”(項目編號:18BTQ070)。

作者簡介:王丹丹(1980-),女,教授,博士,研究方向:科研數(shù)據(jù)管理。任婧媛(1994-),女,碩士研究生,研究方向:科研數(shù)據(jù)管理。吳思潔(1996-),女,碩士研究生,研究方向:科研數(shù)據(jù)管理。

摘要:[目的/意義]對德國社會科學(xué)數(shù)據(jù)管理與服務(wù)平臺SowiDataNet|Datorium進行研究,揭示其特色和成功經(jīng)驗,為我國開發(fā)國家層面的社會科學(xué)公共數(shù)據(jù)平臺提供參考。[方法/過程]利用文獻調(diào)研和案例分析方法,以德國為例,通過對文獻資料和網(wǎng)站內(nèi)容的調(diào)查,獲取一手資料闡述德國社會科學(xué)數(shù)據(jù)管理與服務(wù)平臺SowiDataNet|Datorium的構(gòu)建情況、功能與特色以及先進經(jīng)驗。[結(jié)果/結(jié)論]盡快建立我國國家層面的社會科學(xué)公共數(shù)據(jù)平臺,該平臺應(yīng)采取分工協(xié)作,協(xié)同建設(shè)的方式;應(yīng)考慮將機構(gòu)用戶作為重要服務(wù)對象,提供面向機構(gòu)的服務(wù);應(yīng)通過完善數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范審核流程的方式加強對數(shù)據(jù)質(zhì)量的控制;應(yīng)考慮提供靈活的數(shù)據(jù)訪問權(quán)限選擇,并適當(dāng)降低使用門檻,以在最初階段最大程度地推動平臺的使用。

關(guān)鍵詞:社會科學(xué);科研數(shù)據(jù);科學(xué)數(shù)據(jù)管理;數(shù)據(jù)平臺;德國

DOI:10.3969/j.issn.1008-0821.2020.11.010

〔中圖分類號〕G25074〔文獻標(biāo)識碼〕A〔文章編號〕1008-0821(2020)11-0099-08

Research on Social Science Data Management and Service Platform

——The Experience of German

Wang DandanRen JingyuanWu Sijie

(College of Management,Henan University of Science and Technology,Luoyang 471023,China)

Abstract:[Purpose/Significance]Research on the German social science data management and service platform SowiDataNet|Datorium,to reveal its characteristics and successful experience,and provide a reference for China to develop a national-level social science public research data repository.[Method/Process]Using literature research and case analysis methods,taking Germany as an example,through the investigation of literature and website content,obtained the first-hand information to explain the construction,functions and characteristics of SowiDataNet|Datorium and advanced experience.[Result/Conclusion]A national-level social science public research data repository should be established as soon as possible in China.The repository should take the form of division of labor,collaboration and collaborative construction;at the same time,should consider institutional users as important service targets,provide agency-oriented services;provide more flexible data access permission options and lower the use threshold appropriately to maximize the use of the platform in the initial stage.

Key words:social science;research data;scientific data management;data platform;German

社會科學(xué)科研數(shù)據(jù)主要集中在社會、經(jīng)濟領(lǐng)域。社會科學(xué)數(shù)據(jù)管理與服務(wù)平臺對于切實改變傳統(tǒng)的科研數(shù)據(jù)私有觀念,打破信息壁壘,實現(xiàn)科研數(shù)據(jù)的合理流通和最大限度地共享起著舉足輕重的作用[1]。歐美主流的社會科學(xué)數(shù)據(jù)研究機構(gòu),均構(gòu)建了社會科學(xué)科研數(shù)據(jù)平臺開展科研數(shù)據(jù)管理并提供服務(wù)[2]。近年來,國內(nèi)的一些機構(gòu)和高校也逐漸認(rèn)識到社會科學(xué)數(shù)據(jù)管理與服務(wù)平臺構(gòu)建的重要性,并逐步開展這方面的實踐。出現(xiàn)了復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺、北京大學(xué)開放研究數(shù)據(jù)平臺、中國人民大學(xué)中國國家調(diào)查數(shù)據(jù)庫、湖南大學(xué)經(jīng)濟數(shù)據(jù)研究中心等機構(gòu)層面的平臺。但整體而言,處于起步探索階段,平臺功能遠(yuǎn)不夠完善,國家層面面向社會科學(xué)學(xué)科領(lǐng)域的公共數(shù)據(jù)平臺尚未出現(xiàn),由于缺乏技術(shù)和服務(wù)支撐,大部分高校和科研機構(gòu)的社會科學(xué)科研數(shù)據(jù)缺乏應(yīng)有的重視,處于流失狀態(tài)。

德國是世界主要經(jīng)濟強國之一,是歐盟國家中重視信息化建設(shè)、信息化程度較高的國家之一,也是開放獲取思想和倡議的發(fā)起者及實踐先驅(qū)之一[3]。作為歐洲開放科學(xué)云(EOSC)計劃的主要參與者和推動者,一直負(fù)責(zé)通用數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)工作。2014年,在全面收集和分析科研機構(gòu)的需求后,由德國萊布尼茨學(xué)會資助,萊布尼茨社會科學(xué)研究所、萊布尼茨經(jīng)濟學(xué)信息中心、柏林社會科學(xué)中心和德國經(jīng)濟研究所合作開發(fā)了社會科學(xué)科研數(shù)據(jù)平臺SowiDataNet|Datorium,它是面向具體學(xué)科領(lǐng)域的國家層面的公共數(shù)據(jù)平臺,目標(biāo)是支持實現(xiàn)德國社會經(jīng)濟學(xué)領(lǐng)域科研數(shù)據(jù)的統(tǒng)一存儲、安全歸檔和集中獲取[4]。鑒于此,對SowiDataNet|Datorium進行全面的調(diào)研和分析,將國內(nèi)5個平臺與SowiDataNet|Datorium進行對比,總結(jié)SowiDataNet|Datorium的特色與經(jīng)驗,為我國構(gòu)建國家層面的社會科學(xué)公共數(shù)據(jù)平臺提供啟發(fā)和參考。

11平臺簡介

SowiDataNet(https://sowidatanet.de/)項目重點是集中和共享德國社會經(jīng)濟科學(xué)領(lǐng)域的科研數(shù)據(jù),其核心是SowiDataNet|Datorium,一個基于Web的科研數(shù)據(jù)平臺,通過與德國社會科學(xué)領(lǐng)域最大的基礎(chǔ)設(shè)施提供商GESIS合作,為社會經(jīng)濟科學(xué)領(lǐng)域科研數(shù)據(jù)的交流和長期獲取創(chuàng)造一個穩(wěn)定環(huán)境,其目的是:1)為科研機構(gòu)、科研人員個人和期刊提供科研數(shù)據(jù)基礎(chǔ)架構(gòu);2)匯集不同來源和數(shù)據(jù)提供者的科研數(shù)據(jù);3)確保安全的數(shù)據(jù)存儲和對數(shù)據(jù)的集中訪問;4)促進德國數(shù)據(jù)共享文化;5)通過簡化數(shù)據(jù)共享過程,加強有關(guān)數(shù)據(jù)管理的知識,減少數(shù)據(jù)共享的不便性[5]。該平臺有3類用戶:一是科研人員。社會和經(jīng)濟科學(xué)領(lǐng)域的科研人員被邀請作為數(shù)據(jù)存儲者,將定量數(shù)據(jù)、代碼、元數(shù)據(jù)和其他相關(guān)文檔上載到平臺庫中,并建立與相關(guān)出版物的鏈接。通過選擇訪問類別和許可,存儲者可以確定數(shù)據(jù)獲取條件;二是數(shù)據(jù)用戶。對于有興趣重復(fù)使用數(shù)據(jù)的數(shù)據(jù)用戶,SowiDataNet|Datorium提供了便捷的搜索功能。三是科研機構(gòu)。對于沒有機構(gòu)自己的數(shù)據(jù)基礎(chǔ)設(shè)施用于歸檔和發(fā)布科研數(shù)據(jù)的機構(gòu),SowiDataNet|Datorium提出了面向機構(gòu)科研數(shù)據(jù)管理的工作流程,并提供了可靠的數(shù)據(jù)出版平臺。但是,使用SowiDataNet|Datorium來管理和發(fā)布科研數(shù)據(jù)的機構(gòu)需要與GESIS簽訂合同。

SowiDataNet|Datorium的開發(fā)借鑒了GESIS數(shù)據(jù)共享平臺Datorium的開發(fā)經(jīng)驗。Datorium專注于社會科學(xué)科研人員個人的數(shù)據(jù)。在Datorium中,科研人員可以自行記錄、共享、管理和發(fā)布其數(shù)據(jù),使數(shù)據(jù)可見并可用[6]。SowiDataNet|Datorium則專注于機構(gòu)的數(shù)據(jù),解決德國只有少數(shù)科研機構(gòu)能夠使用自己的資源來構(gòu)建可持續(xù)運行的科研數(shù)據(jù)基礎(chǔ)架構(gòu)這一問題,它特別強調(diào)平臺與機構(gòu)科研數(shù)據(jù)管理實際工作流之間的靈活銜接,強調(diào)要考慮經(jīng)濟科學(xué)領(lǐng)域和科學(xué)機構(gòu)的特殊需求。為此,SowiDataNet|Datorium調(diào)整了Datorium所有的工作流程、元數(shù)據(jù)字段、受控詞表以及數(shù)據(jù)監(jiān)管過程等,還增加了數(shù)據(jù)版本控制。GESIS致力于整合Datorium和SowiDataNet,目前SowiDataNet|Datorium已被集成到GESIS的存儲和發(fā)布服務(wù)中。

12數(shù)據(jù)服務(wù)

121數(shù)據(jù)存儲者

SowiDataNet對“科研數(shù)據(jù)”進行了廣泛定義以涵蓋各種數(shù)據(jù)類型。平臺中可能包含由實證研究工具新生成的一次數(shù)據(jù)和從現(xiàn)有信息中推斷出的二次數(shù)據(jù),可以整合一次數(shù)據(jù)和二次數(shù)據(jù),以及用于數(shù)據(jù)轉(zhuǎn)換和分析的程序或腳本。此外,還可以提供便于以后使用數(shù)據(jù)的文檔(如問卷、代碼簿或技術(shù)報告)。要將數(shù)據(jù)提交到SowiDataNet|Datorium中,數(shù)據(jù)存儲者首先必須注冊,并在注冊表格中輸入地址和與機構(gòu)的隸屬關(guān)系。注冊完成后即可在SowiDataNet|Datorium中上傳和存儲數(shù)據(jù),數(shù)據(jù)發(fā)布之前,GESIS的負(fù)責(zé)人將對其進行審查。如果存儲者所屬機構(gòu)與GESIS簽訂了SowiDataNet|Datorium的使用合同,那么SowiDataNet|Datorium會將數(shù)據(jù)同步分配給機構(gòu),由機構(gòu)管理員進行審查。具體步驟是:

第一步,科研人員建立新的數(shù)據(jù)項目,上傳數(shù)據(jù),附上問卷、代碼本或語法文件,并使用標(biāo)準(zhǔn)化元數(shù)據(jù)進行描述。在編輯過程中,可以使用評論功能記錄未解決的問題和開放問題,評論內(nèi)容會及時轉(zhuǎn)發(fā)給管理者。一旦完成數(shù)據(jù)上傳,數(shù)據(jù)就會被轉(zhuǎn)移到機構(gòu)數(shù)據(jù)池中。第二步,機構(gòu)管理員訪問數(shù)據(jù)池,選擇項目進行內(nèi)容審查。管理員會根據(jù)正式標(biāo)準(zhǔn)(即可讀性、完整性、數(shù)據(jù)保護規(guī)定和正確描述)檢查數(shù)據(jù)、元數(shù)據(jù)和文檔。如必要,管理員在與相關(guān)科研人員討論并達成一致后可修改或更正文件。SowiDataNet|Datorium提供了一個標(biāo)準(zhǔn)化的檢查表來幫助機構(gòu)數(shù)據(jù)管理員審查所提交的數(shù)據(jù)(如圖1)。未來,計劃開發(fā)面向特定科研機構(gòu)的檢查表。第三步,機構(gòu)完成審查后,管理員把數(shù)據(jù)發(fā)送給GESIS,由GESIS的管理員進行再審查,通過后,注冊服務(wù)da|ra為數(shù)據(jù)分配DOI,并使數(shù)據(jù)及其元數(shù)據(jù)在da|ra、DataCite元數(shù)據(jù)門戶以及所有利用元數(shù)據(jù)收割的服務(wù)(如OAI-PMH)中均可見,且能與re3data.org和OpenAIRE等集成。

提交的數(shù)據(jù)存放在SowiDataNet|Datorium中。SowiDataNet|Datorium運營期間,會保證對所有數(shù)據(jù)和元數(shù)據(jù)物理保存至少10年。如有需要,可延長保存期,或?qū)?shù)據(jù)存入GESIS數(shù)據(jù)檔案庫中長期保存。與GESIS數(shù)據(jù)檔案庫的集成極大地提高了長期有效存儲科研數(shù)據(jù)的可能性,當(dāng)科研人員或內(nèi)部人員跨機構(gòu)流動時,科研數(shù)據(jù)仍能以一種用戶可理解和重用的格式集中記錄和保存,即使沒有數(shù)據(jù)提供者或內(nèi)部人員的支持,在以后也可以追溯和使用數(shù)據(jù)。如果SowiDataNet|Datorium停止運營,數(shù)據(jù)、元數(shù)據(jù)和其他材料將會被納入GESIS社會科學(xué)數(shù)據(jù)檔案庫,并按照協(xié)議維護和重用。所有文件都會與校驗和一起存儲,數(shù)據(jù)管理者會定期檢查這些校驗和以確保對應(yīng)文件沒有任何更改,數(shù)據(jù)集和元數(shù)據(jù)每天都會進行備份,并將備份存放在不同的位置。

發(fā)布數(shù)據(jù)時,數(shù)據(jù)存儲者可以設(shè)定訪問級別,包括:1)免費獲?。o需注冊);2)免費獲?。ㄐ枰裕?3)受限獲取。當(dāng)數(shù)據(jù)使用者嘗試下載數(shù)據(jù)時,SowiDataNet|Datorium將生成電子郵件表格。數(shù)據(jù)使用者需填寫此表格,向管理員請求獲取數(shù)據(jù)。協(xié)商后,管理員將批準(zhǔn)用戶獲取數(shù)據(jù);4)時滯期。對于那些不想讓他人立即獲得其數(shù)據(jù)的存儲者,可以設(shè)置時滯期,最長2年。元數(shù)據(jù)會立即發(fā)布,但數(shù)據(jù)本身僅在時滯期結(jié)束后方可使用。時滯期結(jié)束時,上傳的數(shù)據(jù)將自動出版,以供免費或受限獲取。

在“我的提交”中,數(shù)據(jù)存儲者可以看到所有提交數(shù)據(jù)的狀態(tài):1)未完成。這是尚未提交審核的草稿,可以訪問,繼續(xù)編輯,直到提交。2)審閱。這是機構(gòu)管理員或GESIS管理員正在審核的已提交數(shù)據(jù)項目,無法再編輯。審核通過后,數(shù)據(jù)將在SowiDataNet|Datorium中發(fā)布,并被分配DOI。存儲者及其機構(gòu)將收到電子郵件通知。3)已發(fā)布。這是在SowiDataNet|Datorium中已發(fā)布數(shù)據(jù)的列表。如需對數(shù)據(jù)、元數(shù)據(jù)或文檔進行更改,則必須與GESIS的SowiDataNet|Datorium團隊聯(lián)系。任何更改都必須在出版之前進行審核。

122數(shù)據(jù)用戶

SowiDataNet|Datorium為社會和經(jīng)濟科研數(shù)據(jù)提供了統(tǒng)一訪問入口,數(shù)據(jù)用戶能夠使用元數(shù)據(jù)進行研究,使用數(shù)據(jù)進行重新分析或開始新的科研項目。數(shù)據(jù)用戶可以通過兩種方式搜索合適的科研數(shù)據(jù):一是在起始頁上的搜索框中輸入關(guān)鍵字;二是通過單擊頂部導(dǎo)航中的“Show All Data”按鈕開始瀏覽整個館藏。要縮小結(jié)果范圍,則使用結(jié)果頁面上提供的過濾器。如果在搜索結(jié)果中找到了感興趣的記錄,可以單擊標(biāo)題獲取詳細(xì)的記錄說明和下載選項。

123科研機構(gòu)

除了面向數(shù)據(jù)存儲者和數(shù)據(jù)用戶的免費服務(wù)外,SowiDataNet|Datorium還可以與研究生院、特殊研究領(lǐng)域(德國合作研究中心)或?qū)嶒炇抑苯訉樱琒owiDataNet|Datorium為與GESIS簽訂合同的機構(gòu)提供額外的收費服務(wù),標(biāo)準(zhǔn)見表1。其中包括:

1)進入監(jiān)管區(qū),機構(gòu)的管理者可以對機構(gòu)員工提交的數(shù)據(jù)進行初步審查。

2)提供導(dǎo)出機構(gòu)研究和元數(shù)據(jù)以在機構(gòu)網(wǎng)頁上展示的技術(shù)手段。

3)提供機構(gòu)出版的科研數(shù)據(jù)的統(tǒng)計報告下載。

4)為機構(gòu)使用SowiDataNet|Datorium提供支持。

機構(gòu)通過SowiDataNet|Datorium提供的預(yù)定義角色——機構(gòu)管理員,可將SowiDataNet|Datorium集成到機構(gòu)科研數(shù)據(jù)管理工作流程中。在項目開始時,機構(gòu)管理員告知科研人員可以進行數(shù)據(jù)管理和出版,向科研人員說明數(shù)據(jù)的時滯期、與數(shù)據(jù)準(zhǔn)備或數(shù)據(jù)文件有效處理相關(guān)的要求等,以避免在項目的最后階段工作量過大。在項目進行中,SowiDataNet|Datorium對機構(gòu)數(shù)據(jù)進行管理,支持?jǐn)?shù)據(jù)版本控制并為內(nèi)部和外部報告提供信息[8]。

2SowiDataNet|Datorium的特色與啟示

21分工合作、協(xié)同建設(shè)

目前,我國的社會科學(xué)數(shù)據(jù)平臺主要是由國家投入資金,高校主持建設(shè)或高校聯(lián)合各部門自主建設(shè),多為機構(gòu)獨立建設(shè),缺乏國家層面的統(tǒng)籌管理。平臺建設(shè)的經(jīng)費也主要是國家財政支持,很少有社會組織或?qū)I(yè)學(xué)會的資助,資金來源比較單一。如表2。

平臺主題領(lǐng)域建設(shè)時間與建設(shè)主體資金來源

復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺社會經(jīng)濟、地球與環(huán)境科學(xué)、計算機與信息科學(xué)、其他2013年,復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)研究中心985項目資助

北京大學(xué)開放研究數(shù)據(jù)平臺社會科學(xué)、計算機與信息科學(xué)、生命科學(xué)、地球與環(huán)境科學(xué)、其他2015年,北京大學(xué)圖書館、管理科學(xué)數(shù)據(jù)中心、科研部、社科部國家自然科學(xué)基金

武漢大學(xué)高??茖W(xué)數(shù)據(jù)共享平臺社會學(xué)、生命科學(xué)2012年,武漢大學(xué)圖書館、CALIS科研數(shù)據(jù)管理項目組教育部專項資金

中國人民大學(xué)中國國家調(diào)查數(shù)據(jù)庫社會、經(jīng)濟、教育、健康2009年,中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心、中國政府統(tǒng)計研究院國家自然科學(xué)基金

湖南大學(xué)經(jīng)濟數(shù)據(jù)研究中心社會、經(jīng)濟管理2013年,湖南大學(xué)經(jīng)濟與貿(mào)易學(xué)院本校資助

與國內(nèi)平臺的建設(shè)模式不同,作為國家層面推動建設(shè)的項目,SowiDataNet|Datorium采用的是跨機構(gòu)分工合作和協(xié)同建設(shè)的方式,保證了平臺技術(shù)的可靠性(安全運行和及時更新維護),同時確??蒲袛?shù)據(jù)收集的專業(yè)性和高質(zhì)量。SowiDataNet項目是由德國萊布尼茨學(xué)會(Leibniz-Gemeinschaft)資助,萊布尼茨社會科學(xué)研究所(GESIS)、萊布尼茨經(jīng)濟學(xué)信息中心(Leibniz Information Centre for Economics,ZBW),柏林社會科學(xué)中心(Berlin Social Science Center,WZB)、德國經(jīng)濟研究所(German Institute for Economic Research,DIW)合作建設(shè)的。鑒于GESIS和ZBW在基礎(chǔ)設(shè)施建設(shè)方面豐富的經(jīng)驗,由GESIS和ZBW負(fù)責(zé)基礎(chǔ)設(shè)施的開發(fā),而由專注于社會經(jīng)濟研究的WZB和DIW負(fù)責(zé)相關(guān)的研究工作。作為國家層面的公共數(shù)據(jù)平臺,SowiDataNet|Datorium為沒有自己數(shù)據(jù)基礎(chǔ)設(shè)施的機構(gòu)和科研人員提供了安全記錄、持久存儲和共享科研數(shù)據(jù)的平臺,為數(shù)據(jù)用戶提供了豐富的數(shù)據(jù)資源和統(tǒng)一的檢索入口;使得制

定共同標(biāo)準(zhǔn)對德國社會和經(jīng)濟科學(xué)科研數(shù)據(jù)存檔和記錄得以實現(xiàn),通過最終鏈接到GESIS數(shù)據(jù)檔案庫,確保了社會和經(jīng)濟科學(xué)科研數(shù)據(jù)的長期保存。與此同時,通過提供收費服務(wù)來收取資金,維持持續(xù)運營,減輕了國家的財政負(fù)擔(dān)。

22服務(wù)對象多元化,關(guān)注機構(gòu)用戶

國內(nèi)已有的社會科學(xué)數(shù)據(jù)平臺都屬于機構(gòu)平臺,主要為本機構(gòu)的科研人員服務(wù),以收集本機構(gòu)科研人員的數(shù)據(jù)為主,數(shù)據(jù)是直接存儲在本地(見表3)。很少有平臺對外開放,供其他機構(gòu)和科研人員存儲和出版數(shù)據(jù)。各平臺獨立存儲,單獨維護,標(biāo)準(zhǔn)不一,用戶要使用數(shù)據(jù),就必須訪問多個平臺,這給數(shù)據(jù)用戶帶來了不便,一定程度上阻礙了數(shù)據(jù)共享[9]。SowiDataNet|Datoriu則是將機構(gòu)用戶作為平臺的一類重要用戶,突出面向機構(gòu)的服務(wù)功能,解決只有少數(shù)機構(gòu)能夠使用自己的資源構(gòu)建并長期運營數(shù)據(jù)平臺這一問題,讓盡可能多的機構(gòu)能夠很容易借助SowiDataNet|Datorium,實現(xiàn)機構(gòu)自己的數(shù)據(jù)管理和服務(wù)。

與國內(nèi)平臺的服務(wù)模式不同,SowiDataNet|Datoriu除了為數(shù)據(jù)提供者和用戶提供服務(wù)外,還專門針對機構(gòu)提供付費服務(wù)。SowiDataNet|Datorium支持機構(gòu)系統(tǒng)地存檔其科研成果,并及時提供給科學(xué)界使用。SowiDataNet提供了一個附加模塊,使機構(gòu)可以將存儲在SowiDataNet|Datorium中的

科研數(shù)據(jù)集成到機構(gòu)自己的網(wǎng)站中展示并使其可搜索。展示窗口Showcase可以進行個性化設(shè)計。通過Showcase,Sowidatanet為機構(gòu)提供了自己的前端,搜索功能與Sowidatanet主頁上的搜索功能一一對應(yīng)(自由文本搜索和分面過濾)。只是搜索范圍僅限于機構(gòu)自己的數(shù)據(jù)館藏。Showcase和SowiDataNet之間的信息交換是通過REST API進行的。因此,元數(shù)據(jù)和數(shù)據(jù)本身都可以直接從Showcase中獲取。Showcase可以作為一個中心Web服務(wù)由Sowidatanet托管,此時Showcase通過iFrame集成到機構(gòu)網(wǎng)站中,但可以作為科研機構(gòu)主頁的獨立子頁面調(diào)用(如圖2)。上述兩種情況,機構(gòu)均可以通過改寫CSS文件(如,通過合并徽標(biāo)或調(diào)整顏色和字體)來自定義視圖,也可以選擇在機構(gòu)的服務(wù)器上執(zhí)行本地安裝,并根據(jù)需要調(diào)整源代碼。

23重視數(shù)據(jù)質(zhì)量,啟動二級審核

國內(nèi)的平臺中只有中國人民大學(xué)中國國家調(diào)查數(shù)據(jù)庫和湖南經(jīng)濟數(shù)據(jù)研究中心提到了數(shù)據(jù)清洗,其它平臺均未提到數(shù)據(jù)質(zhì)量檢查。中國人民大學(xué)中國國家調(diào)查數(shù)據(jù)庫收集的主要是社會調(diào)查數(shù)據(jù),所以其數(shù)據(jù)清洗主要是對調(diào)查問卷的檢查,具體項目包括:1)問卷數(shù)據(jù)的單變量非法值檢查(含連續(xù)變量的不合理值檢查);2)問卷數(shù)據(jù)的邏輯檢查,包括跳答題的檢查,復(fù)選題的檢查,偏好次序題的檢查;3)依據(jù)問卷問題之間的關(guān)聯(lián)性,做邏輯檢查;4)問卷數(shù)據(jù)的開放題檢查,包括確認(rèn)選項(如,選“其他,請說明”)與文字記錄之間邏輯的一致性,開放題中的文字內(nèi)容若與固定選項完全相同,則歸入該選項;5)缺失值處理;6)生成逐邏輯檢查項、逐變量缺失情況變量,作為判定數(shù)據(jù)質(zhì)量的指標(biāo)(再核實);7)生成數(shù)據(jù)邏輯錯誤糾正、數(shù)據(jù)缺失插補記錄;8)生成數(shù)據(jù)清理報告[11]。湖南大學(xué)經(jīng)濟數(shù)據(jù)研究中心沒有對其數(shù)據(jù)清洗進行詳細(xì)介紹,僅通過鏈接文章說明了缺失數(shù)據(jù)的處理辦法。

SowiDataNet|Datorium對數(shù)據(jù)質(zhì)量有嚴(yán)格地控制,對提交的各類型數(shù)據(jù)都會進行數(shù)據(jù)本身、元數(shù)據(jù)及其附帶文檔的審查。對于沒有隸屬機構(gòu)的科研人員提交的數(shù)據(jù),由GESIS管理員進行審查;對于隸屬某一機構(gòu)的科研人員提交的數(shù)據(jù)由機構(gòu)的管理員和GESIS管理員進行雙重檢查。首次檢查是由科研人員所在機構(gòu)的管理員完成。SowiDataNet|Datorium提供了機構(gòu)管理員角色并開發(fā)了相應(yīng)功能,幫助解決數(shù)據(jù)存儲者在數(shù)據(jù)存儲過程中以及數(shù)據(jù)用戶在數(shù)據(jù)使用過程中遇到的問題。機構(gòu)科研人員完成數(shù)據(jù)輸入后,數(shù)據(jù)先是存儲在機構(gòu)項目庫中,機構(gòu)管理員會按照FAIR(可發(fā)現(xiàn)、可訪問、可互操作、可重用)標(biāo)準(zhǔn)對數(shù)據(jù)進行檢查,如有必要,管理員可與相關(guān)研究人員協(xié)商后補充信息或修改更正文件。機構(gòu)管理員完成檢查后,交由GESIS的技術(shù)存儲庫運營商,由GESIS的管理員再次檢查數(shù)據(jù)。此外,為促進標(biāo)準(zhǔn)化進程并為管理者提供幫助,SowiDataNet|Datorium開發(fā)了一個通用檢查表來指導(dǎo)數(shù)據(jù)檢查[12]。通過通用檢查表配合二級審查的方式,SowiDataNet|Datorium有效提高了存儲數(shù)據(jù)的質(zhì)量。

24訪問權(quán)限靈活,最大程度促進共享

科研數(shù)據(jù)只有通過廣泛的共享,才能最大限度地發(fā)揮價值,實現(xiàn)整體增值,并減少國家的重復(fù)投入,實現(xiàn)投資效益最大化[13]。我國的社會科學(xué)數(shù)據(jù)平臺很少有可以直接訪問具體數(shù)據(jù)的,大多只能瀏覽元數(shù)據(jù),需要注冊申請才能獲取完整數(shù)據(jù)(見表4)。復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺、北京大學(xué)開放研究數(shù)據(jù)平臺是分級別分層次來控制對數(shù)據(jù)的訪問。數(shù)據(jù)管理者在自己的數(shù)據(jù)空間中設(shè)置用戶組,為用戶分配角色,不同的角色擁有不同權(quán)限,可以對數(shù)據(jù)進行不同的操作。用戶申請數(shù)據(jù)使用權(quán)限實質(zhì)上就是申請加入某個用戶組,數(shù)據(jù)管理者有權(quán)同意或拒絕,從而達到對數(shù)據(jù)的管理和控制。用戶若要使用湖南大學(xué)經(jīng)濟數(shù)據(jù)研究中心的數(shù)據(jù),也必須先注冊,然后按照所給出的數(shù)據(jù)獲取方式申請獲得數(shù)據(jù),有些數(shù)據(jù)僅限教師申請,非注冊用戶不能獲取任何數(shù)據(jù)。

SowiDataNet|Datorium提供了自由訪問(無需注冊)、自由訪問(需要注冊)、受限訪問、時滯期4個數(shù)據(jù)訪問級別,可供自由選擇。在SowiDataNet|Datorium中有很多數(shù)據(jù)項目,無需注冊申請即可直接訪問數(shù)據(jù)本身。其原則是只存儲要公開發(fā)布和共享的科研數(shù)據(jù),即使由于某些原因數(shù)據(jù)不立即公開使用,在一段時間后也會自動公開發(fā)布,SowiDataNet|Datorium中的科研數(shù)據(jù)最終都可供用戶使用。

25降低使用門檻,確保量的增長

數(shù)據(jù)平臺面向的對象以及數(shù)據(jù)提交的便捷性是影響平臺數(shù)據(jù)量的重要因素。國內(nèi)社會科學(xué)數(shù)據(jù)平臺面向的對象一種是僅限本校人員,如武漢大學(xué)的科學(xué)數(shù)據(jù)共享平臺;一種是以本??蒲腥藛T為主,其他機構(gòu)也可使用。如復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺和北京大學(xué)開放研究數(shù)據(jù)平臺。中國人民大學(xué)中國國家調(diào)查數(shù)據(jù)庫雖面向國內(nèi)科研人員,但它僅收集調(diào)查數(shù)據(jù)。此外,元數(shù)據(jù)字段的復(fù)雜程度也會影響科研人員使用平臺的積極性。各平臺的元數(shù)據(jù)標(biāo)準(zhǔn)見表5。復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺和北京大學(xué)開放研究數(shù)據(jù)平臺建立了基于DDI的元數(shù)據(jù)著錄規(guī)范的通用型元數(shù)據(jù),并參考和借鑒業(yè)界已經(jīng)形成的元數(shù)據(jù)規(guī)范作為學(xué)科專有元數(shù)據(jù)標(biāo)準(zhǔn)[14-15]。復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺和北京大學(xué)開放研究數(shù)據(jù)平臺均需要對數(shù)據(jù)空間和數(shù)據(jù)集進行描述,但主要以數(shù)據(jù)集為描述對象。對于數(shù)據(jù)集的描述,包括標(biāo)題、作者、聯(lián)系人、描述、學(xué)科等多個必填元數(shù)據(jù)字段。北京大學(xué)開放研究數(shù)據(jù)平臺提供的是中英文界面,部分資料信息需要分別按中英文雙語填寫。為了降低使用門檻,更廣泛的收集數(shù)據(jù),SowiDataNet|Datorium僅要求5個必填元數(shù)據(jù)字段(Title;Primary Researcher & Institution;Publisher;Publication Year;Available),其余均為可選字段[16],通過降低數(shù)據(jù)描述的難度,提升數(shù)據(jù)存儲者使用平臺的積極性,確保初始階段數(shù)據(jù)量的穩(wěn)步增長。

3結(jié)語

盡管德國研究基金會“維護良好科學(xué)實踐”指南[17]以及Wissenschaftsrat等科學(xué)委員會關(guān)于2020年德國進一步發(fā)展科學(xué)信息基礎(chǔ)設(shè)施的建議[18],都提出了數(shù)據(jù)管理的要求。但是,在德國社會科學(xué)領(lǐng)域?qū)W者使用數(shù)據(jù)平臺管理和共享科研數(shù)據(jù)并不普遍,對公開他們的科研數(shù)據(jù)大多持拒絕態(tài)度。究其原因主要有兩點:一是與英國、美國等國相比,德國只有少數(shù)科研資助機構(gòu)和期刊有數(shù)據(jù)共享的要求[19];二是盡管德國GESIS萊布尼茨社會科學(xué)研究所社會科學(xué)數(shù)據(jù)檔案館已經(jīng)提供了數(shù)十年的數(shù)據(jù)存檔服務(wù),存儲了很多記錄翔實且經(jīng)過安全歸檔的社會科學(xué)數(shù)據(jù)集,這些數(shù)據(jù)集能被其他學(xué)者重用。然而,在德國,共享數(shù)據(jù)的顯著優(yōu)勢并沒有促使數(shù)據(jù)共享文化在全國范圍內(nèi)形成[20]。我國目前的情況和德國的類似,且只有少數(shù)機構(gòu)能夠使用自己的資源來構(gòu)建可持續(xù)運行的科研數(shù)據(jù)平臺。

科研數(shù)據(jù)聯(lián)盟長尾科研數(shù)據(jù)興趣組在2017年提出的支持長尾科研數(shù)據(jù)管理的7項建議中指出,必須擴大并加強機構(gòu)在管理科研數(shù)據(jù)中的作用,因為對生成數(shù)據(jù)的科研人員提供本地支持,有助于科研人員在研究過程中更早地采用標(biāo)準(zhǔn)和最佳實踐,從而提高數(shù)據(jù)被他人理解和重用的可能性[21]。因此,我國開發(fā)國家層面的社會科學(xué)數(shù)據(jù)平臺必要且迫切。應(yīng)盡快建設(shè)面向社會科學(xué)領(lǐng)域的公共科研數(shù)據(jù)管理平臺,統(tǒng)一社會科學(xué)數(shù)據(jù)存儲標(biāo)準(zhǔn),以整合分散存儲的社會科學(xué)科研數(shù)據(jù),實現(xiàn)社會科學(xué)科研數(shù)據(jù)的集中存儲與一站式檢索,促進社會科學(xué)領(lǐng)域數(shù)據(jù)共享文化的形成。SowiDataNet|Datorium提供了一些很好的經(jīng)驗:就建設(shè)模式而言,我國可以考慮整合多方力量,充分發(fā)揮社會組織的優(yōu)勢。讓有技術(shù)基礎(chǔ)的社會組織、IT企業(yè)和專業(yè)領(lǐng)域內(nèi)有聲望的科研院所或高校合作建設(shè),同時通過提供收費服務(wù)、制定相關(guān)政策吸引商業(yè)機構(gòu)和個人資助等方式,獲取更多的資金,維持平臺的可持續(xù)發(fā)展;就服務(wù)功能而言,應(yīng)重視開發(fā)面向機構(gòu)的功能,支持機構(gòu)將平臺嵌入自己的工作流程,使更多的機構(gòu)有能力將平臺與已建立的機構(gòu)研究實踐相結(jié)合,實施機構(gòu)自己的科研數(shù)據(jù)管理;就數(shù)據(jù)質(zhì)量控制而言,要注意多方溝通,不斷完善數(shù)據(jù)質(zhì)量檢查標(biāo)準(zhǔn)并規(guī)范數(shù)據(jù)質(zhì)量審核流程。此外,還可以考慮提供更為靈活的數(shù)據(jù)訪問權(quán)限選擇,并適當(dāng)降低使用門檻,以在最初階段最大程度地推動平臺的使用。

參考文獻

[1]谷俊,許鑫.人文社科數(shù)據(jù)共享模型的設(shè)計與實現(xiàn)——以聯(lián)盟鏈技術(shù)為例[J].情報學(xué)報,2019,38(4):354-367.

[2]殷沈琴,張計龍,張瑩,等.社會科學(xué)數(shù)據(jù)管理服務(wù)平臺系統(tǒng)選型研究——以復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺為例[J].圖書情報工作,2013,57(19):92-96.

[3]王陽,沈軍軍,江震.德國開放獲取戰(zhàn)略規(guī)劃實施論述[J].數(shù)字圖書館論壇,2020,(1):40-46.

[4]GESIS.SowiDataNet|Datorium[EB/OL].https://data.gesis.org/sharing/#!Home,2020-04-14.

[5]Monika Linne,Wolfgang Zenk-Mltgen.Strengthening Institutional Data Management and Promoting Data Sharing in the Social and Economic Sciences[EB/OL].https://www.liberquarterly.eu/articles/10.18352/lq.10195/,2020-04-14.

[6]Linne M.Sustainable Data Preservation Using Datorium:Facilitating the Scientific Ideal of Data Sharing in the Social Sciences[EB/OL].https://fedora.phaidra.univie.ac.at/fedora/objects/o:378062/methods/bdef:Content/download,2020-04-14.

[7]GESIS.SowiDataNet Price List[EB/OL].https://data.gesis.org/sharing/docs/SowiDataNet_Prices_english.pdf,2020-04-14.

[8] Dro? P,Linne M.Sicheres Und Einfaches Data Sharing Mit SowiDataNet:Dokumentieren-verffentlichen-nachnutzen[J].Bibliotheksdienst,2016,50(7):649-660.

[9] 衛(wèi)軍朝,張春芳.國內(nèi)外科學(xué)數(shù)據(jù)管理平臺比較研究[J].圖書情報工作,2017,(7):97-107.

[10]Dro P J,Linne M.Sicheres Und Einfaches Data Sharing Mit SowiDataNet:Dokumentieren-verffentlichen-nachnutzen[EB/OL].https://www.degruyter.com/view/journals/bd/50/7/article-p649.xml,2020-04-14.

[11]中國國家調(diào)查數(shù)據(jù)庫.管數(shù)據(jù)[EB/OL].http://www.cnsda.org/index.php?r=site/datamanage,2020-04-14.

[12]MonikaLinne.SowiDataNet-A User-Driven Repository for Data Sharing and Centralising Research Data from the Social and Economic Sciences in Germany[EB/OL].https://zenodo.org/record/3607229#.XpWKuKEjxXQ,2020-04-14.

[13]沈夢軒.國內(nèi)科學(xué)數(shù)據(jù)資源建設(shè)與共享研究[J],圖書館工作與研究,2019,(S1):137-141.

[14]張計龍,殷沈琴,張用,等.社會科學(xué)數(shù)據(jù)的共享與服務(wù)——以復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)共享平臺為例[J].大學(xué)圖書館學(xué)報,2015,(1):74-79.

[15]朱玲,聶華,崔海媛,等.北京大學(xué)開放研究數(shù)據(jù)平臺建設(shè):探索與實踐[J].圖書情報工作,2016,60(4):44-51.

[16]Jensen U,Linne M.SowiDataNet-Metadatenschema Version 10[EB/OL].https://www.ssoar.info/ssoar/handle/document/54975,2020-04-14.

[17]DFG.Proposals for Safeguarding Good Scientific Practice[EB/OL].https://www.mpimet.mpg.de/fileadmin/publikationen/Volltexte_diverse/DFG-Safeguarding_Good_Scientific_Practice_DFG.pdf,2020-04-14.

[18]Wissenschaftsrat W R.Empfehlungen Des Wissenschaftsrats Zur Weiterentwicklung Der Wissenschaftlichen Informationsinfrastrukturen in Deutschland Bis 2020[EB/OL].http://www.wissenschaftsrat.de/download/archiv/2359-12.pdf,2020-04-14.

[19]Kvalheim V,Kvamme T.Policies for Sharing Research Data in Social Sciences and Humanities.A Survey About Research Funders Data Policies[EB/OL].from http://ifdo.org/wordpress/wp-content/uploads/2015/07/ifdo_survey_report.pdf,2020-04-14.

[20]Zenk-Moeltgen W,Lepthien G.Data Sharing in Sociology Journals[J].Online Information Review,2014,38(6):709-722.

[21]RDA Long Tail of Research Data Interest Group.Addressing the Gaps:Recommendations for Supporting the Long Tail of Research Data[EB/OL].https://www.rd-alliance.org/system/files/Supporting%20Long%20Tail%20of%20Research%20Data%2C%20August%202017_0.pdf,2020-04-09.

(責(zé)任編輯:陳媛)

猜你喜歡
數(shù)據(jù)平臺社會科學(xué)德國
The Wolf and the Seven Little Goats
德國豹2號
《云南社會科學(xué)》征稿征訂啟事
《河北農(nóng)業(yè)大學(xué)(社會科學(xué)版)》2021年喜報
醫(yī)療物聯(lián)網(wǎng)基礎(chǔ)平臺研究與設(shè)計
數(shù)學(xué)在社會科學(xué)中的應(yīng)用
高校學(xué)生工作數(shù)據(jù)平臺的構(gòu)建和創(chuàng)新長效機制研究
社會科學(xué)總論
兴海县| 平原县| 延安市| 榆林市| 广南县| 永登县| 武隆县| 周口市| 平山县| 麻城市| 秦安县| 绥棱县| 凤庆县| 井陉县| 辉南县| 中山市| 汉阴县| 铁岭市| 资中县| 营山县| 潮安县| 南安市| 和林格尔县| 汶上县| 获嘉县| 连江县| 观塘区| 洪雅县| 吕梁市| 祥云县| 河源市| 宿松县| 汉中市| 商河县| 满城县| 无为县| 南部县| 西宁市| 伊吾县| 邯郸市| 手游|