顧復劉 楊圣彥 顧新建
摘要:[目的/意義]科技創(chuàng)新是我國發(fā)展的關鍵途徑,需要科技資源的共享和協(xié)同創(chuàng)新??萍假Y源共享是一個系統(tǒng)工程,需要建立科技資源的描述模型,在此基礎上進行科技資源集成、評價和分享。[方法/過程]提出科技資源描述模型的結構框架,包括:科技資源分類模型、科技資源元數(shù)據(jù)模型、科技資源本體模型、科技資源知識元模型、科技資源圖譜模型等。其中,科技資源包括知識、數(shù)據(jù)、產(chǎn)品、人才、軟件、硬件等資源。本文闡述了科技資源描述模型的特點和作用,并給出科技資源描述模型的建立方法。[結果/結論]本文的主要貢獻是:①通過科技資源描述模型的規(guī)范化,有助于不同類型的科技資源的集成分享;②通過科技資源的不同類型的描述模型的集成研究,形成科技資源描述模型的體系架構,為進行科技資源的全面系統(tǒng)描述提供整體解決方案,有助于解決科技資源共享難的問題;③提出科技資源描述模型的建立方法,其特點是利用新一代信息技術依靠大眾共建模型,依靠科技資源描述過程的大數(shù)據(jù)智能分析技術,建立和優(yōu)化科技資源描述模型。
關鍵詞:科技資源;科技資源描述模型;模型建立方法;科技資源共享;知識圖譜
分類號:G311
引用格式:顧復, 劉楊圣彥, 顧新建. 科技資源描述模型和建立方法研究 [J/OL]. 知識管理論壇, 2020, 5(2): 69-81[引用日期]. http://www.kmf.ac.cn/p/201/.
1 ?引言
習近平總書記在中國科學院第十九次院士大會、中國工程院第十四次院士大會上的講話中指出:科技體制改革還存在一些有待解決的突出問題,主要是國家創(chuàng)新體系整體效能還不強,科技創(chuàng)新資源分散、重復、低效的問題還沒有從根本上得到解決。
規(guī)范、合理、科學的科技資源描述方法是解決科技資源分散、重復、低效問題的有效方法之一。利用科技資源描述方法可從不同角度對科技資源進行規(guī)范化,有效支持科技資源的集成、評價和共享??萍假Y源包括知識、數(shù)據(jù)、產(chǎn)品、人才、軟件、硬件等不同類型。在這方面已經(jīng)有不少的研究與應用,但還存在一些不足和進一步的需求:
(1)現(xiàn)有的研究主要集中在對不同類型的科技資源進行各自的描述,但缺乏對不同類型的科技資源進行統(tǒng)一描述,這對不同類型的科技資源的統(tǒng)一搜索和集成不利。例如,對知識圖譜的研究較多[1],而科技資源圖譜包括數(shù)據(jù)、產(chǎn)品、人才、軟件、硬件等的“圖譜”,這種研究還是比較缺乏。在中國知網(wǎng)中利用“科技資源圖譜”作為主題詞搜索,搜索到的結果為0條,而利用“知識圖譜”作為主題詞搜索,搜索到10 542條結果。
(2)人們已經(jīng)對一些科技資源的分類模型、元數(shù)據(jù)模型、本體模型、知識元模型、知識圖譜等進行了分別研究,并且已經(jīng)有一些國家標準。王志強、楊青海等認為:科技資源開放共享過程中產(chǎn)生了數(shù)量龐大、種類繁雜的標準規(guī)范,這些標準規(guī)范對推動科技資源建設發(fā)揮了重要作用,但是也存在著一些問題,如缺乏全局性頂層設計,沒有形成統(tǒng)一的標準化建設體系框架[2]。需要進一步對這些模型進行集成統(tǒng)一研究,并用于科技資源的描述。
(3)在現(xiàn)有的研究中,對知識資源的描述已經(jīng)有比較系統(tǒng)的方法,需要將這些方法擴展到其它類型的科技資源。
筆者將對這些問題進行研究,這有助于科技資源的描述方法的規(guī)范化、以及解決科技資源共享難的問題。
2 ?科技資源描述模型的結構框架
科技資源描述是科技資源的一種“畫像”,是對科技資源的分類,是對科技資源的有序化,能夠幫助用戶快速搜索到所需要的科技資源和了解科技資源的主要內(nèi)容,促進科技資源相互之間的快速集成,解決數(shù)據(jù)格式不一致和同一概念描述不一致的問題。圖1為科技資源描述模型的結構框架,圖2為科技資源描述模型間的關系。
科技資源描述模型中的各子模型定義如下:科技資源分類模型——描述科技資源的分類信息,以便找到所需要的科技資源;科技資源元數(shù)據(jù)模型——描述科技資源的主要數(shù)據(jù)格式,以便科技資源的快速集成;科技資源本體模型——對科技資源的規(guī)范性描述,以便準確、全面地找到所需要的科技資源;科技資源知識元——對科技資源內(nèi)容進行簡要描述,以便快速了解科技資源的主要內(nèi)容;科技資源圖譜模型——簡要描述科技資源概念間的關系,以便科技資源的搜索和推理。
在科技創(chuàng)新和其他科技工作中,往往需要多種不同類型的科技資源的集成使用,如某研究任務,需要能勝任的研發(fā)人員(從人才資源中選擇)、與研發(fā)任務相關的產(chǎn)品資源(參考相似產(chǎn)品,提高研發(fā)效率)、知識資源(如產(chǎn)品原理,產(chǎn)品可制造性、可裝配性、可維護性等知識)、數(shù)據(jù)資源(如相似產(chǎn)品的歷史使用數(shù)據(jù)、維護數(shù)據(jù)等)、軟件資源(幫助研發(fā)的計算機輔助軟件)、硬件資源(如實驗設備、測試儀器等)。
3 ?科技資源分類模型及建立方法
3.1 ?科技資源分類模型的定義
科技資源分類模型是把具有某種屬性或特征的科技資源信息歸并起來,通過其屬性或特征來區(qū)別不同類別的科技資源信息[3]。根據(jù)不同的科技資源及需求,科技資源分類模型可以分為以下兩種:
(1)樹狀結構的科技資源分類模型。這是采用數(shù)字或字母的形式,按照分類編碼的一般原則與方法,對科技資源進行統(tǒng)一分類和編碼,具有層次性和系統(tǒng)性的特點,可以確定任一科技資源在科技資源體系中的位置與相互關系。樹狀結構的科技資源分類模型又被稱為科技資源分類編碼體系[4]、科技資源分類目錄、科技資源標識體系等。與科技資源分類相近的分類編碼體系有制造業(yè)信息化服務平臺服務資源分類編碼[5]、網(wǎng)絡化制造環(huán)境下的制造資源分類編碼[6]、企業(yè)信息分類編碼[7]等。具體的科技資源的分類編碼標準已經(jīng)有工藝分類編碼[8]、零件分類編碼[9]等。
樹狀結構的科技資源分類模型首先按照科技資源的性質(zhì)不同進行基本分類。表1介紹了科技資源現(xiàn)有的一些分類理論,體現(xiàn)了科技資源分類的多樣性。
其中:中國科技資源代號為CSTR;科技資源標識注冊機構代碼為5位碼;科技資源類型代碼為2位碼;內(nèi)部標識符不定長,由科技資源標識注冊機構分配,確保在同一科技資源標識注冊機構注冊的每個科技資源的內(nèi)部標識符的唯一性。
該方法的缺點是:對于同一科技資源(如某科技文獻),不同科技資源標識注冊機構給出的科技資源標識符是不同的。但如果不考慮科技資源標識注冊機構,面對如此眾多的科技資源,要建立統(tǒng)一的科技資源標識符是很難的。
(2)關鍵詞結構的科技資源分類模型。采用關鍵詞或者標簽(tag)等方式進行科技資源的屬性或特征的表征和描述。這里的關鍵詞或者標簽往往是大眾編制,所以又稱大眾分類法。這類分類體系比較適合互聯(lián)網(wǎng)中的資源分享[18]。表2為兩種科技資源分類模型的比較:
3.2 ?科技資源分類模型的需求
科技資源分類模型的需求主要包括如下幾個方面:
(1)有助于科技資源的統(tǒng)一有效組織管理和共享服務;
(2)通過建立科技資源的分級標準,支持科技資源的開放和共享;
(3)具有規(guī)范化和標準化的特性,支持科技資源的供需匹配;
(4)可以快速定位到所需要的科技資源,支持科技資源共享。
3.3 ?科技資源分類模型的建立方法
(1)樹狀結構的科技資源分類模型的建立方法。本文主要關注企業(yè)、平臺的科技資源分類模型。因為國際、國家的科技資源分類模型比較寬泛,難以滿足具體企業(yè)、平臺的具體需求。
本文參考《中國圖書館分類法》《GB/T 32843-2016科技資源標識》、國際專利分類體系(IPC)等分類體系,在此基礎上進行擴展建立企業(yè)或行業(yè)平臺的科技資源分類模型?!吨袊鴪D書館分類法》(簡稱《中圖法》)是當今國內(nèi)圖書館使用最廣泛的分類法體系。目前國際上主要的專利分類體系有國際專利分類體系(IPC)、日本專利分類體系(FI/F-term)、美國專利分類體系(USPC)、歐洲專利分類體系(ECLA/ICO)以及聯(lián)合專利分類(CPC)等。在知識資源分類方面可以參考《GB/T 23703.7-2014知識管理 第7部分:知識分類通用要求》。
細分類別的科技資源可以參考一些現(xiàn)有標準,2020年1月29日在國家標準信息查詢平臺(http://www.gov.cn/fuwu/bzxxcx/bzh.htm)輸入“分類”搜索到國家標準620個、行業(yè)標準704個、地方標準134個。其中不少具有參考價值。
科技資源的樹結構分類體系由本領域?qū)<揖幹?,將科技資源歸入對應的子類,檢索時可按樹狀結構一層一層地找到所需要的科技資源??萍假Y源的樹結構分類體系的建立應遵循科學性、系統(tǒng)性、可延性和兼容性的原則,要盡可能請領域?qū)<覅⑴c。
科技資源的內(nèi)容和概念隨時間不斷變化,科技資源分類模型需要與時俱進,不斷維護,或者在編碼搜索系統(tǒng)中建立對應表,實現(xiàn)在不同時期的科技資源分類模型的統(tǒng)一搜索,這樣可以解決傳統(tǒng)的科技資源分類模型修改難、靈活性差等問題。例如,通過構建基于互聯(lián)網(wǎng)的科技資源分類模型建立、維護和應用平臺,來提高傳統(tǒng)科技資源分類模型的靈活性和易維護性。
(2)關鍵詞結構的科技資源分類模型的建立方法。主要采用大眾分類法,即關鍵詞或標簽是由大眾自己選擇。①關鍵詞的定義:出現(xiàn)在文獻的標題、摘要以及正文中,能夠表達文獻主題內(nèi)容、可作為檢索入口的未經(jīng)過規(guī)范化的自然語言詞匯[19]。②標簽的定義:不依賴于固定分類,通過用戶針對內(nèi)容添加的簡短描述,以方便搜索[20]。
關鍵詞結構的科技資源分類模型最大的問題是隨意性較大、規(guī)范性較弱,這顯著增加了搜索或匹配科技資源的難度。但在互聯(lián)網(wǎng)環(huán)境中,隨著關鍵詞或標簽用戶數(shù)的增加,這種隨意性將會顯著減少,因為如果科技資源發(fā)布者所采用的關鍵詞或標簽太隨意、不規(guī)范,就會使其發(fā)布的科技資源難以被人搜索和利用,達不到其發(fā)布科技資源的目的;同樣,如果科技資源搜索者所采用的關鍵詞或標簽不規(guī)范,就會使其難以搜索到想要的科技資源。最終對于同一科技資源,大家就會趨向于采用同樣的關鍵詞或標簽。這是一種自組織優(yōu)化的模式,互聯(lián)網(wǎng)平臺要為促進關鍵詞或標簽的自組織優(yōu)化提供良好的環(huán)境。例如,當用戶輸入關鍵詞或標簽時,平臺提示該關鍵詞或標簽是否是常用的,并根據(jù)科技資源的特點智能推薦常用的關鍵詞或標簽。
關鍵詞或標簽可以采用本體模型進行優(yōu)化,提高基于關鍵詞或標簽的科技資源的搜準率和搜全率,具體見第5節(jié)。
4 ?科技資源元數(shù)據(jù)模型及建立方法
4.1 ?科技資源元數(shù)據(jù)模型的定義
科技資源元數(shù)據(jù)規(guī)范了科技資源描述空間的維度,是描述數(shù)據(jù)的數(shù)據(jù)(data about data),用于描述科技資源(包括實物資源和信息資源)的內(nèi)容、覆蓋范圍、質(zhì)量、管理方式、數(shù)據(jù)的所有者以及提供方式等有關信息的數(shù)據(jù)[28]。關于元數(shù)據(jù)有不同的定義:
(1)關于數(shù)據(jù)的數(shù)據(jù)[21]。
(2)定義和描述其他數(shù)據(jù)的數(shù)據(jù)[22]。
(3)關于數(shù)據(jù)或數(shù)據(jù)元素的數(shù)據(jù)(可能包括其數(shù)據(jù)描述),以及關于數(shù)據(jù)擁有權、存取路徑、訪問權和數(shù)據(jù)易變性的數(shù)據(jù)[23]。
(4)描述數(shù)據(jù)及其環(huán)境的數(shù)據(jù)[24]。
(5)描述物聯(lián)網(wǎng)數(shù)據(jù)及其相關信息的數(shù)據(jù)[25]。
(6)關于數(shù)據(jù)的數(shù)據(jù),主要是描述數(shù)據(jù)屬性(property)的信息[26]。
(7)描述科技報告的一種結構化數(shù)據(jù),用于實現(xiàn)檢索、管理、使用、保存等功能[27]。
這種元數(shù)據(jù)定義的多義性說明了建立統(tǒng)一的科技資源元數(shù)據(jù)的難度。
科技資源的元數(shù)據(jù)包括:科技資源名稱、類型、發(fā)布者、發(fā)布時間、存放地點、關鍵詞等[28]。對不同的科技資源(如知識、數(shù)據(jù)、人才、產(chǎn)品、軟件、硬件等)有相應的元數(shù)據(jù)模型,有些已經(jīng)有標準,需要考慮盡可能采用。
4.2 ?科技資源元數(shù)據(jù)模型的需求
不同的人對科技資源描述空間的維度往往有不同的定義,這就導致了科技資源集成難和搜索難??萍假Y源元數(shù)據(jù)通過對科技資源對象進行統(tǒng)一規(guī)范描述,有助于對科技資源的組織、集成、檢索、發(fā)現(xiàn)和管理[30]。
4.3 ?科技資源元數(shù)據(jù)模型的建立方法
(1)參考已有的科技資源元數(shù)據(jù)模型,調(diào)查搜集盡可能多的科技資源元數(shù)據(jù),建立科技資源元數(shù)據(jù)參考模型庫。2020年1月29日在國家標準信息查詢平臺(http://www.gov.cn/fuwu/bzxxcx/bzh.htm)輸入“元數(shù)據(jù)”搜索到國家標準66個、行業(yè)標準53個、地方標準24個。例如,目前已經(jīng)有《GB/T 36478.3-2019 物聯(lián)網(wǎng) 信息交換和共享 第3部分:元數(shù)據(jù)》《GB/T 38154-2019重要產(chǎn)品追溯 核心元數(shù)據(jù)》《GB/T 37282-2019 產(chǎn)品標簽內(nèi)容核心元數(shù)據(jù)》《GB/T 37600-2018 全國主要產(chǎn)品分類 產(chǎn)品類別核心元數(shù)據(jù)》《GB/T 35430-2017 信息與文獻 期刊描述型元數(shù)據(jù)元素集》《GB/T 35397-2017 科技人才元數(shù)據(jù)元素集》《GB/T 30535-2014科技報告元數(shù)據(jù)規(guī)范》《GB/T 30523-2014 科技平臺 資源核心元數(shù)據(jù)》《GB/T 30522-2014 科技平臺 元數(shù)據(jù)標準化基本原則與方法》《GB/T 30522-2014 科技平臺 元數(shù)據(jù)標準化基本原則與方法》《GB/T 26499.3-2011機械 科學數(shù)據(jù) 第3部分:元數(shù)據(jù)》《GB/T 25100-2010信息與文獻 都柏林核心元數(shù)據(jù)元素集》《GB/T 24662-2009 電子商務 產(chǎn)品核心元數(shù)據(jù)》《GB/T 18391-2009信息技術 元數(shù)據(jù)注冊系統(tǒng)(MDR)》《GB/T 22373-2008 標準文獻元數(shù)據(jù)》《GB/T 22373-2008 標準文獻元數(shù)據(jù)》等。
(2)從科技資源元數(shù)據(jù)參考模型庫中,根據(jù)需要選擇合適的科技資源元數(shù)據(jù)。如果元數(shù)據(jù)數(shù)量太多,使用不便;元數(shù)據(jù)數(shù)量太少,則描述不完整。需要進行元數(shù)據(jù)的相關性分析,去掉相關性較大的兩個元數(shù)據(jù)中的一個;需要進行元數(shù)據(jù)的重要性評價,把對科技資源描述價值相對較小的元數(shù)據(jù)去掉;元數(shù)據(jù)的數(shù)量最終要考慮科技資源描述的完整性、特征可識別性、可分類性等;元數(shù)據(jù)的數(shù)量還與科技資源的其他具體描述需求有關;元數(shù)據(jù)選擇與元數(shù)據(jù)建立和管理的信息化水平有關,當信息化較高時,元數(shù)據(jù)的數(shù)量可以多些。
(3)科技資源元數(shù)據(jù)類型可以由專家協(xié)商確定,也可以通過大數(shù)據(jù)分析得到,或者由專家協(xié)商和大數(shù)據(jù)分析共同得到。
(4)協(xié)同建立科技資源元數(shù)據(jù)模型的標準。該標準涉及面廣、用戶多,因此可以采用維基(Wiki)模式,組織廣大用戶參與,協(xié)同提出和修改科技資源元數(shù)據(jù)模型的標準。
科技資源核心元數(shù)據(jù)的定義是:描述科技資源最基本信息的元數(shù)據(jù)最小集合(修改自GB/T 30523-2014科技平臺 資源核心元數(shù)據(jù)),包括:科技資源中文名稱和英文名稱、科技資源發(fā)布者、科技資源發(fā)布時間(最近提交日期)、科技資源存放地點(信息鏈接地址)、科技資源知識元、科技資源關鍵詞(或標簽)、科技資源標識編碼、科技資源標準本體和關聯(lián)本體。
元數(shù)據(jù)建立方法可以參考《GB/T 30522-2014 科技平臺 元數(shù)據(jù)標準化基本原則與方法》《GB/T 26499.3-2011機械 科學數(shù)據(jù) 第3部分:元數(shù)據(jù)》。
5 ?科技資源本體模型及建立方法
5.1 ?科技資源本體模型的定義
本體沒有統(tǒng)一的定義,以下給出一些不同領域的國家標準對本體的定義:
(1)在大數(shù)據(jù)語境下,它是一些約束后續(xù)各種不同層次邏輯模型的語義模型[19]。
(2)計算機科學領域的一種模型,用于描述用一套對象類型(概念或者說類)、屬性以及關系類型所構成的世界[31]。
(3)被表述為一系列相互關聯(lián)的概念與定義,這種表述類似于敘詞表中的術語。但是,本體不是術語標準[32]。
(4)使用計算機能夠處理的語言對論域的描述[33]。
(5)在文化遺產(chǎn)信息資源領域,基于本體的模型用于將異構、分散的文化遺產(chǎn)信息源進行集成、交換,有助于形成通用的、規(guī)范的本體模型,給領域?qū)<覍π畔⒌木幹坪完P聯(lián)檢索提供指南[34,36]。
許多領域需要通過本體構建,實現(xiàn)相關業(yè)務的標準化工作;同時,本體也是基于Web應用的互操作問題的關鍵。因此業(yè)界正在陸續(xù)制定相關的本體標準。
本文對科技資源本體定義是:科技資源本體模型規(guī)范了同一科技資源的名稱術語及不同名稱術語間的關系。
5.2 ?科技資源本體模型的需求
不同的人對科技資源往往有不同的名稱術語及名稱術語的關系,這就導致了科技資源集成難和搜索難。面對龐大的科技資源和名稱,主要存在以下問題:
(1)有時同一科技資源有多種名稱術語,一種名稱術語描述多種不同的概念,這對科技資源的集成帶來諸多不便。一方面需要通過標準化、規(guī)范化的方法解決這些問題,例如,采用數(shù)據(jù)字典[35]-[36]等方式;另一方面可以通過本體方法,建立標準本體和關聯(lián)本體。標準本體對應描述某一概念的標準術語,關聯(lián)本體對應描述這一概念的其他術語。在信息搜索時標準本體與關聯(lián)本體一起用于搜索??萍假Y源本體模型通過對科技資源對象進行統(tǒng)一規(guī)范的描述,有助于對科技資源的組織、集成、檢索、發(fā)現(xiàn)和管理。
(2)有時同一科技資源有多種概念結構,這對科技資源的集成也帶來諸多不便。本體有助于解決同一概念的名稱多樣化問題和概念結構混亂帶來的問題。名稱多樣化問題會進一步導致科技資源共享和利用中出現(xiàn)如下問題:①搜索到的科技資源信息不完整;②搜索到的科技資源信息不準確;③科技資源信息集成難。概念結構混亂會帶來科技資源分類混亂、資源集成難和搜索難的問題。而科技資源本體模型,有利于實現(xiàn)科技資源的共享、集成、服務,例如:
參考文獻:
[1] 黃恒琪, 于娟, 廖曉等. 知識圖譜研究綜述[J]. 計算機系統(tǒng)應用, 2019, 28(6): 1-12.
[2] 王志強, 楊青海.科技資源開放共享標準體系研究[J]. 中國科技資源導刊, 2016, 48(4): 19-23.
[3] 董明濤, 孫研, 王斌.科技資源及其分類體系研究[J]. 合作經(jīng)濟與科技, 2014(10): 28-30.
[4] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.企業(yè)信息分類編碼導則第1部分: 原則與方法:GB/T 20529.1-2006[S]. 北京: 中國標準出版社, 2007.
[5] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.制造業(yè)信息化服務平臺服務資源分類規(guī)范:GB/T 34045-2017[S]. 北京: 中國標準出版社, 2018.
[6] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.網(wǎng)絡化制造環(huán)境下的制造資源分類:GB/T 25111-2010[S]. 北京: 中國標準出版社, 2010.
[7] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會. 企業(yè)信息分類編碼導則第2部分: 分類編碼體系: GB/T 20529.2-2010[S]. 北京: 中國標準出版社, 2011.
[8] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.面向裝備制造業(yè)產(chǎn)品全生命周期工藝知識第2部分: 通用制造工藝分類編碼規(guī)范: GB/T 22124.2-2010[S]. 北京: 中國標準出版社, 2011.
[9] 陜西省市場監(jiān)督管理局.基于成組技術的零件分類編碼要求:DB61/T 1224-2018[S]. 北京: 中國標準出版社, 2018.
[10] 涂勇, 龔雪媚, 趙輝.科技資源管理標準體系的研究[J]. 中國科技資源導刊, 2012(6): 41-44.
[11] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.科技資源標識:GB/T 32843-2016[S]. 北京: 中國標準出版社, 2016.
[12] 孫凱.科技資源共享可行性分析及對策建議[J]. 西北大學學報(哲學社會科學版), 2005, 35(3): 109-112.
[13] 王雪.區(qū)域科技共享平臺服務模式與運行機制研究[D]. 哈爾濱: 哈爾濱理工大學, 2015.
[14] 范菲雅, 倪炎榕, 袁曉舟, 等. 網(wǎng)絡化制造環(huán)境下基于語義Web的應用服務資源模型[J]. 計算機集成制造系統(tǒng), 2009(8): 53-59.
[15] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.科技平臺資源核心元數(shù)據(jù):GB/T 30523-2014[S]. 北京: 中國標準出版社, 2015.
[16] 劉玲利.科技資源要素的內(nèi)涵——分類及特征研究[J]. 情報雜志.2008(8): 125-126.
[17] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.科技資源標識:GB/T 32843-2016[S]. 北京: 中國標準出版社, 2017.
[18] 顧復, 陳芨熙.一種基于標簽的產(chǎn)品和零部件網(wǎng)頁的自組織分類編碼方法[J]. 成組技術與生產(chǎn)現(xiàn)代化, 2007, 24(2): 57-60.
[19] 國家市場監(jiān)督管理總局, 國家標準化管理委員會.新聞出版知識服務知識資源建設與服務基礎術語:GB/T 38377-2019[S]. 北京: 中國標準出版社, 2020.
[20] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.信息與文獻期刊描述型元數(shù)據(jù)元素集:GB/T 35430-2017[S]. 北京: 中國標準出版社, 2018.
[21] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.信息技術元數(shù)據(jù)注冊系統(tǒng)(MDR): GB/T 18391-2009 [S]. 北京: 中國標準出版社, 2010.
[22] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.信息技術詞匯第17部分: 數(shù)據(jù)庫:GB/T 5271.17-2010[S]. 北京: 中國標準出版社, 2011.
[23] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.物聯(lián)網(wǎng)術語:GB/T 33745-2017[S]. 北京: 中國標準出版社, 2018.
[24] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.物聯(lián)網(wǎng)信息交換和共享第3部分: 元數(shù)據(jù):GB/T 36478.3-2019[S]. 北京: 中國標準出版社, 2020.
[25] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.科技人才元數(shù)據(jù)元素集:GB/T 35397-2017[S]. 北京: 中國標準出版社, 2018.
[26] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.科技報告元數(shù)據(jù)規(guī)范:GB/T 30535-2014[S]. 北京: 中國標準出版社, 2015.
[27] 劉春燕, 安小米.基于生命周期的科技信息資源共享元數(shù)據(jù)研究[J]. 情報理論與實踐, 2018, 41(5): 39-43.
[28] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會.科技平臺資源核心元數(shù)據(jù):GB/T 30523-2014[S]. 北京: 中國標準出版社, 2015.
[29] 趙啟陽, 張輝, 王志強.科技資源元數(shù)據(jù)標準研究的現(xiàn)狀分析與新的視角[J]. 標準科學, 2019(3): 12-17
[30] 國家質(zhì)量監(jiān)督檢驗檢疫總局, 國家標準化管理委員會信息技術大數(shù)據(jù)術語:GB/T 35295-2017[S]. 北京: 中國標準出版社, 2018.
[31] 國家市場監(jiān)督管理總局, 國家標準化管理委員會.信息與文獻文化遺產(chǎn)信息交換的參考本體:GB/T 37965-2019[S]. 北京: 中國標準出版社, 2020.
[32] 國家市場監(jiān)督管理總局, 國家標準化管理委員會.信息技術互操作性元模型框架(MFI)第3部分: 本體注冊元模型:GB/T 32395-2015[S]. 北京: 中國標準出版社, 2016.
[33] 國家市場監(jiān)督管理總局, 國家標準化管理委員會.智能運輸系統(tǒng) 數(shù)據(jù)字典要求:GB/T 20606-2006[S]. 北京: 中國標準出版社, 2007.
[34] 國家市場監(jiān)督管理總局, 國家標準化管理委員會. 新聞出版 知識服務 知識元描述:GB/T 38381-2019[S]. 北京: 中國標準出版社, 2020.
[35] 國家市場監(jiān)督管理總局, 國家標準化管理委員會.基礎地理信息要素數(shù)據(jù)字典 第1部分: 1∶500 1∶1000 1∶2000比例尺:GB/T20258.1-2019[S]. 北京: 中國標準出版社, 2020.
[36] 顧新建, 馬步青, 代風. 基于大數(shù)據(jù)的知識共享方法研究[J]. 知識管理論壇, 2016(1): 30-38.
[37] 畢經(jīng)元.基于Web2.0的知識元鏈接網(wǎng)絡系統(tǒng)[D]. 杭州: 浙江大學, 2010.
[38] AMITS. Introducing the knowledge graph[R]. America:Official Blog of Google, 2012.
[39] 杜鵬程, 吳婷 , 王成城.科技人力資源研究領域的知識圖譜分析[J]. 中國科技論壇, 2013(8): 83-89.
[40] 馬亞寧. 上海人工智能公共研發(fā)資源圖譜[N]. 新民晚報, 2019-08-30(1).
[41] TANG J, ZHANG J, YAO L, et al. ArnetMiner: extraction and mining of academic social networks[C]//Proceedings of the ACM SIGKDD international conference on knowledge discovery and data mining.New York:Association for Computing Machinery, 2008: 990-998.
[42] ZOU L, ?ZSI M T, CHEN L, et al. gStore: a graph-based SPARQL query engine[J]. The VLDB journal, 2014, 23(4): 565–590.
[43] 畢經(jīng)元, 顧新建, 呂艷, 等.基于知識元鏈接的汽車零部件知識管理系統(tǒng)[J]. 浙江大學學報(工學版), 2009, 43(12): 2208-2213.
作者貢獻說明:
顧 ?復:標準和其他文獻的分析,論文的寫作;
劉楊圣彥:論文部分內(nèi)容的寫作,文獻查閱;
顧新建:提出論文的總架構,修改論文。
Description Method of Scientific and Technological Resources
Gu Fu ?Liu Yangshengyan ? Gu Xinjian
School of Mechanical Engineering, Institute of Industrial Engineering, Zhejiang University, Hangzhou 310027
Abstract: [Purpose/significance] Scientific and technological innovation is the key point of development, and scientific and technological resources sharing and collaborative innovation are indispensable. Sharing of scientific and technological resources is a systematic project, and first of all, in order to integrate, evaluate and share scientific and technological resources, we need to establish a description model of scientific and technological resources. [Method/process] The description model of science and technology resources defined in this paper includes classification model of scientific and technological resources, meta data model of science and technology resources, ontology model of science and technology resources, knowledge meta model of science and technology resources, science and technology resource graph model, etc. Scientific and technological resources include knowledge, data, products, talents, software, hardware and other resources. We proposed the method of establishing the model of science and technology resources description, as well as the characteristic and function of it. [Result/conclusion] The main contributions of this paper are as follows: standardizing the description model of science and technology resources is helpful for the integration and sharing of different types of science and technology resources; by the integration research of different types of description models of science and technology resources, we form the system architecture of the description model of science and technology resources, which provides an overall solution for the comprehensive and systematic description of science and technology resources, and helps us to share the science and technology resources; we put forward a method to build a description model of science and technology resources, based on crowd-sourcing theory and big data AI of description process of scientific and technological resources, and we establish and optimize the description model of science and technology resources.
Keywords: science and technology resource ? ?science and technology resource description model ? ?method of modeling ? ?science and technology resource sharing ? ?knowledge graph