文/鐘國華 胡建敏 倪向東
“十三五”時期,我國經(jīng)濟發(fā)展進入了速度變化、結構優(yōu)化和動力轉換的新常態(tài),以科技創(chuàng)新為核心的創(chuàng)新驅動模式已成為我國經(jīng)濟可持續(xù)發(fā)展的核心戰(zhàn)略與必然選擇。我國《關于深化體制機制改革加快實施創(chuàng)新驅動發(fā)展戰(zhàn)略的若干意見》《國家創(chuàng)新驅動發(fā)展戰(zhàn)略綱要》的先后印發(fā),將科技創(chuàng)新擺在了國家發(fā)展全局的核心位置;《關于加快科技服務業(yè)發(fā)展的若干意見》指出,科技服務業(yè)是 實現(xiàn)科技創(chuàng)新引領產(chǎn)業(yè)升級、推動經(jīng)濟向中高端水平邁進的關鍵一環(huán),對于深入實施創(chuàng)新驅動發(fā)展戰(zhàn)略、推動經(jīng)濟提質增效升級具有重要意義。
在此背景下,隨著科技服務業(yè)的發(fā)展,我國涌現(xiàn)了一批科技服務機構以及科技服務互聯(lián)網(wǎng)平臺,在科技咨詢、技術轉移、創(chuàng)業(yè)孵化、知識產(chǎn)權、科技金融等方面推動了線上、線下一體化服務發(fā)展,可以看到高質量服務背后的底層邏輯是“大數(shù)據(jù)支撐+跨界專業(yè)服務”,數(shù)據(jù)資源越來越成為科技服務業(yè)的核心支撐因素。而由于科技服務的數(shù)據(jù)資源涉及面廣、相對分散,科技服務的異構分布協(xié)同不足、綜合服務效能不強,各地方雖都建有科技服務類平臺、成果轉化類平臺、技術市場類平臺并積累了大量的數(shù)據(jù)資源,但各系統(tǒng)平臺缺乏統(tǒng)一標準和規(guī)范、數(shù)據(jù)無法共享互通,存在出現(xiàn)大量“信息孤島”、區(qū)域間信息不對稱、資源閑置浪費等問題。為解決上述眾多問題,本文將基于珠三角城市群綜合科技服務智能門戶平臺建設經(jīng)驗,提出基于數(shù)據(jù)融合模型的科技服務資源池構建方法,以期達到提高科技服務資源的利用率、數(shù)據(jù)集成能力和智能化應用水平,促進資源區(qū)域融合,規(guī)范統(tǒng)模型標準,實現(xiàn)跨區(qū)域資源調度利用、擴大資源池影響力的輻射范圍的效果。
科技服務資源池是指以國務院印發(fā)的《關于加快科技服務業(yè)發(fā)展的若干意見》所列舉的八大科技類別為基礎,通過數(shù)字化手段對每個服務類別所涉及的資源要素進行采集、描述、存儲、應用,形成統(tǒng)一的可用、可視、可聯(lián)的,具備數(shù)據(jù)目錄、數(shù)據(jù)治理及數(shù)據(jù)管理應用場景的大數(shù)據(jù)庫體系。從以上定義可以看到,由于不同地方的科技服務發(fā)展帶有較強的地域屬性,必然每個服務類別所涉及的資源要素會有一定差異,資源池的類別也會存在差異。
本文以珠三角城市群綜合科技服務智能門戶平臺構建為例,對該平臺所涉及的資源池做了如下分類:一是技術轉移資源,包括科技企業(yè)、人才、高校及科研院所、技術轉移機構、技術經(jīng)理人、技術需求、技術成果。二是檢驗檢測認證資源,包括科技企業(yè)、檢驗檢測機構、檢驗檢測產(chǎn)品、檢驗檢測服務。三是知識產(chǎn)權資源,包括科技企業(yè)、知識產(chǎn)權服務機構、知識產(chǎn)權服務產(chǎn)品、知識產(chǎn)權交易、知識產(chǎn)權數(shù)據(jù)庫(專利、商標、軟件著作權、集成電路)。四是創(chuàng)業(yè)孵化資源,包括科技企業(yè)、創(chuàng)業(yè)孵化機構、創(chuàng)業(yè)孵化載體、創(chuàng)業(yè)孵化服務。五是科技金融資源,包括科技企業(yè)、融資機構、融資產(chǎn)品、融資服務。六是科技咨詢服務資源,包括科技企業(yè)、科技咨詢機構、科技咨詢產(chǎn)品、科技咨詢服務、政策、文獻、儀器設備。
在國家大力促進發(fā)展科技服務業(yè)的背景下,國內各省份已集聚了不少科技服務資源,也曾建立了一些科技服務資源池。常規(guī)的科技服務資源池建設過程如圖1所示。
圖1 常規(guī)科技服務資源池構建過程
常規(guī)的科技服務資源池構建方法普遍以自主查詢?yōu)橹?,能夠服務于相對封閉系統(tǒng),但隨著整個科技服務業(yè)走向生態(tài)化、復雜化,對資源的要求更加多元、精準、開放,需要系統(tǒng)更好地集成多源數(shù)據(jù)和支持智能化應用,充分發(fā)揮數(shù)據(jù)價值。這對系統(tǒng)也提出了更高的要求,即從信息積累、簡單應用往更高的智能匹配、數(shù)據(jù)分析、數(shù)據(jù)決策能力靠攏,通過大數(shù)據(jù)及人工智能技術在存儲、應用、分析、決策、治理、推送等多個層面上規(guī)劃科技服務資源池的建設。據(jù)此,提出基于數(shù)據(jù)融合模型的科技服務資源池構建方法(見圖2),對當下科技服務資源池建設過程提供標準化的建設參考,以促進科技服務資源池的互通共享、提升科技服務效率,推動科技服務業(yè)發(fā)展,助力產(chǎn)業(yè)科技創(chuàng)新。
圖2 基于數(shù)據(jù)融合模型的科技服務資源池構建過程
科技服務資源池作為信息系統(tǒng)建設項目,無法脫離基本的數(shù)據(jù)建模過程。數(shù)據(jù)建模主要是實現(xiàn)了把現(xiàn)實物體轉換成虛擬數(shù)據(jù)的過程,以物體的常規(guī)屬性及特征為標記進行多維度的屬性定義,直到能夠滿足業(yè)務需求而形成的數(shù)據(jù)結構描述。
數(shù)據(jù)建模以業(yè)務為導向。進行數(shù)據(jù)建模,就是通過信息手段從多維度對物體進行描述,包括外觀屬性如顏色、大小、形狀等,內在屬性如分類、結構等,但業(yè)務場景只要求實現(xiàn)通過一種方式識別物體的功能,而建模只需要對應該屬性即可。以技術轉移資源數(shù)據(jù)建模為例(見圖3)是一個典型的業(yè)務導向建模例子。先對珠三角城市群綜合科技服務進行提煉,再對交集數(shù)據(jù)進行基本信息初定、形成公共屬性,如資源唯一標識、資源創(chuàng)建時間、資源相關人、資源區(qū)塊鏈支持、資源名稱等。公共屬性形成資源基類,資源特征屬性都以子類形式進行擴展,迭代形成各種資源分析模型,同時對特征屬性進行標定(如常規(guī)數(shù)值、量化值、文本等)。
圖3 技術轉移資源數(shù)據(jù)建模
元數(shù)據(jù)被定義為描述數(shù)據(jù)的數(shù)據(jù),是對數(shù)據(jù)及信息資源的描述性信息。對應科技服務資源數(shù)據(jù)建模的例子,把元數(shù)據(jù)理解成維度屬性的定義,如外觀屬性中的顏色、大小、形狀,內在屬性中的分類、結構等都可以歸結為建模對象的元數(shù)據(jù)。面對各種各樣的科技服務資源,元數(shù)據(jù)的管理在數(shù)據(jù)統(tǒng)一層面有著重要意義,通過動態(tài)管理元數(shù)據(jù)有效地把握業(yè)務方向上的數(shù)據(jù)模型、提高系統(tǒng)靈活性,同時也是數(shù)據(jù)管理與治理的基礎要求。
在科技服務資源數(shù)據(jù)的四元分類法中,一是基礎類,即科技服務資源的基本屬性;二是業(yè)務類,即對科技服務資源的類別、概況、標識等進行規(guī)范描述;三是統(tǒng)計類,即科技服務資源中存在復合子類的統(tǒng)計情況;四是附加類,即對科技服務資源的關聯(lián)、冗余、隱性等屬性進行規(guī)范描述。以珠三角城市群綜合科技服務智能門戶平臺技術轉移資源-技術需求資源為例,通過四元分類對其進行描述,如表1所示。
表1 科技企業(yè)技術需求的數(shù)據(jù)四元分類表示
經(jīng)過四元分類后構建的數(shù)據(jù)模型已能夠滿足大部分針對資源的應用場景。在高級應用上,如智能匹配等也可直接使用四元分類法建立數(shù)據(jù)模型實現(xiàn)功能,但高級應用往往汲及多類科技服務資源,如果單純地按功能需求建模會出現(xiàn)數(shù)據(jù)屬性重復、資源數(shù)據(jù)重復、數(shù)據(jù)信息不一致等風險。為了減少多資源信息關聯(lián)過程重復建模的風險,需要引入數(shù)據(jù)融合模型設計。
融合模型設計是指在數(shù)據(jù)建模的基礎上,對已建立模型的元數(shù)據(jù)按業(yè)務要求進行提取或增添,從而產(chǎn)生出更高契合度的業(yè)務復合模型。按照此定義,數(shù)據(jù)模型融合后的結果依然是一個模型,這個模型依然遵守四元分類規(guī)則,只是在對提取而來的元數(shù)據(jù)屬性上增加一條操作規(guī)則標識,對非提取屬性則按常規(guī)元數(shù)據(jù)識別。通過引入操作規(guī)則引擎的概念,能較好理解基于模型的數(shù)據(jù)融合操作。數(shù)據(jù)融合模型操作規(guī)則主要分為關聯(lián)規(guī)則、統(tǒng)計規(guī)則、觸發(fā)規(guī)則。關聯(lián)規(guī)則指屬性的值來自于被關聯(lián)模型,采用引用機制,隨著被關聯(lián)模型中對應屬性值更新而自動更新。統(tǒng)計規(guī)則指屬性的值來自于其他模型的統(tǒng)計結果。觸發(fā)規(guī)則指屬性的值來自于觸發(fā)規(guī)則觸發(fā)后的結果。
以珠三角城市群綜合科技服務智能門戶平臺下的技術轉移資源-專家資源模塊為例,平臺可通過手機號查詢到專家姓名、專業(yè)、成果數(shù)量、是否高級項目專家,其中配偶姓名屬性下則無操作規(guī)則,屬于常規(guī)元數(shù)據(jù),如果專家模型的姓名更改了,融合模型的查詢結果自然也就更改了(見圖4)。
圖4 數(shù)據(jù)融合模型設計示例
科技服務業(yè)具有跟隨區(qū)域產(chǎn)業(yè)發(fā)展的特點,導致科技服務資源帶有區(qū)域特性,種類多、結構不統(tǒng)一,因此每種資源在各源系統(tǒng)中的元數(shù)據(jù)不盡相同。為了構建區(qū)域統(tǒng)一科技服務資源的資源池管理系統(tǒng),所有異構數(shù)據(jù)結構必須經(jīng)過統(tǒng)一標準的結構化處理才能導入到資源池。為此,引入了異構處理引擎與數(shù)據(jù)融合驅動的規(guī)則引擎,實現(xiàn)系統(tǒng)自驅的數(shù)據(jù)融合機制。數(shù)據(jù)融合過程在系統(tǒng)中主要體現(xiàn)在以下兩個方面:
一是異構數(shù)據(jù)處理引擎的關聯(lián)觸發(fā)機制。數(shù)據(jù)輸入到資源池是有多種方式的,例如數(shù)據(jù)庫連接輸入、應用程序編程接口(API)輸入、線下文檔轉線上輸入、爬蟲數(shù)據(jù)輸入等,每種輸入的方式都可能有著不一樣的數(shù)據(jù)結構,需要有一個標準化的過程轉換后數(shù)據(jù)才能真正輸入到資源池。異構數(shù)據(jù)處理引擎主要處理數(shù)據(jù)結構轉換,轉換后的數(shù)據(jù)輸入到資源池會觸發(fā)一系列機制以更新過往的資源池數(shù)據(jù),達到數(shù)據(jù)自動融合的效果。
二是數(shù)據(jù)融合模型的操作規(guī)則。數(shù)據(jù)融合模型中自帶操作規(guī)則引擎,通過規(guī)則配置,以主動或被動的方式自動完成關聯(lián)數(shù)據(jù)的更新,達到數(shù)據(jù)自動融合的效果。
目前,大部分科技服務資源池經(jīng)過建模過程后并不考慮關聯(lián)數(shù)據(jù)的融合,需要另外的操作來維護數(shù)據(jù)關聯(lián)更新過程,這就需要投入額外資源進行數(shù)據(jù)多維關聯(lián)清洗處理,提高了系統(tǒng)建設的人員成本?;诙鄶?shù)據(jù)模型的設計,引入數(shù)據(jù)融合模型機制可以降低數(shù)據(jù)維護成本,同時實現(xiàn)了數(shù)據(jù)維度的靈活擴展、增加了系統(tǒng)的靈活性,加快實現(xiàn)數(shù)據(jù)融合、更高維度的統(tǒng)計、分析應用,增強了系統(tǒng)的自驅能力。此外,數(shù)據(jù)融合模型還具有維度隱藏的作用,可以隱藏業(yè)務中的不必要屬性或受保護的數(shù)據(jù)屬性。
科技服務資源池作為區(qū)域的特色數(shù)據(jù)集聚,需要得到充分的挖掘和利用才能更好地發(fā)揮服務于區(qū)域產(chǎn)業(yè)的作用。對科技服務資源池建設進行標準化后,將有利于系統(tǒng)提供更快捷、高效服務。同時,在科技服務資源池的構建過程中,引入數(shù)據(jù)融合模型設計可以降低開發(fā)成本、提升系統(tǒng)自驅能力,以及提升數(shù)據(jù)集成能力和智能化應用水平。
隨著數(shù)字經(jīng)濟的到來,數(shù)據(jù)要素將發(fā)揮越來越重要的作用,科技服務業(yè)也將進入產(chǎn)業(yè)數(shù)字化改革進程,科技服務資源池也將在此過程中發(fā)揮著重要作用;基于數(shù)據(jù)融合模型構建科技服務資源池將有助于推動科技服務資源池的互通共享、提升科技服務效率,推動科技服務業(yè)發(fā)展、助力產(chǎn)業(yè)科技創(chuàng)新。