安 源,翟夏普,龍藝璇
(1.中國鐵道科學研究院集團有限公司 科學技術(shù)信息研究所,北京 100081;2.中國國家鐵路集團有限公司 科技成果知識產(chǎn)權(quán)管理辦公室,北京 100081)
鐵路行業(yè)快速發(fā)展過程中,鐵路科技創(chuàng)新發(fā)揮了關(guān)鍵作用[1],而高效、安全、智能的科研管理信息系統(tǒng)一直是我國鐵路行業(yè)科技創(chuàng)新發(fā)展的堅實保障。2006年,原鐵道部編制并下發(fā)《鐵路科技管理信息化專項規(guī)劃》(科技運〔2006〕71號),在此指導下首次開展初代鐵路科研管理信息系統(tǒng)開發(fā)工作。2008年,該系統(tǒng)完成技術(shù)驗收(科技綜〔2009〕75號),并在鐵路推廣試用[2]。如今,在大數(shù)據(jù)智能浪潮的強力沖擊之下,跨學科合作密集、學科交叉明顯、科研數(shù)據(jù)量與日俱增,數(shù)據(jù)關(guān)聯(lián)關(guān)系日漸復雜[3-4]。此外,伴隨著科研環(huán)境的變化,用戶需求開始向個性化、定制化、精準化、扁平化、快速響應(yīng)化邁進[5]。
現(xiàn)階段已有不少學者針對大數(shù)據(jù)環(huán)境下的科研管理服務(wù)進行了研究。楊曉剛等人[6]從社會媒體環(huán)境出發(fā),針對科研人員知識共享開展了相關(guān)平臺研究;韓麗華等人[7]分析了大數(shù)據(jù)環(huán)境下信息資源管理模式的轉(zhuǎn)變;解海燕[8]針對大數(shù)據(jù)背景下科研環(huán)境的變化,提出了精準科研信息服務(wù)體系。但現(xiàn)有研究多以理論研究為主,從宏觀角度為科研管理服務(wù)發(fā)展指明方向,鮮有從平臺構(gòu)建或系統(tǒng)設(shè)計角度出發(fā),探索如何落地科研管理智能服務(wù)模式。
本文在初代鐵路科研管理信息系統(tǒng)的基礎(chǔ)上,經(jīng)由中國國家鐵路集團有限公司(簡稱:國鐵集團)統(tǒng)一部署,結(jié)合當前鐵路行業(yè)科研管理服務(wù)面臨的挑戰(zhàn),開發(fā)了以科研項目管理為基礎(chǔ),集立項管理、合同管理、執(zhí)行管理、變更管理、結(jié)題管理于一體,并具備科技專家管理、知識產(chǎn)權(quán)管理、科技資源數(shù)字化加工、科技成果共享及科技門戶等功能的科研管理智能服務(wù)平臺,2021年通過技術(shù)評審(信技網(wǎng)技函〔2021〕29號),并在鐵路推廣使用。實踐證明,該平臺為鐵路科技創(chuàng)新提供了更廣闊的空間。
科研管理智能服務(wù)平臺集云平臺、數(shù)據(jù)匯集層、信息關(guān)聯(lián)層、信息分析層、知識組織層以及創(chuàng)新服務(wù)層為一體,總體架構(gòu)如圖1所示。
圖1 科研管理智能服務(wù)平臺總體架構(gòu)
為實現(xiàn)海量科研信息資源的高效處理與分析,以開源架構(gòu)為基礎(chǔ),以云平臺作為支撐,優(yōu)先國產(chǎn)化替代,采用國產(chǎn)化組件,利用Nginx、Tomcat等中間件,設(shè)計前后端分離架構(gòu)和內(nèi)外穿網(wǎng)部署,通過場景化、差異化流程模版配置,提供科研管理云服務(wù)。其中,后端數(shù)據(jù)庫部署在中國鐵路主數(shù)據(jù)中心內(nèi)部服務(wù)網(wǎng);前端資源在鐵路內(nèi)部服務(wù)網(wǎng)和外部服務(wù)網(wǎng)各部署一套。在充分保障安全的同時,解決內(nèi)外網(wǎng)使用割裂的問題,提高數(shù)據(jù)資源計算效率,保障鐵路行業(yè)科研管理智能服務(wù)平臺的數(shù)據(jù)安全和運行流暢。
數(shù)據(jù)匯集層包含科研全創(chuàng)新要素信息和鐵路領(lǐng)域語料庫2部分。
1.2.1 科研全創(chuàng)新要素信息
科研全創(chuàng)新要素信息主要分為以下3類。
(1)科研項目和成果數(shù)據(jù):根據(jù)國鐵集團科研管理相關(guān)辦法,依托科研管理信息系統(tǒng),高效匯集鐵路內(nèi)部數(shù)據(jù),包括國鐵集團、中國鐵道科學研究院集團有限公司、18 個鐵路局集團公司的立項、合同、結(jié)題、評審、獎勵、科研成果等涉及科研管理全流程的數(shù)據(jù),保障數(shù)據(jù)的權(quán)威性,同時引進專利、標準、期刊、會議等外部數(shù)據(jù),保障數(shù)據(jù)全面性。
(2)創(chuàng)新人才和機構(gòu)數(shù)據(jù):包括科研人員、企業(yè)人員、領(lǐng)域?qū)<业热藛T類型及研究機構(gòu)、企業(yè)公司、第三方等機構(gòu)類型數(shù)據(jù)。
(3)產(chǎn)業(yè)市場數(shù)據(jù):包括鐵路產(chǎn)業(yè)鏈上各企業(yè)的產(chǎn)品數(shù)據(jù)。
通過“科研信息+創(chuàng)新主體+行業(yè)市場”的數(shù)據(jù)關(guān)聯(lián),打通科研項目到行業(yè)市場的通道,從源頭提高科技資源利用效率,解決科技成果轉(zhuǎn)化問題。
1.2.2 鐵路領(lǐng)域語料庫
鐵路領(lǐng)域語料庫涉及鐵路行業(yè)的理論基礎(chǔ)、科學研究方法、相關(guān)政策、新聞動態(tài)等多維度完備的領(lǐng)域信息,是機器理解領(lǐng)域知識的基礎(chǔ),可為科研信息分析提供先驗知識,有利于提高信息分析的智能性和準確性。
信息關(guān)聯(lián)層以科研項目為核心,對鐵路科研全創(chuàng)新要素數(shù)據(jù)進行系統(tǒng)表達和建模,其架構(gòu)如圖2所示。
圖2 信息關(guān)聯(lián)層架構(gòu)
該層負責描述科研項目全生命周期中存在的實體及實體間的關(guān)系。其中,科研項目中的實體包括課題基本信息、參與人員、參與機構(gòu)、資助機構(gòu)及研究成果;實體之間的關(guān)系包括人員與項目之間的負責/參研關(guān)系、機構(gòu)與項目之間的主持/參與關(guān)系、資助機構(gòu)與項目之間的資助關(guān)系、項目與成果之間的產(chǎn)出關(guān)系等。
平臺通過信息關(guān)聯(lián)層理清數(shù)據(jù)之間的邏輯關(guān)系,關(guān)聯(lián)科技大數(shù)據(jù)的知識、技術(shù)、人才、資本全創(chuàng)新要素,打通國鐵集團及其所屬單位各類科研數(shù)據(jù)之間的壁壘,從而實現(xiàn)鐵路行業(yè)科研數(shù)據(jù)一張網(wǎng)的目標。
信息分析層是整個平臺的核心技術(shù)支撐。在數(shù)據(jù)匯集層及信息關(guān)聯(lián)層的基礎(chǔ)上,通過數(shù)據(jù)融合、關(guān)聯(lián)分析、機器學習、自然語言處理等信息技術(shù),開展科研實體識別、關(guān)系抽取與知識表示學習,為知識組織層模型庫、本體庫與規(guī)則庫奠定基礎(chǔ),完成領(lǐng)域知識圖譜的繪制,并基于知識圖譜與知識推理技術(shù),實現(xiàn)科研信息的智能服務(wù)。
傳統(tǒng)的科研信息組織只包含“用代屬分參”關(guān)系,難以揭示科研信息中復雜的語義信息。因此,本文使用算法模型及知識圖譜的方法組織信息。
(1)模型庫中的算法模型主要采用數(shù)據(jù)挖掘、機器學習等方式自動生成,存儲成計算機可理解的、以數(shù)字符號形式呈現(xiàn)的知識,用于計算機對未知信息的預測分析。
(2)采用自然語言處理技術(shù)、知識表示學習等結(jié)合人工配合的方式生成的知識圖譜,以本體庫與規(guī)則庫為基礎(chǔ),包含了科研信息語義分析、科研知識可視化以及科研知識推理等功能,用于存儲人類可理解的、以文字、圖形或符號形式呈現(xiàn)的知識。
創(chuàng)新服務(wù)層指依據(jù)實際科研需求,智能感知用戶偏好,敏捷應(yīng)對外部需求變化,為用戶提供個性化、定制化、專業(yè)化的科技情報服務(wù)。
(1)個性化科研知識推送:主動抓取用戶需求,為科研人員推送課題內(nèi)容相關(guān)的最新科研成果。
(2)智能檢索式構(gòu)建:通過語義計算提供滿足科研用戶全方位科研需求的檢索結(jié)果。
(3)顛覆性技術(shù)分析:提供科學研究主題的關(guān)鍵技術(shù)知識圖譜,揭示關(guān)鍵技術(shù)突破可能帶來的顛覆性技術(shù)創(chuàng)新機會。
(4)全要素知識圖譜:提供人才—科學—技術(shù)—成果四維一體的全創(chuàng)新要素關(guān)聯(lián)知識圖譜,滿足成果轉(zhuǎn)移轉(zhuǎn)化過程中產(chǎn)學研創(chuàng)新主體及風險投資機構(gòu)個性化的技術(shù)、人才和機構(gòu)的信息需求。
(5)潛在合作推薦:提供研發(fā)合作網(wǎng)絡(luò)知識圖譜,揭示研發(fā)合作網(wǎng)絡(luò)的機構(gòu)、熱點領(lǐng)域和核心團隊分布。
(6)產(chǎn)業(yè)發(fā)展態(tài)勢追蹤:提供面向重大產(chǎn)品全創(chuàng)新鏈的“科學—技術(shù)—產(chǎn)業(yè)”成長知識圖譜,協(xié)助科研用戶及時了解產(chǎn)業(yè)發(fā)展態(tài)勢和學術(shù)研究發(fā)展動態(tài),為鐵路行業(yè)重大新產(chǎn)品研發(fā)、科技成果技術(shù)成熟度評價、科技成果信息的知識管理與運用提供決策支持。
平臺通過創(chuàng)新服務(wù),初步實現(xiàn)了智能化科研、網(wǎng)絡(luò)化協(xié)同、場景化配置、服務(wù)化延伸及數(shù)字化管理,促進了鐵路行業(yè)科研管理向更加柔性化轉(zhuǎn)變。
科研管理智能服務(wù)平臺為所有用戶提供統(tǒng)一的登陸門戶與身份認證平臺,其功能如下。
在科研管理活動中,科研管理智能服務(wù)平臺可提供從科研項目立項、執(zhí)行、結(jié)題到成果產(chǎn)業(yè)化全流程中每一環(huán)節(jié)的定制化、配置化專屬流程服務(wù)。
科研管理智能服務(wù)平臺提供豐富的面向課題研究的服務(wù)。
(1)課題立項階段:為科研人員提供國家重大專項、重大計劃、科學技術(shù)部項目等基金項目信息,并基于科研人員的研究方向制定個性化的基金項目推送。
(2)課題執(zhí)行階段:為科研人員提供課題研究內(nèi)容相關(guān)的信息推送,及時跟進研究最新動態(tài),推進科研項目研究進展。
(3)課題結(jié)題階段:依據(jù)合同要求評價課題完成情況,使用語義查重系統(tǒng)鑒定課題成果的原創(chuàng)性。
(4)課題成果產(chǎn)業(yè)化階段:利用平臺為企業(yè)需求與科研成果對接提供機會,加速科研成果的轉(zhuǎn)移轉(zhuǎn)化,推動鐵路行業(yè)高質(zhì)量發(fā)展。
科研管理智能服務(wù)平臺可根據(jù)科研用戶實際需求,提供智能檢索、研究趨勢預測及知識圖譜展示等功能。
(1)在智能檢索模塊,基于知識圖譜對用戶檢索式進行語義擴展,提高檢索查全率。
(2)在研究趨勢預測模塊,基于權(quán)威專家判斷結(jié)論、文獻和專利計量的統(tǒng)計與聚類分析結(jié)果、權(quán)威機構(gòu)發(fā)布的研究報告、科學技術(shù)獎勵等統(tǒng)計數(shù)據(jù)及多維度分析指標,分析研究前沿與研究熱點,發(fā)現(xiàn)潛在的突破性或顛覆性技術(shù)。
(3)在知識圖譜可視化模塊,基于國家重大科技專項和重點研發(fā)計劃項目成果信息及相關(guān)產(chǎn)業(yè)創(chuàng)新發(fā)展信息,實現(xiàn)關(guān)鍵技術(shù)突破、研發(fā)合作網(wǎng)絡(luò)、全創(chuàng)新要素關(guān)聯(lián)及面向重大產(chǎn)品全創(chuàng)新鏈等多種類型的知識圖譜展示。
科研管理智能服務(wù)平臺已在國鐵集團、中國鐵道科學研究院集團有限公司、蘭州局集團公司、太原局集團公司、廣州局集團公司等單位成功應(yīng)用,社會效益顯著。
該平臺匯集了國鐵集團及各所屬單位的科研項目立項、合同、結(jié)題、技術(shù)評審、獎勵等科研全過程數(shù)據(jù),鐵路企業(yè)主要產(chǎn)品等產(chǎn)業(yè)鏈數(shù)據(jù),鐵路行業(yè)全領(lǐng)域的論文、專利等公開數(shù)據(jù),數(shù)據(jù)條數(shù)達千萬級別,最早可追溯至1957年。通過開發(fā)自動化數(shù)據(jù)加工平臺,基于鐵路技術(shù)詞表和產(chǎn)業(yè)詞表對科研數(shù)據(jù)進行標引,構(gòu)建機車車輛、牽引供電、通信信號等行業(yè)細粒度專題庫。利用數(shù)據(jù)挖掘、自然語言處理等信息技術(shù),對各類資源進行關(guān)聯(lián)分析,嘗試實現(xiàn)創(chuàng)新鏈、技術(shù)鏈、知識鏈、產(chǎn)業(yè)鏈之間的互聯(lián)互通,改善了鐵路各單位系統(tǒng)分散、技術(shù)標準不統(tǒng)一的現(xiàn)狀,形成了鐵路行業(yè)科研資源知識服務(wù)生態(tài)體系,如圖3所示。該平臺的應(yīng)用為鐵路行業(yè)工作人員提供了智能、精準、及時的個性化定制科研信息服務(wù),為實現(xiàn)科研決策提供支撐。
圖3 鐵路行業(yè)科研資源知識服務(wù)生態(tài)體系
本文結(jié)合鐵路行業(yè)科研管理現(xiàn)狀,構(gòu)建了集云平臺、數(shù)據(jù)匯集層、信息關(guān)聯(lián)層、信息分析層、知識組織層及創(chuàng)新服務(wù)層于一體的鐵路行業(yè)科研管理智能服務(wù)平臺,并面向鐵路行業(yè)開展了應(yīng)用實踐。該平臺將面向科研成果的被動知識服務(wù)升級為面向科研用戶需求的主動知識服務(wù),以科研為主線,貫穿科研項目管理、科技成果管理、科研項目后評估等活動,為不同等級、不同角色的科研管理人員設(shè)定不同權(quán)限,實現(xiàn)科研全流程數(shù)字化管理,極大地提高了科研管理工作效率。
未來,將繼續(xù)圍繞鐵路科技創(chuàng)新生態(tài)體系,進一步從科研管理信息服務(wù)的精準度、及時度、專業(yè)度、智能化及個性化等角度升級完善平臺的數(shù)據(jù)與服務(wù);進一步集成科技專家、知識產(chǎn)權(quán)、科技評價、科技獎勵、技術(shù)標準、質(zhì)量抽查、產(chǎn)品認證等業(yè)務(wù)子系統(tǒng),對其整合并實行分級分類授權(quán),以提高科技資源使用率,為鐵路科研成果的高效管理與科技成果的轉(zhuǎn)移轉(zhuǎn)化提供有力支持。