冉從敬 宋凱 何夢婷
摘 要:[目的/意義]校企合作代表的是知識系統(tǒng)與產(chǎn)業(yè)系統(tǒng)間的合作,企業(yè)選擇特定技術(shù)領(lǐng)域下的最佳高??蒲袌F隊進行合作,對促進校企聯(lián)動發(fā)展、提升企業(yè)創(chuàng)新能力、推動高??萍汲晒D(zhuǎn)化具有重要意義。[方法/過程]本文構(gòu)建了高校前沿科研團隊探測模型,從企業(yè)視角出發(fā),以主題模型和聚類算法為技術(shù)支撐,獲取技術(shù)領(lǐng)域下的多個子技術(shù)主題,從更加細粒度的層面明確企業(yè)的研究重點和薄弱領(lǐng)域,進而在子技術(shù)主題層面,以相似專利密度對高校進行排名,明確最佳合作高校,并在此基礎上,以相似專利為媒介,挖掘高??蒲袌F隊,以提升校企產(chǎn)學研合作效率。[結(jié)論/發(fā)現(xiàn)]以區(qū)塊鏈為技術(shù)領(lǐng)域,以眾安科技為企業(yè)對象,對高校前沿科研團隊探測模型進行驗證,明確了眾安科技的研究重點和薄弱領(lǐng)域,并確定了子領(lǐng)域下的最佳合作高校和科研團隊,驗證了所提模型的有效性。[創(chuàng)新/價值]從專利視角出發(fā),在更加細粒度的技術(shù)主題層面進行校企合作匹配,為提升校企合作效率、推動技術(shù)創(chuàng)新、實現(xiàn)高??萍汲晒D(zhuǎn)化提供實踐路徑。
關(guān)鍵詞:主題模型;聚類算法;高校;企業(yè);校企合作;對象選擇;專利;前沿科研團隊;區(qū)塊鏈技術(shù);技術(shù)創(chuàng)新;科技成果轉(zhuǎn)化
Abstract:[Purpose/Significance]The industry-university cooperation represents the cooperation between the knowledge system and the industrial system.The selection of the best cooperation objects between enterprises and universities has a great significance to promote the joint development of schools and enterprises,enhance the innovation ability of enterprises,and promote the transformation of scientific and technological achievements in universities.[Method/Process]This paper constructed a detection model of frontier scientific research teams in universities.From the perspective of enterprises,the topic model and clustering algorithm were used as technical support to acquire multiple sub-technical topics in the technical field,and to clarify the research focus and weak areas of the enterprise from a more fine-grained level.Then,at the sub-technical theme level,the university was ranked by similar patent density,and the best cooperative colleges were identified.On this basis,similar research patents were used as the medium to explore university research teams and improve the efficiency of cooperation between schools,universities,and universities.[Findings/Conclusion]Taking blockchain as the technical field and ZhongAn Technology as the enterprise object,the industry-university cooperation object selection model was verified.The research focus and weak areas of ZhongAn Technology were clarified,and the best cooperative universities and research teams in the sub-areas were identified.The validity of the proposed model was verified,which provided a practical path for the selection of school-enterprise cooperation objects.[Originality/Value]From the perspective of patent,school-enterprise cooperation was matched at a more fine-grained technical theme level,which provided a practical path for improving the efficiency of school-enterprise cooperation,promoting technological innovation and realizing the transformation of scientific and technological achievements in universities.
Key words:topic model;clustering algorithm;university enterprise;industry-university;object selection;patent;frontier scientific research team;blockchain;technological innovation;trans formation of scientific and technological achievements
自20世紀80年代以來,高校和企業(yè)之間的產(chǎn)學研合作行為大量涌現(xiàn),已逐漸成為世界各國技術(shù)創(chuàng)新的主流模式[1]。1992年,由國家經(jīng)貿(mào)委、國家教委和中國科學院聯(lián)合組織實施產(chǎn)學研工程,這一工程對促進我國產(chǎn)學研合作,推動我國科技與經(jīng)濟的發(fā)展發(fā)揮了重要作用。2015年3月,國務院印發(fā)《關(guān)于深化體制機制改革加快實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略的若干意見》,要求緊扣經(jīng)濟社會發(fā)展重大需求,著力打通科技成果向現(xiàn)實生產(chǎn)力轉(zhuǎn)化的通道,把創(chuàng)新成果變成實實在在的產(chǎn)業(yè)活動[2]。2017年10月,習近平主席在十九大報告中指出,深化科技體制改革,建立以企業(yè)為主體、市場為導向、產(chǎn)學研深度融合的技術(shù)創(chuàng)新體系[3]。2018年1月,國務院印發(fā)《關(guān)于全面加強基礎科學研究的若干意見》,要求創(chuàng)新體制機制,推動基礎研究、應用研究與產(chǎn)業(yè)化對接融通,促進科研院所、高校、企業(yè)、創(chuàng)客等各類創(chuàng)新主體協(xié)作融通[4]。2019年9月,科技部印發(fā)《關(guān)于促進新型研發(fā)機構(gòu)發(fā)展的指導意見》,要求結(jié)合產(chǎn)業(yè)發(fā)展實際需求,構(gòu)建產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟,探索長效穩(wěn)定的產(chǎn)學研結(jié)合機制[5]。同年9月,國務院印發(fā)《交通強國建設綱要》,要求建立以企業(yè)為主體、產(chǎn)學研用深度融合的技術(shù)創(chuàng)新機制,建設一批具有國際影響力的實驗室、試驗基地、技術(shù)創(chuàng)新中心等創(chuàng)新平臺[6]。一系列政策的頒布表明,校企產(chǎn)學研合作對推進資源的區(qū)域整合與共享,促進科技成果轉(zhuǎn)移轉(zhuǎn)化,推動科技創(chuàng)新和經(jīng)濟社會發(fā)展深度融合具有重要意義。高??蒲袌F隊在技術(shù)研發(fā)、人才資源、實驗條件方面具有相對優(yōu)勢;而企業(yè)在技術(shù)轉(zhuǎn)化、就業(yè)崗位、資金支持上具有相對優(yōu)勢,兩者合作能實現(xiàn)優(yōu)勢互補,推進創(chuàng)新發(fā)展,從而成為地方政府和區(qū)域經(jīng)濟研究學者的關(guān)注熱點。
國內(nèi)外學者從多個角度對校企合作展開了探討。在研究校企合作影響因素方面,國外學者如Szucs F運用雙重差分估計,對歐委會第七框架計劃進行分析,探討了大規(guī)模的創(chuàng)新企業(yè)補貼計劃對校企合作的影響[7]。Rybnicek R等從制度因素、關(guān)系因素、產(chǎn)出因素、框架因素出發(fā),系統(tǒng)論述了影響校企合作的重要影響因素[8]。國內(nèi)學者如劉桂鋒等運用社會網(wǎng)絡分析法繪制了“211”高校與企業(yè)以及其他高校之間的產(chǎn)學研專利合作網(wǎng)絡,并重點探討了校企合作的技術(shù)領(lǐng)域和地理距離[9]。林慶藩等引入多層線性模型,考察省級產(chǎn)學研合作政策對省域校企技術(shù)合作專利產(chǎn)出的直接影響,以及國家級產(chǎn)學研合作政策對省域校企技術(shù)合作專利產(chǎn)出的間接影響[10]。劉繼紅等從高校科研人員角度,對校企知識轉(zhuǎn)移途徑及其影響因素進行系統(tǒng)研究[11]。曹?,摰然诶婀踩輽C制把案例庫和專利庫建設有機結(jié)合作為校企合作平臺,校企雙方在“共贏”條件下完成深度融合是一種可操作途徑[12]。在研究校企合作的促進作用方面,國外學者如Han J等運用負二項回歸分析分析了韓國135所高校技術(shù)轉(zhuǎn)移的影響因素,研究表明,高校應積極開展與民營企業(yè)的合作研究,以提升技術(shù)轉(zhuǎn)移效率[13]。Nave A等從企業(yè)家視角出發(fā),借助于半結(jié)構(gòu)化訪談,探討了校企合作對企業(yè)可持續(xù)發(fā)展的影響[14]。國內(nèi)學者孫玉濤等以社會網(wǎng)絡理論與資源基礎觀為基礎,提出在高校與其他機構(gòu)的研發(fā)合作過程中校企研發(fā)合作及其規(guī)模有利于高校技術(shù)轉(zhuǎn)移[15]。王曉紅等利用2007-2014年我國88所高校的面板數(shù)據(jù),采用Sys-GMM模型方法,實證研究了校企合作活動對我國高??蒲锌冃У挠绊慬16]。在研究校企合作演進態(tài)勢方面,國內(nèi)學者如張珩等基于國家知識產(chǎn)權(quán)局公開的1985-2015年江蘇省校企合作申請發(fā)明專利數(shù)據(jù),運用社會網(wǎng)絡分析方法,分析專利合作網(wǎng)絡結(jié)構(gòu)及空間分布演化路徑[17]。李雨濃等采用中國專利全文數(shù)據(jù)庫,以“985高?!睘槔瑯?gòu)建校企專利合作網(wǎng)絡,對網(wǎng)絡的整體結(jié)構(gòu)特征、高校和企業(yè)在網(wǎng)絡中所處的地位進行分析[18]。李文靜統(tǒng)計校企發(fā)明專利合作的申請,對比廣東高校和企業(yè)在行政區(qū)內(nèi)外校企合作創(chuàng)新網(wǎng)絡的特點和差異,以期對現(xiàn)階段廣東校企產(chǎn)學研技術(shù)創(chuàng)新的功能定位及校企合作的緊密度和廣度有一個總體認識[19]。陸亦愷等以中國C9聯(lián)盟高校為研究對象,運用社會網(wǎng)絡分析方法,探討了我國高校專利合作的主要特征與模式[20]。許敏等基于71所高校與企業(yè)合作申請的發(fā)明專利數(shù)據(jù),運用社會網(wǎng)絡分析方法,分析了專利合作網(wǎng)絡空間分布特點與網(wǎng)絡結(jié)構(gòu)特征[21]。
分析發(fā)現(xiàn),已有研究主要集中在利用多元統(tǒng)計分析方法探討校企合作開展的影響因素、分析校企合作對高校技術(shù)轉(zhuǎn)移的促進作用、基于社會網(wǎng)絡分析論述校企合作的演進態(tài)勢等,但較少從校企合作對象選擇的角度出發(fā),探索合作對象的精準匹配對推動校企合作的積極影響。高校和企業(yè)旨在為了市場需求和共同整體利益聯(lián)合起來,采取多種方式方法所進行的科研開發(fā)、生產(chǎn)營銷、咨詢服務等經(jīng)濟合作活動,是技術(shù)創(chuàng)新上游、中游、下游的對接與融合。在企業(yè)的重點研究領(lǐng)域,與具備較強科研能力的科研團隊展開校企合作,能夠進一步深化技術(shù)研究,創(chuàng)新科技邊界;在企業(yè)技術(shù)薄弱領(lǐng)域,可通過校企合作,快速提升企業(yè)技術(shù)能力,進而推動高??萍汲晒D(zhuǎn)化。所以,本文從企業(yè)視角出發(fā),構(gòu)建高校前沿科研團隊探測模型,討論如何在企業(yè)重點研究領(lǐng)域和薄弱領(lǐng)域,確定最佳高??蒲袌F隊進行合作。由于一個技術(shù)領(lǐng)域中會存在多個子領(lǐng)域,如電動汽車技術(shù)存在電池系統(tǒng)、發(fā)動機、運行控制、傳感器等多個子技術(shù)領(lǐng)域,所以,有必要從更加細粒度的層面探索校企合作對象的匹配路徑。因此,本文首先構(gòu)建高校前沿科研團隊探測模型,利用LDA模型對校企專利文本進行主題建模,并結(jié)合K-means算法實現(xiàn)專利文本聚類,進而明確企業(yè)重點研究領(lǐng)域和薄弱領(lǐng)域,并根據(jù)相似專利密度指標,確定每個子技術(shù)領(lǐng)域下的高校排名,從而確定在企業(yè)重點研究領(lǐng)域和薄弱領(lǐng)域下的最佳合作高校,并以相應子領(lǐng)域下最佳合作高校的專利為媒介,探尋對應高校的科研團隊,建立校企產(chǎn)學研合作,最終實現(xiàn)企業(yè)明確研究重點和薄弱領(lǐng)域、鎖定合作高校、發(fā)掘科研團隊、建立校企合作的全過程。在提出模型的基礎上,以“區(qū)塊鏈”作為重點研究的技術(shù)領(lǐng)域,以“眾安科技”為企業(yè)對象,驗證所提模型的有效性,為提升校企合作效率、推動技術(shù)創(chuàng)新、實現(xiàn)高??萍汲晒D(zhuǎn)化提供實踐路徑。
1 研究方法與工具
1.1 主題模型
考慮到一個技術(shù)領(lǐng)域會涵蓋多個子技術(shù)領(lǐng)域,在校企合作對象選擇過程中,有必要對相應技術(shù)領(lǐng)域中的專利文本進行主題提取,明確其涉及的子領(lǐng)域主題。因此,本文采用LDA模型對專利文本進行主題建模,LDA模型假設詞是由一個主題混合產(chǎn)生,同時每個主題是在固定詞表上的一個多項式分布,這些主題被集合中的所有文檔所共享,每個文檔有一個特定的主題比例,從Dirichlet分布中抽樣產(chǎn)生,作為一種產(chǎn)生式模型,其結(jié)構(gòu)模型完整清晰,采用高效的概率推斷算法處理大規(guī)模數(shù)據(jù),是目前研究和使用非常廣泛的一種主題識別模型[22]。
在主題發(fā)現(xiàn)與主題演化研究中,利用LDA模型能夠展示主題抽取的結(jié)果,涉及文檔—主題矩陣、主題—詞矩陣、主題相關(guān)詞列表等。而應用LDA最大的問題是需要人工確定主題數(shù)目,主題數(shù)目的確定直接影響主題發(fā)現(xiàn)的效果。因此,本文利用R語言中的LDAvis包進行計算,LDAvis包中通過多維尺度分析明確各個主題間的相似度,并通過可視化方式進行展示。通過調(diào)整主題數(shù)目、Alpha值和Beta值,當主題之間相互獨立、互不交叉,表示對應模型最優(yōu)。
1.2 聚類分析
在明確技術(shù)領(lǐng)域涵蓋的主題后,需要將專利文本劃歸到子技術(shù)主題中,因此,本文采用聚類分析實現(xiàn)對專利文本的劃分。考慮到一件專利進行技術(shù)探討時。技術(shù)主題具有專一性、深入化的特征,所以,本文在進行聚類分析時將一件專利僅劃入到一個類團中。聚類分析是知識發(fā)現(xiàn)中的一項重要研究內(nèi)容,旨在將數(shù)據(jù)集合劃分為若干個類,使得類內(nèi)差異小,類間差異大。本文采用的K-means算法,是數(shù)據(jù)挖掘十大經(jīng)典算法之一,由MacQueen J于1967年提出,因其具有簡單、容易實施、時間復雜度接近線性的優(yōu)點,且對大規(guī)模數(shù)據(jù)挖掘具有高效性和可伸縮性,被廣泛應用于文本聚類的研究中。
1.3 文本聚類
在文本聚類方面,由于文本向量維度高,具有稀疏性,不同簇之間的差異性較大,因此可能導致聚成一簇的文本之間的非相似性,同時,應用K-means算法存在隨機選取初始聚類中心導致聚類結(jié)果不穩(wěn)定的現(xiàn)象,往往容易陷入局部最優(yōu),導致較差的聚類結(jié)果。所以,如何獲得合適的初始聚類中心,并在保證算法結(jié)果穩(wěn)定性的同時保持其準確性,對提升算法的聚類性能尤為重要。因此,本文將LDA模型和K-means算法融合實現(xiàn)專利文本聚類,首先利用LDA模型進行主題建模,將每篇文檔表示成各主題下的概率分布,降低文檔向量的維度,克服傳統(tǒng)向量空間模型表示文本的缺陷;然后在K個主題所在的維度上確定初始聚類中心,理論上保證了選擇的初始聚類中心是基于概率確定的,進一步用這K個初始聚類中心對專利數(shù)據(jù)集進行聚類。主要計算過程如下:
1)根據(jù)LDAvis包的多維尺度分析結(jié)果,確定最優(yōu)主題數(shù)目K;
2)利用LDA模型對N篇專利文獻進行主題建模,生成N*K維的文檔—主題矩陣(D-T矩陣);
3)在D-T矩陣中,每一行表示K個技術(shù)主題在一篇專利文獻中的匹配度,每一列表示一個技術(shù)主題在N篇專利文獻中的匹配度;
4)對每一個技術(shù)主題,首先計算該主題對N篇專利文獻的平均匹配度M,進而統(tǒng)計匹配度大于M的專利文獻作為匹配文獻,記為MP,而匹配文獻數(shù)量記為MDi(0≤i 5)將重要主題數(shù)作為K-means算法的聚類數(shù)W,計算每個重要主題中匹配文獻的平均匹配度作為對應類團的初始聚類中心(C1,C2,C3,…,Cw); 6)將LDA模型生成的D-T矩陣導入到SPSS中,利用K-means算法進行文本聚類,設置聚類數(shù)和初始聚類中心,設置迭代次數(shù),輸出聚類成員劃分,實現(xiàn)專利文獻的文本劃分。 2 高校前沿科研團隊探測模型構(gòu)建 基于主題模型和聚類算法,從更加細粒度的子技術(shù)主題層面,為企業(yè)匹配高校前沿科研團隊,探測模型內(nèi)容如圖1所示。 從圖1中可以發(fā)現(xiàn),整個模型共分為5個部分,涵蓋“數(shù)據(jù)檢索→數(shù)據(jù)處理→主題建?!谋揪垲悺Y(jié)果分析”的全過程,具體內(nèi)容如下: 1)數(shù)據(jù)檢索。首先從企業(yè)視角出發(fā),根據(jù)企業(yè)的研發(fā)重點確定一個技術(shù)領(lǐng)域。進而,選擇專利數(shù)據(jù)庫檢索專利文獻,如SIPO、SooPAT、佰騰、CNKI等專業(yè)數(shù)據(jù)庫,獲取企業(yè)在特定技術(shù)領(lǐng)域的所有專利以及高校的相關(guān)專利。 2)數(shù)據(jù)處理。對收集的專利文獻進行整合,通過序號標簽區(qū)分企業(yè)和高校。首先對專利文本進行分詞,收集專業(yè)文獻中的關(guān)鍵詞形成第一版本的詞典;進而利用R語言的JiebaR包進行文本分詞、去停用詞等自然語言處理過程;對分詞結(jié)果進行整理,更新詞典,迭代多輪,獲取最優(yōu)的分詞結(jié)果集。分詞結(jié)束后,利用TF*IDF算法計算每個詞的權(quán)重,去除權(quán)重較低的詞,最終形成實驗語料集。 3)主題建模。利用R語言中的lda包對實驗語料集進行主題提取,在主題建模過程中,不斷調(diào)整主題數(shù)目、Alpha值和Beta值,并通過LDAvis包的多維尺度分析確定最優(yōu)主題數(shù)目,獲得最優(yōu)的主題模型。通過LDA主題提取,獲取文檔—主題概率矩陣(D-T矩陣),以及每個主題下最相關(guān)的語義詞,用于對主題進行概括。 4)文本聚類。依據(jù)獲取的DT矩陣,計算K-means算法的聚類數(shù)和初始聚類中心,將DT矩陣導入到SPSS中,設置聚類數(shù)和初始聚類中心實現(xiàn) 專利文獻的聚類。 5)結(jié)果分析。根據(jù)聚類結(jié)果,首先對企業(yè)進行分析,統(tǒng)計其每篇專利文獻所屬的技術(shù)主題,確定其重點研究方向和薄弱領(lǐng)域;進而對高校專利文獻進行歸類,以相似專利密度作為排名指標,明確在企業(yè)重點研究領(lǐng)域和薄弱領(lǐng)域中的最佳合作高校,并以此為基礎,以相似專利為媒介,挖掘高校中的前沿科研團隊,最終促成校企合作,發(fā)揮各自優(yōu)勢,提升科技創(chuàng)新效率,推動高??萍汲晒D(zhuǎn)化。
3 實驗過程及分析
3.1 數(shù)據(jù)來源及處理
本文專利數(shù)據(jù)來源于Scoopat專利數(shù)據(jù)庫,企業(yè)選擇“眾安信息技術(shù)服務有限公司”,眾安科技作為國內(nèi)首家互聯(lián)網(wǎng)保險公司—眾安保險的全資科技子公司,一直聚焦于大數(shù)據(jù)、云計算、區(qū)塊鏈、人工智能等領(lǐng)域的基礎技術(shù)研發(fā)。自中本聰2008年首次提出比特幣概念和區(qū)塊鏈理論以來,區(qū)塊鏈逐漸成為各界所關(guān)注的焦點,并被認為是繼蒸汽機、電力、互聯(lián)網(wǎng)之后的下一代顛覆性技術(shù)。因此,本文選擇“區(qū)塊鏈”作為重點研究技術(shù)領(lǐng)域,以“區(qū)塊鏈”為名稱進行檢索,其他條件不限,截止2019年8月,眾安科技已申請相關(guān)專利110項。進而檢索高校的專利申請情況,以“區(qū)塊鏈”為名稱,申請人為“大學”,其他條件不限,檢索到666條數(shù)據(jù),涵蓋151所高校。分別導出企業(yè)和高校專利數(shù)據(jù),其中包含專利名稱、申請人、發(fā)明人、摘要等重要字段內(nèi)容。
首先將眾安科技和大學的專利數(shù)據(jù)合并,共776條數(shù)據(jù),其中前110條為眾安科技的專利文獻。抽取專利名稱和摘要兩個字段,利用R語言的JiebaR包進行分詞、去停用詞等自然語言處理過程,通過反復迭代,更新詞典,形成分詞效果較優(yōu)的實驗語料集,進而利用TF*IDF計算去除權(quán)重較低的無用詞如“裝置”、“方法”、“系統(tǒng)”等,形成完善的實驗數(shù)據(jù)集用于主題建模。
3.2 主題建模及文本聚類
獲取處理后的實驗數(shù)據(jù)集后,利用R語言的lda包進行主題建模,進而利用LDAvis包進行主題結(jié)果的可視化展示,基于多維尺度分析判斷主題模型抽取結(jié)果的優(yōu)異程度。通過不斷調(diào)整主題數(shù)目、Alpha值和Beta值,當主題數(shù)目為10個,Alpha=0.5,Beta=0.2時,基于LDAvis的包呈現(xiàn)的主題可視化結(jié)果,各個主題之間相互獨立,互不交叉,表明主題數(shù)目最優(yōu),主題結(jié)構(gòu)穩(wěn)定,見圖2;抽取每個主題下最相關(guān)的10個詞并對主題進行概括,如表1所示。
分析表1發(fā)現(xiàn),眾安科技和各大高校在區(qū)塊鏈圖2 LDA模型最優(yōu)主題數(shù)目(K=10,Alpha=0.5,Beta=0.2)中,重點研究的技術(shù)主題有:分布式應用、數(shù)據(jù)存儲、物聯(lián)網(wǎng)應用、隱私保護、數(shù)據(jù)溯源、用戶認證、醫(yī)療行業(yè)應用、數(shù)據(jù)加密、智能合約、交易系統(tǒng)。由于區(qū)塊鏈具有去中心化、不可篡改、開放透明和安全可信的特征,在信息共享、版權(quán)保護、身份認證、資源存儲、網(wǎng)絡眾籌、數(shù)據(jù)溯源等方面都能帶來創(chuàng)新性的應用和推廣,其涵蓋的多個子技術(shù)領(lǐng)域成為企業(yè)和高校研究的重點方向。
利用LDA模型進行主題提取后,根據(jù)文本聚類的計算過程,利用LDA訓練出的文檔—主題矩陣,確定出10個重要主題,通過計算后的初始聚類中心為(0.223060801,0.2219837,0.221285027,0.222431049,0.230310546,0.222381483,0.223766727,0.232143274,0.221062853,0.227264455),將LDA模型訓練出的D-T矩陣導入到SPSS中,設置好聚類數(shù)和初始聚類中心,得到最終的專利文獻聚類結(jié)果。
3.3 結(jié)果分析
根據(jù)文本聚類結(jié)果,LDA模型中的每一個主題對應K-means聚類的一個類團,首先統(tǒng)計眾安科技的專利文獻在每個主題中的分布情況,如表2所示;進而對高校中的專利文獻在每個主題中的分布情況進行統(tǒng)計,以相似專利密度為指標進行排名,獲取每個主題下排名前3的高校進行展示,如表3所示;最后,根據(jù)眾安科技的重點研究領(lǐng)域和薄弱領(lǐng)域,確定最佳的合作高校,根據(jù)相似專利挖掘前沿科研團隊,如圖3所示。
分析表2發(fā)現(xiàn),主題2—數(shù)據(jù)存儲,主題9—智能合約、主題3—物聯(lián)網(wǎng)應用、主題4—隱私保護是眾安科技的重點研究子領(lǐng)域。眾安保險是中國首家互聯(lián)網(wǎng)保險公司,用戶的整個投保過程全部通過線上實現(xiàn),中間涉及數(shù)據(jù)傳輸、交易訂單、信息審核、用戶核保等過程,因此,其更加重視數(shù)據(jù)傳輸?shù)姆€(wěn)定性、訂單交易的安全性、用戶信息的保密性等。所以,通過分析眾安科技的專利申請情況,其在區(qū)塊鏈研究中的重點也集中在利用區(qū)塊鏈的去中心化實現(xiàn)數(shù)據(jù)的分布式存儲、利用智能合約技術(shù)實現(xiàn)交易的端到端交易和用戶隱私保護、利用區(qū)塊鏈的不可篡改性保障用戶利益。一方面,根據(jù)文本聚類發(fā)現(xiàn)了眾安科技的重點研究子領(lǐng)域;另一方面,其在主題5—數(shù)據(jù)溯源、主題8—數(shù)據(jù)加密、主題7—醫(yī)療行業(yè)應用、主題10—交易系統(tǒng)、主題1—分布式應用方面存在較大的提升空間,而這些子技術(shù)主題也與其業(yè)務開展密切相關(guān)。因此,以子領(lǐng)域的相似專利密度為指標,確定最佳的合作高校的過程中。
分析表3發(fā)現(xiàn),根據(jù)每個子領(lǐng)域下相似專利密度的排名結(jié)果,眾安科技在其重點研究子領(lǐng)域主題2→數(shù)據(jù)存儲的最佳合作高校分別為:廣東工業(yè)大學、暨南大學、浙江大學;主題9→智能合約的最佳合作高校分別為:電子科技大學、西安電子科技大學、杭州電子科技大學;主題3→物聯(lián)網(wǎng)應用的最佳合作高校分別為:電子科技大學、北京航空航天大學、南京理工大學;主題4→隱私保護最佳合作高校分別為:電子科技大學、廣東工業(yè)大學、清華大學。其中廣州工業(yè)大學和電子科技大學的相似專利密度在子技術(shù)主題下排名首位,電子科技大學申請區(qū)塊鏈相關(guān)專利37件,廣州工業(yè)大學申請專利33件,在所有高校專利申請中也位居前列,在區(qū)塊鏈研究領(lǐng)域具備足夠的競爭力,在校企產(chǎn)學研合作中能夠提供充分的創(chuàng)新支持。而眾安科技在其弱勢領(lǐng)域如主題5→數(shù)據(jù)溯源,可考慮與北京工業(yè)大學、西安電子科技大學、中國地質(zhì)大學(武漢)展開合作;主題1→分布式應用,可考慮中山大學、中國地質(zhì)大學(武漢)、西安電子科技大學展開合作。通過在弱勢領(lǐng)域開展校企合作,能充分利用高校已有的科技成果,降低企業(yè)創(chuàng)新成本,快速提升企業(yè)在弱勢領(lǐng)域的競爭力。
根據(jù)文本聚類的結(jié)果,明確了眾安科技在子技術(shù)領(lǐng)域?qū)用?,自身的研究重點和弱勢領(lǐng)域,進而依據(jù)相似專利密度指標,統(tǒng)計在子技術(shù)領(lǐng)域中的高校排名,分析出眾安科技在技術(shù)重點領(lǐng)域和弱勢領(lǐng)域的最佳合作高校。以此為基礎,進一步發(fā)掘?qū)咝5暮诵目蒲袌F隊,為企業(yè)在尋求校企合作時提供足夠的決策支持。以“主題2—數(shù)據(jù)存儲”為例,眾安科技在此主題上申請的專利數(shù)量最多,其最佳合作高校分別為廣東工業(yè)大學、暨南大學、浙江大學。對3所高校的專利文獻進行統(tǒng)計,抽取發(fā)明人字段,進行作者合作網(wǎng)絡分析,如圖3所示。分析圖3發(fā)現(xiàn),以廣東工業(yè)大學“張浩川—余榮”、暨南大學“羅偉其—翁健—楊安家—李明”、浙江大學“陳建?!吻坫憽睘楹诵牡难芯繄F隊,是眾安科技在進行區(qū)塊鏈數(shù)據(jù)存儲研究中,可重點開展產(chǎn)學研合作的高校團隊。通過校企合作,實現(xiàn)技術(shù)創(chuàng)新上下游的對接與融合,一方面能促進企業(yè)技術(shù)創(chuàng)新,提高企業(yè)核心競爭力;另一方面,能夠提升高校團隊產(chǎn)業(yè)實踐能力,推動科技成果轉(zhuǎn)化。
4 研究總結(jié)及展望
本文以校企合作過程中高校科研團隊探測作為研究重點,構(gòu)建了高校前沿科研團隊探測模型,以區(qū)塊鏈為技術(shù)領(lǐng)域,從企業(yè)視角出發(fā),借助于主題模型和聚類算法,以相似專利密度為指標,從子技術(shù)領(lǐng)域?qū)用嫣接懥嗽谄髽I(yè)重點研究領(lǐng)域和薄弱領(lǐng)域,如何為企業(yè)選取最佳高校團隊展開合作,為實現(xiàn)校企聯(lián)動發(fā)展,推動高??萍汲晒D(zhuǎn)化提供了實踐路徑,主要研究內(nèi)容如下:
1)在構(gòu)建高校前沿科研團隊探測模型階段,利用LDAvis包中的多維尺度分析解決LDA最優(yōu)主題數(shù)目的確定問題,并將LDA和K-means聚類算法結(jié)合,解決K-means算法初始聚類中心隨機選擇和聚類數(shù)目確定的問題,保證了模型構(gòu)建的合理性。
2)以眾安科技為企業(yè)視角,明確了其重點研究領(lǐng)域和薄弱領(lǐng)域,其目前專利申請重點集中在數(shù)據(jù)存儲,智能合約、物聯(lián)網(wǎng)應用、隱私保護;而在數(shù)據(jù)溯源、數(shù)據(jù)加密、醫(yī)療行業(yè)應用、交易系統(tǒng)等是其目前的薄弱領(lǐng)域。
3)以相似專利密度作為排名指標,統(tǒng)計在區(qū)塊鏈不同子領(lǐng)域主題下的高校排名,依據(jù)眾安科技及重點研究領(lǐng)域和薄弱領(lǐng)域,分別匹配最佳合作高校,并在此基礎上,以相似專利為媒介,發(fā)掘高校前沿科研團隊,為企業(yè)與高校開展產(chǎn)學研合作提供了決策支持。
需要說明的是,本文整個高校前沿科研團隊探測過程通過手動方式實現(xiàn),效率較低,且數(shù)據(jù)量較少,不能滿足人工智能環(huán)境下校企之間快速決策的需求。因此,在之后的研究中,將以對象選擇模型為基礎,擴大專利數(shù)據(jù)量,開發(fā)原型系統(tǒng),為企業(yè)和高校提供服務,真正實現(xiàn)理論研究應用于產(chǎn)業(yè)實踐,推動校企產(chǎn)學研合作,提升中國科技創(chuàng)新水平。
參考文獻
[1]劉春艷,馬海群.產(chǎn)學研協(xié)同創(chuàng)新團隊知識轉(zhuǎn)移影響機理的實證研究[J].情報理論與實踐,2018,41(4):87-93.
[2]中共中央國務院關(guān)于深化體制機制改革加快實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略的若干意見[EB/OL].http://www.gov.cn/xinwen/2015-03/23/content_2837629.htm,2019-09-20.
[3]習近平:決勝全面建成小康社會 奪取新時代中國特色社會主義偉大勝利——在中國共產(chǎn)黨第十九次全國代表大會上的報告[EB/OL].http://politics.gmw.cn/2017-10/27/content_26628091.htm,2019-09-20.
[4]國務院關(guān)于全面加強基礎科學研究的若干意見[EB/OL].http://www.gov.cn/zhengce/content/2018-01/31/content_5262539.htm,2019-09-20.
[5]科技部印發(fā)《關(guān)于促進新型研發(fā)機構(gòu)發(fā)展的指導意見》的通知[EB/OL].http://www.gov.cn/xinwen/2019-09/19/content_5431291.htm,2019-09-20.
[6]中共中央國務院印發(fā)《交通強國建設綱要》[EB/OL].http://www.gov.cn/zhengce/2019-09/19/content_5431432.htm,2019-09-20.
[7]Szucs F.Research Subsidies,Industry-University Cooperation and Innovation[J].Research Policy,2018,47(7):1256-1266.
[8]Rybnicek R,Konigsgruber R.What Makes Industry-University Collaboration Succeed?A Systematic Review of the Literature[J].Journal of Business & Economic,2018,89:221-250.
[9]劉桂鋒,盧章平,劉瓊,等.基于社會網(wǎng)絡分析的江蘇省高校產(chǎn)學研專利合作研究[J].情報雜志,2015,34(1):122-126,155.
[10]林慶藩,戴永務.產(chǎn)學研合作政策對校企技術(shù)合作績效的影響研究[J].中國高教研究,2017,(12):71-76.
[11]劉繼紅,喻學佳.校企知識轉(zhuǎn)移途徑的影響因素研究——基于高校科研人員視角[J].江蘇社會科學,2016,(3):264-272.
[12]曹?,?,趙大海,王鼎,等.專利庫和案例庫:基于利益共容機制的校企深度合作模式探索[J].高等工程教育研究,2018,(5):78-82.
[13]Han J,Kim J.Empirical Analysis of Technology Transfer in Korean Universities[J].International Journal of Innovation Management,2016,20(8).
[14]Nave A,F(xiàn)ranco M.University-Firm Cooperation as a Way to Promote Sustainability Practices:A Sustainable Entrepreneurship Perspective[J],Journal of Cleaner Production,2019,230:1188-1196.
[15]孫玉濤,劉小萌.校企研發(fā)合作與技術(shù)轉(zhuǎn)移關(guān)系——技術(shù)轉(zhuǎn)移中心的調(diào)節(jié)作用[J].科學學與科學技術(shù)管理,2017,38(9):13-22.
[16]王曉紅,張奔.校企合作與高??蒲锌冃В焊咝n愋偷恼{(diào)節(jié)作用[J].科研管理,2018,39(2):135-142.
[17]張珩,朱英明,楊連盛.江蘇校企專利合作網(wǎng)絡演化研究[J].科技進步與對策,2016,33(21):50-57.
[18]李雨濃,王博,張永忠,等.校企專利合作網(wǎng)絡的結(jié)構(gòu)特征及其演化分析——以“985高?!睘槔齕J].科研管理,2018,39(3):132-140.
[19]李文靜.區(qū)域校企專利合作申請網(wǎng)絡比較研究——基于廣東的實證分析[J].現(xiàn)代情報,2015,35(12):106-110,118.
[20]陸亦愷,石亮,張善杰.基于社會網(wǎng)絡分析的高校專利合作特征與案例研究[J].現(xiàn)代情報,2015,35(8):69-74.
[21]許敏,王慧敏.基于社會網(wǎng)絡分析的校企專利合作網(wǎng)絡結(jié)構(gòu)研究——長三角城市群高校的省際比較[J].科技管理研究,2018,38(24):87-95.
[22]宋凱,李秀霞,趙思喆,等.基于LDA模型的國家間知識流動分析[J].情報雜志,2017,36(6):55-60.
(責任編輯:陳 媛)