吳永清 羅賢春 文庭孝
摘?要:[目的/意義]采用企業(yè)專利大數(shù)據(jù),構造高維云模型,預測企業(yè)成長性。[方法/過程]選取中國股票市場創(chuàng)業(yè)板公司為研究對象,依據(jù)企業(yè)專利聚類結(jié)果,用逆向云模型多步式算法生成專利的云模型改造神經(jīng)網(wǎng)絡神經(jīng)元,構造云模型;用因子分析計算企業(yè)的成長性并通過聚類分析分成4類;用云模型補充不平衡數(shù)據(jù)。[結(jié)果/結(jié)論]研究表明,高維云神經(jīng)網(wǎng)絡能很好預測企業(yè)的成長性,準確性和穩(wěn)定性得到提高,同時也表明企業(yè)專利對其成長性有重要作用。企業(yè)專利對成長性的影響是復雜的:專利同族數(shù)、發(fā)明專利占比、專利權利要求數(shù)對企業(yè)的成長性促進作用,而單純專利數(shù)量有負面的影響。
關鍵詞:專利大數(shù)據(jù);高維云模型;RBF神經(jīng)網(wǎng)絡;企業(yè)成長性;創(chuàng)業(yè)板上市公司
DOI:10.3969/j.issn.1008-0821.2020.03.004
〔中圖分類號〕G255.53?〔文獻標識碼〕A?〔文章編號〕1008-0821(2020)03-0038-09
Abstract:[Purpose/Significance]The enterprise patent big data is used to construct a high-dimensional cloud model to predict the enterprise growth.[Method/Process]In this study,listed companies on GEM in the Chinese stock market were selected as the research object.According to the enterprise patent clustering results,the reverse cloud model was used to generate the patented cloud model to transform the neural network neurons and construct the cloud model.The enterprise growth was calculated by factor analysis and divided into four categories by cluster analysis.Unbalanced data was supplemented through cloud models.[Result/Conclusion]The research showed that the high-dimensional cloud neural network can well predict the enterprise growth,with the accuracy and stability of the predict being improved,and also showed that the enterprise patent played an important role in its growth.The influence of enterprise patent on growth was complex:the number of patent homogeneity,the proportion of invention patent,and the number of patent rights can promote the enterprise growth while the sheer number of ?patents had a negative impact on the enterprise growth.
Key words:enterprise patent big data;high-dimensional cloud model;RBF neural network;enterprise growth;listed companies on GEM
對于提升國家和企業(yè)的科技水平和競爭力,專利的作用越來越重要。根據(jù)世界知識產(chǎn)權組織(World Intellectual Property Organization)統(tǒng)計,有效運用專利文獻,可縮短技術和產(chǎn)品研發(fā)時間60%,并可節(jié)省研發(fā)費用40%;專利說明書中含有90%~95%的技術和產(chǎn)品研發(fā)成果,而其它技術文獻(如論文、期刊等)中,則僅含有5%~10%的研發(fā)成果[1]。世界知識產(chǎn)權組織2016年11月發(fā)布報告指出,2015年中國專利申請量達110多萬件,幾乎占到全球總量的四成[2]。2012-2016年期間,國內(nèi)專利受理數(shù)量以2位數(shù)的速度增長(除2014年為負增長外),2016年國內(nèi)專利受理為3 305 225件,至此累計為19 802 035件[3]。企業(yè)專利占整個國內(nèi)專利很大比重,1986年1月-2016年12月期間,企業(yè)占國內(nèi)職務發(fā)明創(chuàng)造專利受理量82.4%,國內(nèi)職務發(fā)明專利受理量72.2%,國內(nèi)職務外觀設計專利受理量93.5%,國內(nèi)職務實用新型專利受理量85.4%,在2016年企業(yè)上述專利分別占國內(nèi)職務專利的82%,74.8%,84.9%和93.4%[4]。
企業(yè)的成長性受到技術創(chuàng)新和研發(fā)投入的影響。企業(yè)的技術效率和研發(fā)投入對企業(yè)成長是非常重要的[5]。通過對首批在創(chuàng)業(yè)板上市的28家公司的相關指標得出影響企業(yè)成長性的影響因素有企業(yè)財務狀況、技術創(chuàng)新及應用能力等[6]。技術創(chuàng)新能力對公司成長性的貢獻也值得關注[7]。企業(yè)的研發(fā)經(jīng)費投入力度與技術創(chuàng)新績效產(chǎn)出均存在明顯的正相關關系[8]。R&D支出對企業(yè)成長性的正向促進作用非常明顯[9]。企業(yè)專利質(zhì)量促進公司投資價值增加[10]。國外學者對于研發(fā)及技術創(chuàng)新對企業(yè)成長性影響的研究更廣泛。Piekkola H根據(jù)芬蘭雇主與雇員關聯(lián)數(shù)據(jù)研究科研投入所生產(chǎn)的生產(chǎn)率增長,得出研發(fā)支出對中小企業(yè)生產(chǎn)率的增長有積極作用[11]。Alex Coad通過向量自回歸模型分析認識增加研發(fā)投資將有利于銷售和就業(yè)率的增長[12]。Pelin Demirel等對1950-2008年期間小型和大型美國上市制藥公司創(chuàng)新如何影響公司增長的差異進行了探討,得出創(chuàng)新會促進擁有專利5年以上小公司的增長[13]。Jeffrey I Bernstein等分析日本和加拿大工業(yè)得出研發(fā)溢出效應促進工業(yè)全要素生產(chǎn)率增長[14]。Andrin Spescha分析瑞士企業(yè)1995-2012年面板數(shù)據(jù)顯示:相對較大或較年輕的公司,更小、更成熟的公司在研發(fā)支出和銷售增長之間的關系更為積極[15]。Mario I Kafouros根據(jù)1989年78家公司評估研發(fā)對英國制造業(yè)生產(chǎn)率增長的影響,研發(fā)的貢獻大約是0.04,而且高科技行業(yè)的研發(fā)彈性相當高,為0.11[16]。
企業(yè)專利是技術創(chuàng)新和研發(fā)投入形成的重要成果呈現(xiàn),利用專利平臺提供的專利大數(shù)據(jù),構建基于云神經(jīng)網(wǎng)絡的企業(yè)專利對企業(yè)成長性判斷模型,提供企業(yè)成長性預警和判斷企業(yè)的成長性參考。
1?研究方法
云模型是由我國李德毅教授在20世紀90年代提出的定性定量間相互不確定性轉(zhuǎn)換的模型,它把隨機性和模糊性有機結(jié)合在一起,能描述不確定概念的模糊性和隨機性,并用計算機模擬表示定性概念,同時可以通過云模擬更好呈現(xiàn)隨機樣本所表示的特征。在打靶中,通過云發(fā)生器生成的云滴比原靶圖更能反映選手的水平[17]。云滴是根據(jù)原靶的數(shù)字特征生成的,它們組成的云團可以更加準確地反映選手的水平。云模型自提出來以后,得到很快的發(fā)展,并在很多領域得到廣泛應用,特別是一維云模型、二維云模型已大量應用于數(shù)據(jù)挖掘、網(wǎng)格資源分配、智能控制、數(shù)據(jù)預測等領域[18]。
1943年心理學家McCulloch和數(shù)學家Pitts發(fā)表了神經(jīng)元模型MP,它是一個包含輸入、計算、輸出功能的模型,即可以使用這些神經(jīng)元搭建神經(jīng)網(wǎng)絡,奠定神經(jīng)網(wǎng)絡的基礎。1988年Broomhead和Lowe將徑向基函數(shù)用于神經(jīng)網(wǎng)絡,實現(xiàn)對非線性函數(shù)的一種逼近,使得低維空間不可分的問題在轉(zhuǎn)換到高維空間后實現(xiàn)可分,在圖形處理、時間序列分析、模式識別和非線性控制領域得到廣泛應用。
用云模型改造RBF神經(jīng)網(wǎng)絡的神經(jīng)元,克服RBF神經(jīng)網(wǎng)絡隱含層神經(jīng)元數(shù)量和徑向函數(shù)確定的不足,克服RBF神經(jīng)網(wǎng)絡的硬分類缺陷[19],融入云模型的神經(jīng)網(wǎng)絡發(fā)揮神經(jīng)網(wǎng)絡的學習功能的同時提高神經(jīng)網(wǎng)絡的分類效果。
用因子分析法得出的特征值對企業(yè)的成長性指標進行權重分配,克服人為評價的主觀性,對企業(yè)成長性評價更加客觀。
2?模型構建
本文將云模型和神經(jīng)網(wǎng)絡兩種方法結(jié)合在一起,形成正態(tài)云神經(jīng)網(wǎng)絡模型,通過企業(yè)專利判斷企業(yè)的成長性。
2.1?高維云模型
云模型有3個數(shù)字特征,分別是期望Ex、熵En和超熵He,表達定性概念總體定量特征,表示為C(Ex,En,He),其圖形呈現(xiàn)為由若干云滴組成的云團,橫坐標為云滴值,縱標為云滴屬于定性概念的確定度。
期望Ex是最能代表定性概念的樣本點,也即典型的樣本點。熵En體現(xiàn)期望Ex的離散程度,同時反映定性概念的模糊性,即隸屬度。超熵He是熵的熵,反映熵的不確性,是En的離散程度。
單獨看每一個云滴,呈現(xiàn)隨機性,無規(guī)律可尋,而由許多云滴組成云圖則呈現(xiàn)云的規(guī)律性,反映模糊性和隨機性,云模型的數(shù)字特征是由許多云滴組成云團的統(tǒng)計特征。李德毅指出,云滴確定度的概率密度與云的3個數(shù)字特征無關,這反映人們認識的深層規(guī)律:不同的人會有不同的認識,不同的時期也會有不同的認識,但是云滴確定度的統(tǒng)計分布,總體上都是一個統(tǒng)一的形態(tài)。認識的不確定性仍然有著確定的規(guī)律性,提示了人們用不同語言值表示不同定性概念之間存在的認識上的共同性[20]。
云發(fā)生器實現(xiàn)定量數(shù)據(jù)和定性概念之間轉(zhuǎn)換,一個定性概念通過云發(fā)生器可生成許多定量數(shù)據(jù),也即一個定性概念對應多個定量數(shù)據(jù),盡管這些定量數(shù)據(jù)具有一定分散性,但它們整體聯(lián)合起來所表達的定性概念具有穩(wěn)定性。從分布來看,雖然每一個云滴分散的雜亂,但不影響許多云滴組成云團的整體特征。
云發(fā)生器有正向發(fā)生器和逆向發(fā)生器,X條件云發(fā)生器和Y條件云發(fā)生器。正向發(fā)生器是從定性到定量的過程,根據(jù)反映定性概念的云模型的3個特征,生成定性概念的定量表達。逆向發(fā)生器則是從定量到定性的過程,根據(jù)云滴(x,μ)生成反映定性概念的3個特征數(shù)字期望Ex、熵En和超熵He,得到定性概念的云表達模型。
正態(tài)云模型是常見的云模型,其云滴組成的云團圖形為圖3[21]。
正態(tài)云模型C(Ex,En,He)的正向發(fā)生器生成云滴的方法如下:
至此,得一個云團中的一個云滴(x,μ),重復步驟(1)~(3),就可得到N個云滴[22]。
X條件云發(fā)生器和Y條件云發(fā)生器是正向發(fā)生器的特殊形式,在知道X的條件下確定云滴,這時計算確定度,或在知道Y的條件下確定云滴,這時要計算X。這里的Y就是確定度。用到第(3)步公式,對其進行變換,求出云滴。不需要用第(2)中生成隨機正態(tài)數(shù)據(jù)x。
逆向云算法分為2種類型:有確定度逆向云算法和無確定度逆向云算法。有確定度的云發(fā)生器則是根據(jù)云滴和其確定度,得到反映定性概念的云模型的3個數(shù)字特征。假設有m個云滴,其過程如下:
這種方法需要知道云滴的確定度,而我們從調(diào)查中采集到的數(shù)據(jù),通常只有x參考值,沒有確定度,所以要計算定性概念的云模型參數(shù)難度大,這需要另外計算確定度。這種方法推廣使用受到很大的限制。
鑒于數(shù)據(jù)可獲得性,通常我們用無確定度的方法確定3個特征數(shù)字。這種算法又可以分為4種,即單步式一階中心距、單步式四階中心距、峰值法以及多步式算法。
峰值法、單步式一階中心距和單步式四階中心距有可能會出現(xiàn)第4步計算超熵時出現(xiàn)負值的現(xiàn)象,究其原因,是忽略云滴是由2次隨機過程產(chǎn)生的事實,提出刪除樣本點均值近的點的方法[23-24]。
多步式算法:
這種算法可以避免前幾種方法的出現(xiàn)超熵為負的現(xiàn)象[25]。
2.2?RBF神經(jīng)網(wǎng)絡模型
RBF基本結(jié)構分為3層,分別為輸入層、隱含層和輸出層。其本質(zhì)是選擇適當?shù)幕瘮?shù)、隱含層單元數(shù)和連接權值[26]。
輸入層僅僅是傳遞信號的作用,將外來的信息傳遞到隱含層。
隱含層是將輸入的信息進行非線性變換,對基函數(shù)的參數(shù)進行調(diào)整?;瘮?shù)通常采取高斯函數(shù),其輸出一般可表示為:
輸出層的輸出為:
2.3?云RBF神經(jīng)網(wǎng)絡模型
用云模型取代RBF神經(jīng)網(wǎng)絡中隱含層的基函數(shù),構造云神經(jīng)元。每一屬性i經(jīng)過云變換可得到ni個云模型,k個屬性的n1,n2,…,nk個云模型相互組合可得n=n1×n2×…×nk個神經(jīng)元。輸入向量x經(jīng)過神經(jīng)元j,根據(jù)X條件發(fā)生器,得到隸屬度,從而得到一個云滴,重復k次,可得到k個云滴,取其期望值,作為隱含層神經(jīng)元j的輸出。將n個隱含層神經(jīng)元輸出組合得到輸出層的輸出,通常采取最小二乘回歸計算輸出層線性組合權重系數(shù)。程琳等[27]、于洋等[28]、李剛等[29]用云RBF取得比RBF較好的預測和分類效果。
3?指標選取
3.1?企業(yè)專利指標選取
經(jīng)合組織在《2011年科學、技術與產(chǎn)業(yè)記分榜:知識經(jīng)濟中的創(chuàng)新與增長》運用專利引用率、權利要求數(shù)量、專利維持年限和專利族數(shù)量等專利質(zhì)量指標[30]。吳菲菲等在分析中外有關專利質(zhì)量指標的基礎上,選出頻次前10的專利質(zhì)量指標[31]。唐恒等從專利資助政策視角提出16項專利質(zhì)量評價指標,并將其分為宏觀指標和微觀指標[32]。胡諜等列出19項專利質(zhì)量指標,將其分為專利范圍、專利引證、專利維持和其他等4種類型,并對各個指標的優(yōu)劣進行述評,對創(chuàng)業(yè)板塊企業(yè)的專利質(zhì)量進行分析[33]。宋河發(fā)等在分析國內(nèi)外專利質(zhì)量測試指標后,提出應從創(chuàng)造質(zhì)量、撰寫質(zhì)量、審查質(zhì)量和經(jīng)濟質(zhì)量來測試專利質(zhì)量,并認為經(jīng)濟質(zhì)量是前面3個質(zhì)量的綜合體現(xiàn)[34]。谷麗等對專利質(zhì)量評價指標的研究文獻進行分析,概括專利質(zhì)量評價18項指標,將其分成專利的技術性、法定性和商業(yè)性三大類別[35]。
企業(yè)的專利應從專利的數(shù)量和質(zhì)量來衡量。參考上述研究結(jié)論,鑒于指標的可獲取性和從企業(yè)層面進行分析,我們選取了企業(yè)擁有的專利數(shù)量、專利IPC分類和外觀設計洛迦諾分類號數(shù)、專利被引次數(shù)、專利同族數(shù)、專利的權利要求數(shù)、發(fā)明專利占比、說明書和權利要求字數(shù)等7項指標分析企業(yè)專利。
專利數(shù)量。企業(yè)擁有的專利越多,說明專利投入經(jīng)費越多,對企業(yè)的成長性有影響,一方面經(jīng)費投入占用其他方面的資金;另一方面形成的專利有時發(fā)揮正向作用。專利數(shù)量有申請數(shù)量和授權數(shù)量,此次引用專利授權數(shù)量。
專利被引次數(shù)。是專利被后續(xù)引用的次數(shù),被引次數(shù)高的專利通常是質(zhì)量高的專利,被引次數(shù)反映專利質(zhì)量信息可以從兩個角度予以解釋:一是作為基礎技術的影響力,即對本領域后續(xù)技術創(chuàng)新的貢獻;二是作為現(xiàn)有技術的法律功能,即對后續(xù)專利的權利限制[36]。黃寶金等還基于美國專利數(shù)據(jù),將平均被引次數(shù)、相對被引指數(shù)(Relative Cita-tion Index,RCI)和高影響指數(shù)(High Impact Index,HII)作為專利質(zhì)量指標評價國家納米技術實力[37]。在本次分析中,我們采取一個平均被引次數(shù)作為企業(yè)專利的一個指數(shù)。
權利要求數(shù)量(權利要求項數(shù))。一般認為,一項專利權利要求數(shù)越多,表明專利的技術含量越高,覆蓋的技術越寬,專利投入的研究資源越多。一個機構或區(qū)域的專利(特別是授權專利)的平均權利要求數(shù)量越多,通常表明該機構或區(qū)域的技術創(chuàng)新能力越強,其專利的總體質(zhì)量也就越高[38]。
發(fā)明專利比率。指發(fā)明專利占企業(yè)全部專利的比率,我國的專利分為發(fā)明專利、實用新型專利和外觀設計專利,通常認為一個企業(yè)發(fā)明專利比率越高,其專利質(zhì)量越高,發(fā)明專利同其他兩種相比較,其投入研究資源通常較多,國家對此類專利的申請審查最為嚴格。
專利IPC分類號和外觀設計洛迦諾分類號數(shù)。反映專利技術覆蓋的范圍,IPC分類號數(shù)越多,覆蓋的范圍越大,專利質(zhì)量越高。Lerner J提出用專利文件中的4位國際專利分類號(即IPC小類)的數(shù)量來表征其專利寬度[39]。外觀分類號數(shù)和IPC一樣的作用,我們將這兩個合并在一起。
專利族大小。即同族專利數(shù)量,同族專利是指在不同國家或地區(qū),以及地區(qū)間多次申請、多次公布或批準的內(nèi)容相同或基本相同的一組專利文獻。專利族越大,同一優(yōu)先權的專利得到的認可就越多,專利質(zhì)量就越高。
說明書和權利要求的字數(shù)?!秾@ā芬笳f明書充分公開,專利說明書撰寫質(zhì)量通常最能反映說明書充分公開的是實施例的多少和實施例的詳細程度[40]。說明書的字數(shù)多少在一定程度上反映專利說明書的質(zhì)量,說明書字數(shù)越多,公開的內(nèi)容也就越多。權利要求的字數(shù)和說明書的字數(shù)一樣,一定程度上起到衡量專利的作用。
3.2?企業(yè)成長性指標選取
企業(yè)財務狀況和經(jīng)營成果是成長性的主要衡量因素,根據(jù)財務報表分析,可以得到一系列財務指標,通常將其歸類為盈利能力、償債能力、資本運營能力及發(fā)展能力。黎東升等選取總資產(chǎn)、流動比率、速動比率、資產(chǎn)負債率和存貨周轉(zhuǎn)率分析了農(nóng)業(yè)類上市公司的成長性[41]。劉丹等選取流動比率、凈資產(chǎn)增長等12項指標對物流業(yè)上市公司的成長性進行分析[42]。王玉等選取年營業(yè)收入和年利潤分析中國100強企業(yè)的成長性[43]。
本次研究中,選取如下指標作為企業(yè)成長性的評價指標。
盈利能力指標:凈資產(chǎn)報酬率(%),總資產(chǎn)利潤率(%),凈資產(chǎn)收益率(%),主營業(yè)務利潤率(%),營業(yè)利潤率(%),三項費用比重(%)。
償債能力指標:流動比率(%),資產(chǎn)負債率(%),現(xiàn)金比率(%),利息支付倍數(shù)(%)。
資本運營能力指標:應收賬款周轉(zhuǎn)率(次),總資產(chǎn)周轉(zhuǎn)率(次),存貨周轉(zhuǎn)率(次),資產(chǎn)的經(jīng)營現(xiàn)金流量回報率(%)。
發(fā)展能力指標:主營業(yè)務收入增長率(%),凈利潤增長率(%),凈資產(chǎn)增長率(%),總資產(chǎn)增長率(%)。
根據(jù)這些指標計算企業(yè)的成長性,三項費用比重和資產(chǎn)負債率選取倒數(shù)。它們和企業(yè)成長性是負相關。
度量企業(yè)成長性的指標有多種,從不同的角度反映企業(yè)的成長性,為較好地比較各個企業(yè)的成長性,有必要將這些指標綜合成一個反映企業(yè)成長性指標。因子分析方差貢獻率能克服主觀確定指標權重帶來的不良影響,客觀反映各指標在綜合指標中的權重。
4?實證分析
4.1?樣本選擇與數(shù)據(jù)來源
樣本選自我國上市公司創(chuàng)業(yè)板732家公司(2018年8月查詢)。專利技術相關數(shù)據(jù)來源國家專利局,通過在“申請(專利權)人”輸入公司名稱進行高級檢索,從中獲取每個公司專利數(shù)量等指標,檢索時間為2018年8月。在進行檢索時,有21家企業(yè)無法找到其專利數(shù)據(jù),原因是其企業(yè)名稱為“集團”或“地名”加括號,與檢索生成的條件重復,專利網(wǎng)無法識別,另一個原因是申請專利時申請人不用集團公司的名稱,有57家專利為0條,5家專利數(shù)為1條,將上述3項去掉,分析創(chuàng)業(yè)板649家公司,擁有專利數(shù)分布在2到2196,共計86 626條專利,其中發(fā)明專利為49 266條。財務數(shù)據(jù)來源網(wǎng)易財經(jīng),“http://money.163.com/”,輸入上市公司代碼進行查詢。
4.2?實證分析過程與結(jié)果
4.2.1?成長性數(shù)據(jù)預處理
對反映企業(yè)成長的財務數(shù)據(jù)進行因子分析,根據(jù)各因子對應的因子方差大小,將各因子得分合并成一個指標,綜合反映企業(yè)的成長性。分析工具選取SPSS19.0。對財務數(shù)據(jù)進行因子分析適用性檢驗,Bartlett球形度檢驗的χ2統(tǒng)計值為10 572.6,顯著性概率小于1%,說明指標之間具有相關性,適宜做因子分析;同時,KMO檢驗的KMO值為0.708,大于0.5,適宜做因子分析。用因子得分乘以相應的方差貢獻率,合計作為成長性的衡量數(shù)據(jù),依據(jù)這個數(shù)據(jù)對各公司的成長進行相對比較。聚類結(jié)果呈現(xiàn)中間多兩頭少,接近正態(tài)分布。
4.2.2?專利數(shù)據(jù)的預處理
專利的7個指標中,除了發(fā)明專利占比外,其他都和企業(yè)擁有的專利數(shù)量正相關,專利數(shù)量越多,這些指標的值越高,它們和專利數(shù)之間存在相關和共線性,為了消除重復計算專利數(shù)量的影響,每個指標需要剔除專利數(shù)量的成分,并假設這5個指標和專利數(shù)量是乘積關系,即這些指標除以專利數(shù)量就可消除專利數(shù)量的影響。同理,說明書和權利要求字數(shù)和專利的權利要求數(shù)也存在相似的關系,用同樣方法進行處理。經(jīng)過這樣處理后,指標間的相關性被消除。
4.2.3?云模型生成
對各屬性進行聚類分析,根據(jù)聚類的結(jié)果,用多步式算法,生成專利各屬性的云模型參數(shù)。發(fā)明專利比重聚成3類,各類的中心為云模型的期望值,案例數(shù)分別為199、232和218。聚成多少類,根據(jù)數(shù)據(jù)分析,盡量每一個類要有較多的案例,便于抽樣計算。同理可計算其他屬性。計算工具選擇Matlab(R2012a)。
4.2.4?不平衡數(shù)據(jù)處理
表1可以看出各種類別樣本分布不平衡,在使用前需要平衡處理。不平衡數(shù)據(jù)的處理方法有多種,這里采用云變換方法進行處理。根據(jù)成長性分類值對應的專利屬性所屬的云模型,生成數(shù)據(jù)進行補充。表1的聚類類別4有21個數(shù)據(jù),與最多的433個相差412個,根據(jù)聚類類別4的20個數(shù)據(jù)每一個所對應的每個專利屬性要生成19個數(shù)據(jù)(每個數(shù)據(jù)由7個專利維度組成),最后一個生成32個。
4.2.5?仿真實現(xiàn)
1)隱含層實現(xiàn)。用云模型改造RBF徑向函數(shù),構造云神經(jīng)網(wǎng)絡,每一個神經(jīng)元由7個屬性中各抽出1朵云共同組織,構造一個7維云模型,其參數(shù)為:
每一個案例經(jīng)過云模型神經(jīng)元后,其原來的7個維度屬性成288個維度屬性。每一個神經(jīng)元按如下方法轉(zhuǎn)化成輸出的確定度。
j為案例,i為其7個屬性維度。將這k個確定度進行平均,就可以得到這個案例經(jīng)過這個神經(jīng)元后的確定度。
這樣的確定度具有不確定性,每一次進行計算不一樣,但具有穩(wěn)定性,其值的范圍不變。
2)隱含層到輸出層的輸出。隱含層到輸出層的輸出是線性連接,一般可由最小二乘回歸求解連接權值,李剛等提出基于概率的權值確定[44]。神經(jīng)網(wǎng)絡和基于概率連接的權值確定要各個案數(shù)基本相等才能得出較高的準確度。個案較少的成長類型在分析中會被忽略,神經(jīng)網(wǎng)絡在訓練時偏向個案較多的類型。用概率法確定時,個數(shù)少的樣本同樣得不到體現(xiàn),個數(shù)多的輸出類型占的比例會偏高。這里隱含層到輸出層的輸出采用隨機森林確定。
5?結(jié)論與建議
5.1?結(jié)?論
運用云模型改進RBF神經(jīng)網(wǎng)絡的隱含層,并用來根據(jù)創(chuàng)業(yè)板公司的專利對公司成長性的預測,用云模型處理不平衡樣本,分析數(shù)據(jù)顯示公司專利對成長性有影響。
1)經(jīng)過云模型改造后的模型準確性和穩(wěn)定性得到提高。
測試樣本為20%,每次測試隨機選取,其他為訓練樣本。經(jīng)過10次測試,改造前的準確率期望為87.12%,改造后的期望為94.61%,提高了8.60%。樣本方差分別為3.354016和2.287741,改造后波動性減少。但由于改造后成倍維度提高,運行時間變長。
2)云模型對不平衡數(shù)據(jù)的處理
云模型雖然在轉(zhuǎn)換時具隨機性和模糊性,但其具有穩(wěn)定性,其生成的云滴具有這個云的共性,集體體現(xiàn)云的特征。一個云模型可以生成很多個不同的數(shù)據(jù),體現(xiàn)了隨機性和個體差異性。用云模型對不平衡數(shù)據(jù)進行補充,可選擇其原來對應模型的云參數(shù)進行生成數(shù)據(jù)。
3)企業(yè)專利對成長性有重要影響
根據(jù)圖5,我們可以看出,根據(jù)企業(yè)的專利能對企業(yè)成長性做出很好地預測,準確率在90%~95%之間,這也說明專利對企業(yè)成長性有很大的影響。這點我們從表5相關性分析結(jié)論也獲得了很好的支持。正相關系數(shù)較大,在5%的水平上顯著,專利能促進企業(yè)的成長。負相關系數(shù)很小,在5%水平上不顯著。
4)專利各屬性對企業(yè)的成長性影響有差異
表4相關性顯示各種專利屬性對成長性的影響各一樣。進一步分析成長性的內(nèi)部構成指標可以看出,各專利指標對增長率類指標(凈資產(chǎn)增長率、總資產(chǎn)增長率)是負相關且顯著,對收益類指標為正影響,對周轉(zhuǎn)率類指標在5%顯著性水平上基本沒有影響。專利對成長性有影響,有正的影響,也有負的影響,但總體上,正影響大于負影響。
5.2?建?議
1)云模型符合自然語言表的意識,是現(xiàn)實中的隨機性和穩(wěn)定性的很好刻畫,只要云參數(shù)確定,生成的數(shù)據(jù)具有穩(wěn)定性,可用于對不平衡數(shù)據(jù)的補充。
2)根據(jù)企業(yè)的專利可以較準確地判斷企業(yè)的成長性,所以從成長性的角度,各公司應重視專利的建設,建設中側(cè)重于增加發(fā)明專利,注重同族專利的建設,建設權利要求多的專利,不應單純追求專利的數(shù)量擴張。專利單純的數(shù)量擴張會對企業(yè)的成長性造成負面的影響。
參考文獻
[1]楊丹丹.基于數(shù)據(jù)挖掘的企業(yè)專利價值評估方法研究[J].科學學與科學技術管理,2006,(2):42-44.
[2]盧青,趙澎碧.大數(shù)據(jù)環(huán)境下的專利分析模型研究[J].現(xiàn)代情報,2018,38(1):37-44.
[3]中華人民共和國國家知識產(chǎn)權局專利統(tǒng)計年報2016.
[4]中華人民共和國國家知識產(chǎn)權局專利統(tǒng)計年報2016.
[5]張維迎,周黎安,顧全林.高新技術企業(yè)的成長及其影響因素:分位回歸模型的一個應用[J].管理世界,2005,(10):94-101,112,172.
[6]王曄斐.創(chuàng)業(yè)板公司成長性研究[D].成都:西南財經(jīng)大學,2011.
[7]徐維爽,張庭發(fā),宋永鵬.創(chuàng)業(yè)板上市公司成長性及技術創(chuàng)新貢獻分析[J].現(xiàn)代財經(jīng)(天津財經(jīng)大學學報),2012,32(1):63-68.
[8]胡義東,仲偉俊.高新技術企業(yè)技術創(chuàng)新績效影響因素的實證研究[J].中國科技論壇,2011,(4):80-85.
[9]張信東,薛艷梅.R&D支出與公司成長性之關系及階段特征——基于分位數(shù)回歸技術的實證研究[J].科學學與科學技術管理,2010,31(6):28-33.
[10]李仲飛,楊亭亭.專利質(zhì)量對公司投資價值的作用及影響機制[J].管理學報,2015,12(8):1230-1239.
[11]Piekkola H.Public Funding of R&D and Growth:Firm-Level Evidence from Finland[J].Economics of Innovation and New Technology,2007,(3):195-210.
[12]Alex Coad,Nicola Grassano.Firm Growth and R&D Investment:SVAR Evidence from the Worlds Top R&D Investors[J].Industry and Innovation,2018,(5).
[13]Pelin Demirel,Mariana Mazzucato.Innovation and Firm Growth:Is R&D Worth It?[J].Industry and Innovation,2012,(1):45-62.
[14]Jeffrey I Bernstein,Xiaoyi Yan.Canadian-Japanese R&D Spillovers and Productivity Growth[J].Applied Economics Letters,1996,(12):763-767.
[15]Andrin Spescha.R&D Expenditures and Firm Growth-is Small Beautiful?[J].Economics of Innovation and New Technology,2017,(11).
[16]Mario I Kafouros.R&D and Productivity Growth:Evidence from the UK[J].Economics of Innovation and New Technology,2005,(6):479:497.
[17]李德毅,劉常昱,杜鹢,等.不確定性人工智能[J].軟件學報,2004,(11):1583-1594.
[18]李剛,萬幼川.基于高維云模型和RBF神經(jīng)網(wǎng)絡的遙感影像不確定性分類方法[J].測繪科學,2012,37(1):115-118.
[19]李剛,萬幼川.基于高維云模型和RBF神經(jīng)網(wǎng)絡的遙感影像不確定性分類方法[J].測繪科學,2012,37(1):115-118.
[20]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學,2004,(8):28-34.
[21]于洋,孫成偉,張冰冰,等.云模型RBF神經(jīng)網(wǎng)絡的數(shù)據(jù)中心溫度預測[J].沈陽理工大學學報,2013,32(4):9-14.
[22]劉常昱,李德毅,杜鹢,等.正態(tài)云模型的統(tǒng)計分析[J].信息與控制,2005,(2):236-239,248.
[23]楊潔,王國胤,劉群,等.正態(tài)云模型研究回顧與展望[J].計算機學報,2018,41(3):724-744.
[24]陳昊,李兵,劉常昱.一種無確定度的逆向云算法[J].小型微型計算機系統(tǒng),2015,36(3):544-549.
[25]楊潔,王國胤,劉群,等.正態(tài)云模型研究回顧與展望[J].計算機學報,2018,41(3):724-744.
[26]于洋,孫成偉,張冰冰,等.云模型RBF神經(jīng)網(wǎng)絡的數(shù)據(jù)中心溫度預測[J].沈陽理工大學學報,2013,32(4):9-14.
[27]程琳,徐波.基于云RBF神經(jīng)網(wǎng)絡模型的大壩監(jiān)測數(shù)據(jù)預報[J].水電能源科學,2010,28(6):64-66,45.
[28]于洋,孫成偉,張冰冰,等.云模型RBF神經(jīng)網(wǎng)絡的數(shù)據(jù)中心溫度預測[J].沈陽理工大學學報,2013,32(4):9-14.
[29]李剛,萬幼川.基于高維云模型和RBF神經(jīng)網(wǎng)絡的遙感影像不確定性分類方法[J].測繪科學,2012,37(1):115-118.
[30]吳菲菲,張廣安,張輝,等.專利質(zhì)量綜合評價指數(shù)——以我國生物醫(yī)藥行業(yè)為例[J].科技進步與對策,2014,31(13):124-129.
[31]吳菲菲,張廣安,張輝,等.專利質(zhì)量綜合評價指數(shù)——以我國生物醫(yī)藥行業(yè)為例[J].科技進步與對策,2014,31(13):124-129.
[32]唐恒,李紹飛,赫英淇.專利資助政策下專利質(zhì)量評價研究[J].情報雜志,2015,34(5):23-28.
[33]胡諜,王元地.企業(yè)專利質(zhì)量綜合指數(shù)研究——以創(chuàng)業(yè)板上市公司為例[J].情報雜志,2015,34(1):77-82.
[34]宋河發(fā),穆榮平,陳芳,等.基于中國發(fā)明專利數(shù)據(jù)的專利質(zhì)量測度研究[J].科研管理,2014,35(11):68-76.
[35]谷麗,郝濤,任立強,等.專利質(zhì)量評價指標相關研究綜述[J].科研管理,2017,38(S1):27-33.
[36]萬小麗.專利質(zhì)量指標中“被引次數(shù)”的深度剖析[J].情報科學,2014,32(1):68-73.
[37]Wong P K Ho Y P,Chan C K.Internationalization and Evolution of Application Areas of an Emerging Technology:The Case of Nanotechnology[J].Scientometrics,2007,70(3):715-737.
[38]馬廷燦,李桂菊,姜山,等.專利質(zhì)量評價指標及其在專利計量中的應用[J].圖書情報工作,2012,56(24):89-95,59.
[39]Lerner J.The Importance of Patent Scope:An Empirical Analysis[J].The RAND Journal of Economics,1994,25(2):319-333.
[40]宋河發(fā),穆榮平,陳芳.專利質(zhì)量及其測度方法與測度指標體系研究[J].科學學與科學技術管理,2010,31(4):21-27.
[41]黎東升,秦志崗.基于因子分析的農(nóng)業(yè)類上市公司競爭力突變綜合評價[J].農(nóng)業(yè)技術經(jīng)濟,2011,(2):96-101.
[42]劉丹,印曼.我國物流業(yè)上市公司成長性評價[J].技術經(jīng)濟,2012,31(11):104-109.
[43]王玉,王丹.中國100強企業(yè)成長性分析[J].上海財經(jīng)大學學報,2008,(2):85-91.
[44]李剛,萬幼川.基于高維云模型和RBF神經(jīng)網(wǎng)絡的遙感影像不確定性分類方法[J].測繪科學,2012,37(1):115-118.
(責任編輯:孫國雷)