国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于因子聚類分析的專利綜合評(píng)價(jià)研究

2012-04-29 18:52:03李瑞璇王學(xué)思
現(xiàn)代情報(bào) 2012年9期
關(guān)鍵詞:聚類分析因子分析數(shù)據(jù)挖掘

李瑞璇 王學(xué)思

〔摘 要〕對(duì)廣東省21個(gè)城市進(jìn)行地區(qū)專利綜合評(píng)價(jià),為達(dá)到數(shù)據(jù)簡化、客觀賦權(quán)、區(qū)域間比較的功能,采用文獻(xiàn)調(diào)查法選取地區(qū)專利綜合評(píng)價(jià)指標(biāo)24個(gè),并結(jié)合廣東省知識(shí)產(chǎn)權(quán)局的專利統(tǒng)計(jì)信息的基本數(shù)據(jù),再在此基礎(chǔ)上進(jìn)行因子分析,將多項(xiàng)指標(biāo)聚合為新的因子,并用提取、計(jì)算出的6個(gè)主因子得分進(jìn)行系統(tǒng)聚類分析,得出廣東省各市專利綜合實(shí)力的分類。該研究幫助相關(guān)人員了解地區(qū)專利的優(yōu)勢(shì)和不足,從而為地區(qū)專利發(fā)展提供決策支持。

〔關(guān)鍵詞〕因子分析;聚類分析;數(shù)據(jù)挖掘;專利評(píng)價(jià)

〔中圖分類號(hào)〕G250.252 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2012)09-0172-06

工業(yè)革命之后,世界上的創(chuàng)新發(fā)明越來越多,而專利的誕生,是為了保證發(fā)明人的創(chuàng)造活動(dòng)得到一定量的回報(bào),以激勵(lì)更多的發(fā)明研究工作。1624年英國頒布了《壟斷法》,這是早期專利制度的雛形,我國也于1985年頒布了《專利法》[1]。我國經(jīng)濟(jì)經(jīng)過30多年的發(fā)展,目前正經(jīng)歷著從勞動(dòng)密集型向高科產(chǎn)業(yè)型的方向發(fā)展,而判斷是否轉(zhuǎn)型成功的標(biāo)尺之一就在于專利的發(fā)展?fàn)顩r,專利是企業(yè)或國家在各種競(jìng)爭(zhēng)中取得優(yōu)勢(shì)的關(guān)鍵因素。廣東省一直處于全國經(jīng)濟(jì)發(fā)展的前沿,但各地之間的專利發(fā)展情況不均,為了能找出地區(qū)間的差距并有針對(duì)性地采取措施,對(duì)廣東省各地區(qū)的專利綜合評(píng)價(jià)應(yīng)客觀、全面、科學(xué),為此,本文選用目前較為權(quán)威、科學(xué)的專利評(píng)價(jià)指標(biāo)體系,在此基礎(chǔ)上對(duì)廣東省2010年的專利統(tǒng)計(jì)數(shù)據(jù)進(jìn)行因子分析和聚類分析,以期有效促進(jìn)廣東省各地區(qū)專利水平的提高和發(fā)展。

1 專利評(píng)價(jià)指標(biāo)體系

對(duì)專利評(píng)價(jià)指標(biāo)體系的選用也是對(duì)專利綜合實(shí)力進(jìn)行評(píng)價(jià)的一個(gè)關(guān)鍵步驟,專利評(píng)價(jià)指標(biāo)是相對(duì)于原始數(shù)據(jù)的二次數(shù)據(jù),用來進(jìn)行分析的二次數(shù)據(jù)是否準(zhǔn)確、客觀、全面,影響著分析結(jié)果的好壞。

我國專利制度實(shí)施得比較晚,對(duì)專利指標(biāo)的研究還處于初期階段,目前的研究熱點(diǎn)不僅僅只注重專利數(shù)量,同時(shí)也重視專利質(zhì)量以及專利綜合評(píng)價(jià),如黃慶[2](2004)等的《專利評(píng)價(jià)指標(biāo)體系——專利評(píng)價(jià)指標(biāo)體系的設(shè)計(jì)和構(gòu)建》,肖國華等[3](2008)《專利分析評(píng)價(jià)指標(biāo)體系的設(shè)計(jì)與構(gòu)建》,張冬梅[4]等(2006)《專利情報(bào)分析指標(biāo)體系——分析方法與技術(shù)》,阮梅花[5]等(2011)《企業(yè)自主創(chuàng)新能力評(píng)價(jià)的專利指標(biāo)體系構(gòu)建初探》等等,結(jié)合國外Huang Z[6]的研究來總結(jié)以上所有文獻(xiàn),本文在選取專利評(píng)價(jià)體系遵循以下幾個(gè)方面:

(1)較客觀、科學(xué)、全面、準(zhǔn)確地表現(xiàn)我國在世界上、我國不同地區(qū)或者各個(gè)行業(yè)乃至企業(yè)的專利綜合實(shí)力;

(2)“量”和“率”結(jié)合的平衡?!傲俊敝傅氖强偭?,用來評(píng)價(jià)總體實(shí)力情況;“率”用來評(píng)價(jià)相對(duì)強(qiáng)度情況。

(3)實(shí)用并具有指導(dǎo)性。

最終,本文選取的地區(qū)專利綜合評(píng)價(jià)指標(biāo)由表1所示:

2 專利綜合評(píng)價(jià)的方法

在進(jìn)行數(shù)據(jù)分析之前,首先對(duì)本文運(yùn)用的因子分析、聚類分析進(jìn)行介紹和說明。

2.1 因子分析法

因子分析法是指從研究指標(biāo)相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些信息重疊、具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)不相關(guān)的綜合因子的一種多元統(tǒng)計(jì)分析方法,基本思想是:根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量不相關(guān)或相關(guān)性較低,每組變量代表一個(gè)基本結(jié)構(gòu)——即公共因子[7]。即用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息,而綜合指標(biāo)之間彼此不相關(guān),各指標(biāo)代表的信息不重疊。根據(jù)因子分析的目的得知,綜合指標(biāo)應(yīng)該比原始變量少,但包含的信息量應(yīng)該相對(duì)損失較少[8]。

因子分析的基本原理[9]是:選擇i個(gè)主分量Z1,Z2,……,Zi,其中Zi=ai1*F1+ai2*F2+……+aim*Fi+ε,F(xiàn)1、F2 、…、Fi稱為公共因子,ε稱為以Zi的特殊因子,aim是第i個(gè)變量在第m個(gè)因子上的負(fù)荷,它一方面表示Zi對(duì)Fi的依賴程度,絕對(duì)值越大,密切程度越高;另一方面也反映了變量Zi對(duì)公共因子Fi的相對(duì)重要性,把a(bǔ)im稱為因子荷載。該模型中的因子載荷矩陣需要用適當(dāng)?shù)姆椒ㄟM(jìn)行估計(jì),使得各個(gè)公共因子之間相互獨(dú)立;然后,分別計(jì)算出公共因子Fi的得分:F=f1*Z1+f2*Z2+……+fi*Zi,fi作為每個(gè)主分量Zi的方差貢獻(xiàn)率的權(quán)數(shù)(即因子得分系數(shù))。最后利用此綜合評(píng)價(jià)函數(shù)進(jìn)行綜合評(píng)價(jià),即以每個(gè)因子的方差貢獻(xiàn)率占因子總方差貢獻(xiàn)率的比重作為權(quán)數(shù)進(jìn)行加權(quán)計(jì)算綜合得分。

本文使用因子分析的主要目的是可以通過因子分析對(duì)各因子進(jìn)行客觀賦權(quán),以便確定綜合評(píng)價(jià)的重要因素——權(quán)重,權(quán)重反映不同評(píng)價(jià)指標(biāo)對(duì)地區(qū)專利的影響程度大小,引入權(quán)重的綜合評(píng)價(jià)可以更科學(xué)合理地評(píng)價(jià)地區(qū)專利發(fā)展?fàn)顩r。

2.2 聚類分析法

聚類(Clustering)就是將數(shù)據(jù)分組成為多個(gè)類(Cluster),在同一個(gè)類內(nèi)對(duì)象之間具有較高的相似度,不同類之間的對(duì)象差別較大,聚類分析師一種無監(jiān)督數(shù)據(jù)挖掘方法,它基于觀測(cè)之間的相似度或距離將觀測(cè)(數(shù)據(jù))分組[10]。一個(gè)好的聚類方法會(huì)產(chǎn)生高質(zhì)量的聚類結(jié)果,使同一類別內(nèi)的觀測(cè)相似度高,而不同類的觀測(cè)差異大。

3 專利綜合評(píng)價(jià)的實(shí)證分析

本文選取了廣東省21個(gè)市作為樣本,并對(duì)樣本進(jìn)行因子分析與聚類分析。樣本數(shù)據(jù)根據(jù)廣東省知識(shí)產(chǎn)權(quán)局網(wǎng)站2006-2010年的專利統(tǒng)計(jì)報(bào)表計(jì)算得出,其中主要數(shù)據(jù)來源于2010年,個(gè)別數(shù)據(jù)根據(jù)2006-2010年統(tǒng)計(jì)計(jì)算得出,計(jì)算與統(tǒng)計(jì)過程使用EXCEL與SPSS統(tǒng)計(jì)分析工具完成。

3.1 基于因子分析的實(shí)證研究

(1)采用SPSS因子分析統(tǒng)計(jì)得出公因子特征值與貢獻(xiàn)率表以及公因子得分系數(shù)矩陣如表1、表2所示:

按特征值大于1的原則提取公因子,最終提取了6個(gè)公因子,第一個(gè)公因子的特征根為11.108,解釋了總變異的46.285%,以此類推,6個(gè)公因子的累積貢獻(xiàn)率達(dá)91.425%,信息損失為8.575%,能較為全面地反映信息。

(2)此時(shí),用回歸法計(jì)算出得分,并按系數(shù)大小加權(quán)進(jìn)行排序,從而得出公因子得分系數(shù)矩陣,如表3所示:

由表2可知,第一公因子Z1的特征值最高,貢獻(xiàn)率也最高,并且由表3可知,第一公因子Z1得分大都為正,且數(shù)值都很高,因此可以認(rèn)為Z1代表地區(qū)專利發(fā)展水平,Z1越高表明地區(qū)綜合專利發(fā)展水平實(shí)力越強(qiáng)。實(shí)用新型授權(quán)量X6,實(shí)用新型申請(qǐng)量X2,工礦企業(yè)授權(quán)量X18,工礦企業(yè)申請(qǐng)量X13,發(fā)明專利申請(qǐng)量X1,機(jī)關(guān)單位授權(quán)量X19在Z1上有高荷載;大專院校申請(qǐng)量X11,大專院校授權(quán)量X16,科研機(jī)構(gòu)授權(quán)量X17,科研機(jī)構(gòu)申請(qǐng)量X12在Z2上有高荷載;外觀設(shè)計(jì)授權(quán)率X9,實(shí)用新型授權(quán)率X7,發(fā)明專利授權(quán)率X5在Z3上有高荷載;技術(shù)衰老系數(shù)γ在Z4上有高荷載;年專利申請(qǐng)?jiān)鲩L率X20,年專利授權(quán)增長率X21在Z5上有高荷載。

因此,可以認(rèn)為公共因子Z1包括以下幾個(gè)方面的指標(biāo):一是反映專利質(zhì)量情況的指標(biāo);二是反映專利數(shù)量情況的指標(biāo);三是專利來源的指標(biāo),這三者被聚合為一個(gè)因子的原因之一,是所選擇的數(shù)量類指標(biāo)、質(zhì)量類指標(biāo)與專利來源指標(biāo)之間有密切的相關(guān)關(guān)系,三者之間相互影響,并代表著地區(qū)專利發(fā)展的關(guān)鍵因素。因子Z2包括專利來源的授權(quán)量和申請(qǐng)量指標(biāo),這說明專利來源的各種情況也反映著地區(qū)專利發(fā)展的情況。因子Z3包括專利質(zhì)量類指標(biāo),原因是該類指標(biāo)是靠比例計(jì)算得出,因此聚合在一個(gè)因子中,該因子的貢獻(xiàn)率在10%以上,專利質(zhì)量對(duì)地區(qū)專利的發(fā)展情況起著至關(guān)重要的作用。因子Z4包括技術(shù)發(fā)展程度指標(biāo),該類指標(biāo)都是反映專利的發(fā)展趨勢(shì),其貢獻(xiàn)率為9.6%。因子Z5包括專利發(fā)展情況指標(biāo)。根據(jù)各因子包含的反映地區(qū)專利發(fā)展情況的各個(gè)維度的指標(biāo)類型對(duì)各個(gè)因子進(jìn)行命名,命名原則是貢獻(xiàn)率因子,以載荷大的因子來命名。

(3)得出公因子得分系數(shù)矩陣后,以各公因子的方差貢獻(xiàn)率fi占其總方差貢獻(xiàn)率的比重作為權(quán)重進(jìn)行加權(quán)匯總[11],得出專利綜合得分F,專利綜合評(píng)價(jià)函數(shù)為:F=(f1*Z1+…+fi*Zi)/∑fi。在該案例中的公式為:F=(0.46285*Z1+0.14518*Z2+…+0.04386*Z6)/0.91425,按此公式,根據(jù)表1與表2的數(shù)據(jù),計(jì)算出每個(gè)城市在每個(gè)公因子下的得分并計(jì)算出綜合得分,得出表5。

根據(jù)表5的得分,按綜合評(píng)價(jià)得分F可將廣東省專利綜合實(shí)力分為6個(gè)階梯:第一階為深圳和廣州,兩者為廣東省專利綜合實(shí)力最突出的地區(qū),由于深圳和廣州是廣東省重點(diǎn)發(fā)展的地區(qū),并且人才更集中,其地理環(huán)境優(yōu)越、交通便捷、人才資源豐富、經(jīng)濟(jì)基礎(chǔ)雄厚,這是深圳與廣州專利綜合實(shí)力處于領(lǐng)先地位的重要因素。第二階梯為佛山、東莞、中山,這些地區(qū)專利綜合實(shí)力也很雄厚,源于地處深圳與廣州附近,并且工業(yè)發(fā)達(dá)。第三階梯的惠州、清遠(yuǎn)、珠海等,其專利綜合實(shí)力較好。第四階梯的韶關(guān)、肇慶等專利綜合實(shí)力一般。第五階梯為云浮、茂名等,專利綜合實(shí)力較差。第六階梯為陽江、潮州,專利綜合實(shí)力很差。

進(jìn)一步分析,廣州市與深圳市遙遙領(lǐng)先于其他各市,其主要原因在于兩者的綜合因子得分都很高,并且廣州市與深圳市之間也有區(qū)別,廣州市的專利來源因子得分很高,說明廣州市的專利來源分布均勻并且在數(shù)量與質(zhì)量上都占據(jù)絕對(duì)優(yōu)勢(shì),相對(duì)來說,深圳市的專利質(zhì)量因子、專利發(fā)展情況因子以及技術(shù)發(fā)展程度因子都要優(yōu)于廣州市,這情況說明廣州市聚集了各大高校以及研究所等,科研人才相較于深圳市來說有絕對(duì)的優(yōu)勢(shì),而由于深圳市的政治經(jīng)濟(jì)因素,使其專利質(zhì)量以及發(fā)展情況更優(yōu)于廣州市。東莞市、佛山市與中山市的專利綜合因子得分相近,并且實(shí)用新型與外觀設(shè)計(jì)因子得分都較高,三者之中只有中山市的專利來源因子以及專利發(fā)展情況因子較優(yōu),說明這3個(gè)城市主要注重于加工制造業(yè),真正的發(fā)明創(chuàng)新較少,其中中山市的專利發(fā)展結(jié)構(gòu)較為合理并長久發(fā)展的可能。清遠(yuǎn)市、惠州市、珠海市等專利綜合因子得分較低,但專利來源因子、專利質(zhì)量因子等得分都較高,說明其專利各項(xiàng)發(fā)展水平都良好,但是無法成為一個(gè)系統(tǒng)發(fā)揮促進(jìn)專利綜合發(fā)展的作用,為此,這些城市需協(xié)調(diào)各項(xiàng)專利因素之間的聯(lián)系與影響。其他的分析也同上文相似,比如各個(gè)市之間排名的比較與該市專利開發(fā)的分布情況等,都可以依據(jù)上述描述,根據(jù)表4的數(shù)據(jù)分析出來,并可以據(jù)此看出各市的不足與優(yōu)勢(shì),分析各市的發(fā)展重點(diǎn)以及需要進(jìn)行的改進(jìn)等。在此不再探討。

3.2 基于聚類分析的實(shí)證研究

為看出各市專利發(fā)展水平的相似程度,本文在因子分析的基礎(chǔ)上再運(yùn)用聚類分析方法對(duì)各市進(jìn)行分類。

根據(jù)因子分析中得到的6個(gè)因子對(duì)21個(gè)城市進(jìn)行分層聚類,分別用4類、6類、8類進(jìn)行聚類,發(fā)現(xiàn)分為8類較為合理,最后得到各市在8類中的屬類,即表4最后一列。圖2是反映聚類過程的樹狀圖,該圖各市右邊的序號(hào)為該市的綜合實(shí)力排名。

圖1的樹狀圖給出了每一步中被合并類的過程,因此可以進(jìn)一步分析類之間的關(guān)系和同一類的差別,以下將進(jìn)一步探討。第一類為廣州,是因?yàn)閺V州專利綜合因子、專利來源因子得分最高,專利綜合總得分也遙遙領(lǐng)先于其他城市;第二類是深圳,深圳專利綜合因子、專利質(zhì)量因子、技術(shù)發(fā)展情況以及專利發(fā)展情況得分很高,專利綜合評(píng)價(jià)總分也很高;第三類為佛山和東莞,兩個(gè)城市的專利發(fā)展水平相似,故聚為一類;第四類為中山、汕頭、江門,這3個(gè)城市專利總綜合得分雖然在排名上差距較大,但絕對(duì)值差較小,在利綜合因子、專利來源因子、專利質(zhì)量因子、技術(shù)發(fā)展情況因子的得分上結(jié)構(gòu)相似,因此聚在了一類;以此類推,第五類為清遠(yuǎn)與韶關(guān),專利綜合因子得分相似,專利來源因子與專利發(fā)展情況因子得分較高;第六類為湛江、珠海等;第七類是陽江,專利綜合評(píng)價(jià)很差,但技術(shù)發(fā)展情況因子得分很高;第八類是潮州,專利綜合評(píng)價(jià)以及各方面因子都很差。

參考文獻(xiàn)

[1]邵勇.專利指標(biāo)及其經(jīng)濟(jì)效益研究[D].暨南大學(xué),2003:1-2.

[2]黃慶,曹津燕,瞿衛(wèi)軍,等.專利評(píng)價(jià)指標(biāo)體系——專利評(píng)價(jià)指標(biāo)體系的設(shè)計(jì)和構(gòu)建[J].知識(shí)產(chǎn)權(quán),2004,(5):25-28.

[3]肖國華,王春,姜禾,等.專利分析評(píng)價(jià)指標(biāo)體系的設(shè)計(jì)與構(gòu)建[J].圖書情報(bào)工作,2008,(3):96-99.

[4]張冬梅,曾忠祿.專利情報(bào)分析指標(biāo)體系——分析方法與技術(shù)[J].情報(bào)雜志,2006,(3):55-57.

[5]阮梅花,肖滬衛(wèi).企業(yè)自主創(chuàng)新能力評(píng)價(jià)的專利指標(biāo)體系構(gòu)建初探[J].大學(xué)圖書館情報(bào)學(xué)刊,2011,(2):85-89.

[6]Huang Z,Chen H,Yi PA,et al.Longitudinal patent analysis for nanoscale science and engineering:Country,institution and technology field[J].Journal of Nanoparticle Research.2003,5(3):333-363.

[7]白思俊,等.系統(tǒng)工程[M].北京:電子工業(yè)出版社,2006:25-50.

[8]宇傳華.SPSS與統(tǒng)計(jì)分析[M].北京:電子工業(yè)出版社,2007:459-513.

[9]龔光明,張柳亮.基于因子分析的湖南省上市公司績效評(píng)價(jià)[J].會(huì)計(jì)之友,2012,(1):36-39.

[10]張俊妮.數(shù)據(jù)挖掘與應(yīng)用[M].北京:北京大學(xué)出版社,2009:70-79.

[11]戴維 F.格羅布納.商務(wù)統(tǒng)計(jì)(第六版)[M].北京:機(jī)械工業(yè)出版社,2008:355-367.

(本文責(zé)任編輯:王 涓)

猜你喜歡
聚類分析因子分析數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
農(nóng)村居民家庭人均生活消費(fèi)支出分析
基于主導(dǎo)產(chǎn)業(yè)視角的戰(zhàn)略性新興產(chǎn)業(yè)識(shí)別以及實(shí)證研究
基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
山東省縣域經(jīng)濟(jì)發(fā)展評(píng)價(jià)研究
商(2016年27期)2016-10-17 07:17:42
實(shí)證分析會(huì)計(jì)信息對(duì)股價(jià)的影響
商(2016年27期)2016-10-17 05:39:59
基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
科技視界(2016年20期)2016-09-29 12:32:48
“縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營統(tǒng)計(jì)一套”表輔助決策模式研究
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
焦作市| 宝丰县| 德化县| 陈巴尔虎旗| 长沙市| 菏泽市| 甘谷县| 漯河市| 云和县| 长葛市| 桂林市| 潼关县| 老河口市| 乌鲁木齐市| 尉氏县| 中山市| 岳阳县| 阳山县| 平舆县| 郎溪县| 张家口市| 靖州| 吉木萨尔县| 阳山县| 页游| 海南省| 浮梁县| 本溪市| 潞西市| 绥芬河市| 日土县| 柏乡县| 郎溪县| 永顺县| 新竹市| 当涂县| 莆田市| 太湖县| 迁西县| 贡山| 沐川县|