国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于專利文本的手機企業(yè)創(chuàng)新能力評價研究*

2021-09-16 08:00李世紀沈有為羅時鍇尹若云
科技創(chuàng)新與應用 2021年25期
關(guān)鍵詞:專利創(chuàng)新能力評估

李世紀,沈有為,羅時鍇,尹若云,岳 麗

(1.合肥工業(yè)大學 管理學院,安徽 合肥230009;2.合肥工業(yè)大學 軟件學院,安徽 合肥230009)

創(chuàng)新能力作為一個企業(yè)評估創(chuàng)造核心競爭力、占領(lǐng)市場、獲得經(jīng)濟利潤的重要衡量標準,在知識經(jīng)濟時代,逐漸成為技術(shù)交易市場的核心問題,成為眾多學者研究分析的對象。而專利對于技術(shù)創(chuàng)新能力的評價是一項重要指標,其對于企業(yè)進行有針對性的技術(shù)創(chuàng)新戰(zhàn)略選擇和合理分配研發(fā)資源具有重要的理論和現(xiàn)實意義。

手機行業(yè)作為進入21世紀發(fā)展最為迅速的產(chǎn)業(yè)之一,行業(yè)整體呈現(xiàn)高活躍、快迭代的趨勢。

目前,國內(nèi)手機市場主要被華為、小米、OPPO、ViVo四家企業(yè)占據(jù),競爭十分激烈。各廠手機相關(guān)技術(shù)不斷地被研發(fā)出來,各自旗艦機型的差距也在逐步逼近,在某項領(lǐng)域的突破創(chuàng)新和企業(yè)自身創(chuàng)新能力對標同等級其他產(chǎn)品進行市場競爭已經(jīng)成為主流方式。

本文以國內(nèi)四家主流手機廠商為例,通過專利計量與專利文本的結(jié)合,運用LDA主題模型和基于熵值法的權(quán)重計算,建立一套客觀公正、清晰明了的企業(yè)創(chuàng)新能力評估方法體系,為手機市場和相關(guān)領(lǐng)域研究提供準確客觀的企業(yè)創(chuàng)新能力評估方法支持。

1 研究現(xiàn)狀

1.1 相關(guān)研究

針對本項目所研究的手機行業(yè)創(chuàng)新能力的評估,在主流資源平臺十分少見,已有的研究主要分為對手機行業(yè)整體能力的評估、創(chuàng)新能力評估的方法和專利評估領(lǐng)域三個方面。

對于手機行業(yè)的評估,主要是基于波特五力模型和SCP模型等進行綜合分析評估。

對于創(chuàng)新能力的評估,國內(nèi)一些學者對區(qū)域?qū)用娴目萍紕?chuàng)新評估進行了大量研究,崔俊富等針對科技領(lǐng)域創(chuàng)造力的評估主要集中在科技創(chuàng)新能力評估[1]。一些學者還針對具體領(lǐng)域的科學創(chuàng)新評估進行了研究。余本功等基于主題模型(LDA)和專利數(shù)據(jù)對汽車領(lǐng)域建立技術(shù)創(chuàng)新能力評價的方法體系[2];周劍等提出一套覆蓋制造業(yè)企業(yè)全局的量化融合評估體系和評價方法[3]。

在專利評估領(lǐng)域,國內(nèi)主要集中于對專利價值影響因素做總體分析。而對于技術(shù)創(chuàng)新能力評價方面,國內(nèi)外許多學者從不同的維度構(gòu)建了企業(yè)技術(shù)創(chuàng)新評價體系。

1.2 LDA主題模型的發(fā)展

統(tǒng)計主題模型自提出以來,在文本挖掘技術(shù)中得到了廣泛應用。它經(jīng)歷了漫長的發(fā)展過程,已成功應用于許多重要領(lǐng)域。其中,LDA模型是主題模型的主要代表。

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)上的數(shù)據(jù)呈指數(shù)式增長,研究人員如何從這些海量文獻中全面、快速、準確地識別出研究主題,并探索其演化趨勢,一直以來都是情報學的研究重點[4]。而文本挖掘技術(shù)是幫助科研人員從海量非結(jié)構(gòu)化文獻中發(fā)現(xiàn)新興主題結(jié)構(gòu)的途徑之一,LDA模型作為一種對文本信息進行語義抽取的主題模型,為科研人員進行文本主題挖掘提供了一種新方法。LDA模型廣泛應用于文本信息檢索、主題發(fā)現(xiàn)和演化、圖像處理、聚類、推薦系統(tǒng)、過濾系統(tǒng)、預測系統(tǒng)、資源標識等諸多領(lǐng)域。國內(nèi)學者對LDA模型進行了比較深入的研究,已取得了較為豐富的研究成果。

1.3 LDA主題模型理論

LDA主題模型是一個三層貝葉斯概率模型,包含詞、主題和文檔三層結(jié)構(gòu)。其理論基礎(chǔ)為:每一篇文章都是由一定概率的主題構(gòu)成,而這些主題又由一定概率的詞構(gòu)成?;谶@一理論,通過LDA主題模型可以得到文檔-主題以及主題-詞這兩個多項式分布。如圖1所示,其中M代表文檔的數(shù)目,K代表主題數(shù)目,Nm代表文本的長度,即文本中所包含的詞語數(shù)量。

圖1

通過LDA主題模型,可以快速準確地對文本進行主題提取,故選用LDA主題模型來進行專利文本數(shù)據(jù)的分析。

2 數(shù)據(jù)來源及研究方法

2.1 數(shù)據(jù)來源

本研究以中國手機行業(yè)為實驗對象,根據(jù)國際數(shù)據(jù)公司(IDC)2015-2019年間的中國智能手機市場報告,選取這五年中國市場占有量最高的四家國產(chǎn)智能手機廠商——華為技術(shù)有限公司(華為)、OPPO廣東移動通信有限公司(OPPO)、維沃移動通信有限公司(ViVo)、小米科技有限責任公司(小米)為中國手機行業(yè)代表,專利數(shù)據(jù)來源為佰騰網(wǎng)。

根據(jù)IDC的報告顯示,2019年華為、OPPO、ViVo、小米的國內(nèi)市場總占有率達到了自2015年以來最高的84.4%,故以2019年為截止點,選取2015-2019這五年的專利數(shù)據(jù)。由于專利的數(shù)量指標更偏重于已被授權(quán)的專利,故選取四家企業(yè)公開日在這五年的專利;而專利的內(nèi)容指標更偏重于近期企業(yè)的研究方向,故選取申請日在這五年的專利。通過佰騰網(wǎng),共檢索到這四家企業(yè)公開日在這五年間的發(fā)明公開、發(fā)明授權(quán)以及實用新型專利119061條,共獲得這四家企業(yè)申請日在這五年間的發(fā)明專利以及實用新型專利文本摘要71695條。

2.2 研究方法

如圖2所示,本研究旨在從專利計量和專利內(nèi)容兩個維度去評價手機企業(yè)的創(chuàng)新能力,其中專利的計量指標包括企業(yè)的發(fā)明公開數(shù)量、發(fā)明授權(quán)數(shù)量、實用新型數(shù)量、年申請量變化量、專利技術(shù)分布五項,專利的內(nèi)容指標包括企業(yè)的創(chuàng)新關(guān)鍵詞數(shù)和企業(yè)的創(chuàng)新核心值。

圖2

專利的內(nèi)容指標不同于專利的計量指標,后者可以通過專利的數(shù)據(jù)檢索直接獲得,而前者需要對專利的文本數(shù)據(jù)進行挖掘分析,其主要研究流程如圖3所示。首先獲得這四家企業(yè)五年間的中國專利數(shù)量以及專利摘要,對每家企業(yè)以及全行業(yè)的專利摘要進行數(shù)據(jù)處理。接著在Python環(huán)境下對每家企業(yè)以及全行業(yè)的專利摘要分別進行LDA主題提取,得到每家企業(yè)以及全行業(yè)的主題-詞分布。最后通過篩選全行業(yè)的主題-詞分布得出手機領(lǐng)域創(chuàng)新關(guān)鍵詞集合,計算每個創(chuàng)新關(guān)鍵詞的重要值,取每家企業(yè)的主題-詞分布與領(lǐng)域創(chuàng)新關(guān)鍵詞的交集,計算得到每家企業(yè)的創(chuàng)新核心值。

圖3

如圖4所示,在獲取到每家企業(yè)的專利計量指標和內(nèi)容指標后,對各項指標進行標準化處理,計算出每家企業(yè)的各項指標比重,運用比重計算出各項指標的熵值,通過熵值得出各項指標的權(quán)重,最后計算得出每家企業(yè)的技術(shù)創(chuàng)新能力評價值。

圖4

3 實證研究

3.1 數(shù)據(jù)獲取及預處理

通過佰騰網(wǎng),可以檢索到華為、OPPO、ViVo、小米這四家企業(yè)的專利計量指標。其中專利數(shù)量選擇的是這四家企業(yè)公開日期為2015.1.1-2019.12.31的中國發(fā)明專利數(shù)、實用新型專利數(shù)和授權(quán)發(fā)明專利數(shù);專利的變化趨勢選擇的是這四家企業(yè)申請日期為2015.1.1-2019.12.31的中國專利年申請量變化量均值;技術(shù)分布趨勢均值選擇的是這四家企業(yè)申請日期為2015.1.1-2019.12.31的中國專利中,B部、G部和H部專利所占比例的平均值。統(tǒng)計結(jié)果見表1所列。

表1

對于專利內(nèi)容指標所需的數(shù)據(jù),可以通過佰騰網(wǎng),下載這四家企業(yè)申請日在這五年間國內(nèi)發(fā)明公開、發(fā)明授權(quán)、實用新型專利摘要,并且過濾掉少于100字的摘要,共獲得83626條有效數(shù)據(jù)。在獲得這些有效摘要后,引入手機行業(yè)的專業(yè)術(shù)語表,并且建立停用詞表(其中主要包含一些無用詞匯),在Python環(huán)境下使用“JIEBA分詞”模塊,對摘要文本進行分詞處理。

3.2 LDA主題模型

在進行LDA主題模型聚類前,我們需要計算得到困惑度最低時的主題數(shù)。困惑度用來度量一個概率分布或概率模型預測樣本的好壞程度,在LDA主題模型中,困惑度最低時聚類的效果更好。在Python環(huán)境下,生成主題數(shù)-困惑度的函數(shù)圖。如圖5所示,整個手機行業(yè)的專利文本在主題數(shù)為16時,可使困惑度達到最小。

圖5

在獲得整個手機行業(yè)的主題數(shù)后,在Python環(huán)境下對所有的專利文本進行LDA主題聚類,每個主題保留出現(xiàn)頻率最高的前10個詞,共得到160個詞。其中,去除掉區(qū)域、位置、空間等單獨出現(xiàn)沒有意義的詞,去除掉硬件、終端等無法確定具體指向的詞,合并數(shù)據(jù)傳輸、傳輸數(shù)據(jù)等表意相同的詞,最后得到了28個手機領(lǐng)域創(chuàng)新關(guān)鍵詞。其中,有關(guān)于拍照的:圖像、像素、攝像頭;有關(guān)于充電的:電流、功率、電壓、電量、電池;有關(guān)于顯示的:顯示屏、觸控、亮度等。利用公式(1),分別計算得出每個手機領(lǐng)域創(chuàng)新關(guān)鍵詞Tj的重要值 (IT)j:

其中,K為對手機領(lǐng)域進行LDA主題聚類時的主題數(shù)目,即為16;P(iT)j為第j個關(guān)鍵詞在主題i中的概率;Ni為第i個主題中所包含的創(chuàng)新關(guān)鍵詞數(shù)量。

在獲得手機領(lǐng)域創(chuàng)新關(guān)鍵詞后,分別對這四家企業(yè)的專利文本進行困惑度計算,經(jīng)過比對后,取主題數(shù)為26可使四家企業(yè)的平均困惑度達到最小。分別對四家企業(yè)的專利文本進行LDA主題聚類,選取主題數(shù)為26,每個主題數(shù)下保留前10個概率最高的詞,得到四家企業(yè)的LDA主題聚類結(jié)果。將每家企業(yè)的聚類結(jié)果與手機領(lǐng)域的創(chuàng)新關(guān)鍵詞比對,可以得到每家企業(yè)所包含的創(chuàng)新關(guān)鍵詞,根據(jù)公式(2)計算得出企業(yè)t在手機領(lǐng)域的創(chuàng)新核心值Ct:

其中,n表示手機領(lǐng)域的創(chuàng)新關(guān)鍵詞數(shù),即為28;k為對每家公司進行LDA主題聚類時的主題數(shù),即為26;h表示對每家企業(yè)進行LDA主題聚類時每個主題下詞的數(shù)目,即為10;R(iT)j表示手機領(lǐng)域創(chuàng)新關(guān)鍵詞Tj在主題i下,詞概率由高到低的排序。

計算結(jié)束后,可以得到每家企業(yè)的專利內(nèi)容指標,其中包含創(chuàng)新關(guān)鍵詞數(shù)以及創(chuàng)新核心值,見表2所列。

表2

3.3 基于熵值法的權(quán)重計算

在得到企業(yè)的專利計量指標以及內(nèi)容指標后,對所有的指標數(shù)據(jù)進行0-1標準化處理,見表3所列。

表3

利用公式(3)計算出指標j在公司i下所占據(jù)的比重:

其中Xij為表3中指標j在公司i的數(shù)值,其中m=4,n=7。各項指標在每家企業(yè)所占據(jù)的比重見表4。

表4

在得到各項指標在每家公司所占據(jù)的比重后,利用公式(4)計算指標j的熵值:

其中m=4,n=7。

在得到各項指標的熵值后,利用公式(5)計算指標j的權(quán)重:

其中n=7。

經(jīng)過計算,各項指標的熵值ej與權(quán)重aj見表5所列。

表5

得到各項指標的熵值與權(quán)重后,根據(jù)公式(6)計算企業(yè)i的技術(shù)創(chuàng)新能力評價值。

四家企業(yè)的技術(shù)創(chuàng)新能力評價值見表6所列。

表6

4 結(jié)論

根據(jù)最后的企業(yè)技術(shù)創(chuàng)新能力評價值,我們可以發(fā)現(xiàn)維沃移動通信有限公司(ViVo)這幾年間的專利數(shù)量雖然少于小米科技有限責任公司(小米),但其技術(shù)創(chuàng)新評價值高于小米。

對比中國人民大學企業(yè)創(chuàng)新課題組發(fā)布的《2019中國企業(yè)創(chuàng)新能力百強排行榜》[5],其中華為技術(shù)有限公司(華為)、OPPO廣東移動通信有限公司(OPPO)、維沃移動通信有限公司(ViVo)、小米科技有限責任公司(小米)分別位列第一、第三、第六、第十,這與我們的研究結(jié)果非常相似,唯一的偏差在于華為與OPPO的排名。根據(jù)佰騰網(wǎng)的檢索顯示,華為公開日在2015-2019年間的世界發(fā)明專利有41835條,而其中中國發(fā)明專利為27603條,由于華為擁有很大一部分國外的專利,而我們只針對了中國發(fā)明專利進行研究,所以導致了實驗的誤差。

我們可以發(fā)現(xiàn),評價一家企業(yè)的創(chuàng)新能力不僅僅要從企業(yè)的專利數(shù)量出發(fā),而應該結(jié)合專利的內(nèi)容,從專利計量和專利內(nèi)容兩個維度去評價。專利的內(nèi)容從一定層面上可以反映出企業(yè)的研究方向是否與整個行業(yè)一致,只有在對的方向上做更多的事,才能更加有效而持續(xù)地創(chuàng)新。

猜你喜歡
專利創(chuàng)新能力評估
不同評估方法在T2DM心血管病風險評估中的應用
拓展探究實驗 培養(yǎng)創(chuàng)新能力
高中數(shù)學課堂教學中創(chuàng)新能力的培養(yǎng)
第四代評估理論對我國學科評估的啟示
如何在語文教學中培養(yǎng)學生的創(chuàng)新能力
推進軟件產(chǎn)業(yè)創(chuàng)新能力提升
立法后評估:且行且盡善
資產(chǎn)評估法:能否終結(jié)“多龍治水”
2007年上半年專利授權(quán)狀況統(tǒng)計