閔超++步一++孫建軍
摘 要:經過多年的飛速發(fā)展,我國國內專利數量已經位居世界前列。然而我國的國際專利在世界范圍的發(fā)展與影響仍然缺乏基于實證數據的系統(tǒng)研究。文章基于美國專利商標局(USPTO)發(fā)布的專利數據,從近400萬件專利及引用網絡中分析我國相關專利的發(fā)展態(tài)勢與國際交流情況,以期為我國深度參與國際技術活動提供政策啟示。研究發(fā)現,中國專利與特定地區(qū)的技術交流頻繁,在某些技術領域具有顯著特色,整體保持著良好的發(fā)展態(tài)勢。不過,在USPTO專利數量和影響方面仍然與其他發(fā)達國家和地區(qū)存在明顯差距。
關鍵詞:USPTO;中國專利;國際專利;技術流動;引用網絡
中圖分類號:G322.5 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2017091
Analysis on Technology Mobility of International Patents from China Based on Patent Big Data
Abstract After decades of fast development, China has listed at the top position in the world in terms of the amount of domestic patents. However, systematic research based on empirical data still lacks in the world-wide progress and impact of international patents from China. Based on 4 million patents and their citation network from the USPTO database, this study intends to unveil the international development and communication of USPTO patents from China, thus providing policy implications for China's deep involvement in world-wide technology activities. We find that, on the one hand, Chinese patents maintain frequent communications with certain areas in the world, exhibit prominent characteristics in certain technology fields, and keep a good momentum. On the other hand, however, China still has to catch up with other developed areas regarding its total number and impact of USPTO patents.
Key words USPTO; Chinese patents; international patents; technology mobility; citation network
1 引言
隨著金融、醫(yī)療、交通等行業(yè)大數據的迅速發(fā)展,大數據在科學技術領域也顯露出巨大的開發(fā)價值??萍即髷祿谐藗鹘y(tǒng)的學術出版大數據[1],另一塊體量龐大、價值豐富的數據金礦也同樣引人注目——專利大數據。專利文獻規(guī)范詳實地記錄了特定技術的具體信息,專利的引用關系則指征了知識的流動與技術的內在聯系[2]。因而大規(guī)模的專利數據為系統(tǒng)調查特定主體的技術發(fā)展與演化提供了客觀的數據基礎。我國國內發(fā)明專利擁有量在2016年首次突破100萬件,成為世界上第三個該項數據超百萬件的國家[3]。在經濟全球化的背景下,我國的技術創(chuàng)新活動早已將提升世界范圍的影響力作為目標,然而關于我國參與全球技術交流活動的情況仍缺乏系統(tǒng)的實證研究。美國專利與商標局(USPTO)發(fā)布的專利數據包含美國各地與世界各國在美注冊的專利近400萬件,其中由中國申請的專利為管窺我國的國際專利技術流動情況提供了一扇窗口。本文旨在從USPTO注冊的中國專利及其相關專利的引用網絡中挖掘有關中國專利的重要信息,刻畫中國國際專利的整體態(tài)勢、技術基礎以及國際影響,嘗試為我國參與國際技術競爭與交流提供政策參考與啟示。
2 相關工作
科學文獻之間的引用關系代表了知識從被引方傳遞到了施引方[4]。類似地,專利之間的引用關系也指征了知識的流動和觀念的聯系[2]。一次專利技術流動通過一個專利引用另一個專利而完成。為了定量研究專利的技術流動,專利引用分析的研究曾經使用過多種測度和指標。這些指標可以分為以下幾類:第一類是比較基本的指標,包括:專利被引量,該指標在一定程度上代表了專利的質量;專利施引量,指征某專利吸收先前技術的能力[5];技術循環(huán)時間[5];專利引用頻率[6],等等;第二類包括與引用網絡相關的指標,如中心性(度中心性、中介中心性、接近中心性等)[7]、最短路徑、密度、搜索路徑連接統(tǒng)計值[8]等;第三類包括技術流動相關的測度[5],如吸收強度、吸收速度、吸收廣度、擴散強度和擴散速度等。和前兩類測度相比,這類測度更傾向于捕捉網絡的動態(tài)特征。本文構建了與中國相關的專利引用網絡,使用了第一類和第二類指標進行定量探討。
通過專利引用網絡研究專利技術流動的方法有著廣泛的應用。一方面,構建某個特定領域的專利引用網絡能夠對該領域的技術發(fā)展定量評估,這一方法已經被應用到玉米育種[5]、半導體[9]、納米技術[10]和數據挖掘[11]等多個領域;另一方面,專利引用網絡分析作為一項重要的方法,可以幫助研究人員發(fā)現很多技術領域之間或者國家與國家之間技術流動方面的現象。如楊中楷等[12]構建了專利引用網絡探討了不同技術領域間的關系,他們發(fā)現技術領域間的相互影響在不斷增強;任龍等[13]則使用回歸分析的方法研究了中國區(qū)域技術流動網絡,并給出了一定的政策建議。endprint
3 研究數據與方法
本研究采用的數據集來自USPTO在1975年至2010年間授權的專利。其體量巨大,包括約400萬項專利及其之間的引用關系約4600萬對。本研究從數據集中抽取出專利第一發(fā)明人國籍為中國的所有專利(以下簡稱“中國專利”,共有9384項)、這些專利引用過的專利(技術基礎,共有49744項)和引用了這些專利的后續(xù)專利(技術影響,共有15184項)。這三個專利數據集相互連通,構成了一張包含73293個節(jié)點、85771條邊的中國相關專利的引用網絡。通過分析這些專利數據與引用網絡挖掘中國專利在國際技術活動中的發(fā)展與流動情況。
本文主要用到以下一些指標做定量分析:(1)專利施引,在網絡中表現為出度,表征專利技術的知識基礎[5];(2)專利被引,在網絡中表現為入度,表征專利技術的影響力[14];(3)中介中心度(betweenness centrality),網絡中的節(jié)點在多大程度上是其他節(jié)點聯系的“中介”,表征著節(jié)點對網絡中資源的控制能力,中介中心度越高的節(jié)點越多地占據信息流通的關鍵位置;(4)接近中心度(closeness centrality),網絡中某結點到其他結點最短路徑之和的倒數,接近中心度越高的節(jié)點越處于網絡的核心位置,表征該結點不受其他結點控制的能力;(5)K核,是在網絡中反復去除度小于K的節(jié)點后剩余的子圖,能夠直觀展現大型網絡的內核。
4 研究結果與討論
4.1 USPTO中的中國專利概況
盡管USPTO數據集內的中國專利的總數(9384條)在USTPO專利中的比重并不大,但是它們反映了中國專利在國際專利平臺的顯示度,并為中國技術參與國際技術活動提供了良好的線索。在這些專利中,平均每個專利聲明權利13.99項,參考其他專利8.20條,參考非專利文獻2.54條。值得一提的是,這些專利產生了顯著的國際影響,截至2010年底平均每項專利被其他專利引用了2.12次。USPTO于1981年授權了第一項來自中國的專利,此后中國專利的數量呈爆炸式增長,一直保持強勁增長態(tài)勢(見圖1)。
中國專利在某些技術領域具有較高的顯示度,顯示出我國在這些技術領域的優(yōu)勢和較強的國際參與度。從專利數量看,在356個技術大類中,電連接器、電氣系統(tǒng)與設備、多路通信、圖像分析等四個技術領域占中國專利總數的20%多;從技術影響看,被引次數較高的中國專利來自有效固體器件、外科、服飾(靴、鞋、褲)、印刷品和半導體裝置等技術類別。
4.2 影響中國的專利
在USPTO專利數據中,中國專利一共引用了49744項專利。這些專利涉及126個國家和地區(qū)、497個技術大類、4170個技術小類,成為中國專利在國際上的重要技術來源??梢园l(fā)現,中國專利借鑒的技術類別遠多于自身所屬的技術類別數量,這體現了中國專利所汲取的技術來源較為廣泛。同時,從更細的粒度來看,一些國家與地區(qū)以及技術領域為中國專利提供了更多的技術支持。
日本、臺灣和德國等地區(qū)是除美國外中國專利借鑒技術最多的三個地區(qū)。尤其是日本,為我國提供了大量技術參考。在國際技術活動中,我國同樣引用了國內的大量專利技術,不過數量遠低于其他國家和地區(qū),表明我國在這段時間內的國際技術活動中仍是以學習、吸收別國技術經驗為主。另一個重要的發(fā)現是,中國對美國不同地區(qū)的技術參考也有明顯的側重。加利福尼亞州是美國高科技事業(yè)云集的硅谷所在地,其成為我國在美國最重要的技術參考地區(qū),參考專利數量甚至遠超臺灣、僅次于日本。除此之外,紐約州、德克薩斯州、新澤西州、伊利諾伊州、馬薩諸塞州等地區(qū)也為中國提供了大量技術參考來源(見表1);在技術領域方面,中國專利引用最多的國際專利集中在電連接器、電子系統(tǒng)與裝置、多路通信、圖像分析、電信等大類。
在我國引用的國際專利中,有些自身即具備強大的技術影響力。以被引次數前十的專利為例,來自加利福尼亞州的竟占了7席,其余3席分別被新喀里多尼亞(法國在大洋洲的屬地)、新澤西州與德國各占一席。由此可見,加利福尼亞州強大的技術輻射力以及對我國專利的重要影響。在技術領域方面,這些高影響力專利主要集中在化學(分子生物學與微生物學)、多路通信、塑料與非金屬塑形、電子計算機與數據處理系統(tǒng)等大類。
4.3 中國專利的影響
我國不僅越來越頻繁地申請國際專利,吸收別國科學技術,而且自主研發(fā)的專利也產生了可觀的國際影響。為了深入分析我國專利的國際影響情況,我們從USPTO數據庫中抽取出引用了中國專利的國際專利,共計15184項(需要注意的是,這些僅僅是USPTO收錄的數據)。這些專利來自117個國家或地區(qū),分布于360個技術大類與2134個技術小類。
2010年以前中國專利仍然主要在亞洲范圍內以及美國產生影響。除美國之外,中國、日本、臺灣、德國、韓國與蒙古等國家或地區(qū)借鑒中國專利的次數最多。與中國借鑒了大量美國加利福尼亞州的專利技術相對應,加利福尼亞州同樣大量借鑒了中國的專利技術,其數量甚至超過了中國自身與日本(見表2)。由此可見,中國與美國加州之間存在著非常頻繁的、緊密的雙向技術流動。除此之外,德克薩斯州、紐約州、馬薩諸塞州等也成為中國國際專利技術流向美國的主要地區(qū)。與前文發(fā)現相對應,這些地域也向中國專利提供了大量技術輸出。
從引用我國專利的技術大類看,我國專利在電連接器、電子系統(tǒng)與裝置和圖像分析三個領域具備的國際影響力最高,尤其是在電連接器領域具有顯著的優(yōu)勢。其他影響力較高的領域包括:有效固體器件、半導體裝置生產、外科、多路通信等。另一方面,我們從引用中國專利的自身影響力來看,如果一項自身影響力較高的專利引用了中國專利,那么被引用的中國專利也有可能具備良好和較高的技術價值。我們發(fā)現,在那些引用了中國專利、同時自身影響力又較高的前十項專利中,有半數來自圖像分析領域,可見中國專利在此領域具有十分顯著的技術優(yōu)勢與國際影響。類似分析顯示,外科、半導體裝置制造、藥物等領域也是中國專利的優(yōu)勢所在。endprint
同時我們也可以從統(tǒng)計數據上直觀地看到,引用中國專利的國際專利無論從總數還是涉及的國家或地區(qū)、技術大類以及技術小類等方面都少于中國專利引用的國際專利。在技術創(chuàng)新的道路上,我國仍有很多需要學習國際經驗的地方,仍需提高技術創(chuàng)新質量、獲得更大國際影響力。
4.4 國際專利引文網絡中的中國專利
4.1.1 國家引用網絡
將上述與中國直接相關的三個專利數據集根據引用關系相結合,得到一張包含73293個節(jié)點、85771條邊的專利引用網絡。如果以國家或地區(qū)為觀察對象并對引用關系加權,則得到一張與中國相關的國家或地區(qū)專利引用網絡圖。圖中包含139個國家或地區(qū)以及它們之間的242對引用關系(見圖2)。
顯而易見,中國處于這張網絡的中心,其他國家或地區(qū)則大致以跟中國技術交流的程度由內向外分布。需要說明的是,技術流動網絡圖是一個雙向加權網絡,即節(jié)點之間可以相互指向,邊的粗細則表示節(jié)點之間的交流強度。不過由于中國大量引用了其他地區(qū)的專利,同時逆向的引用則相比較少,因此中國指向其他地區(qū)的箭頭更加顯著。可以發(fā)現,中國主要向日本、加利福尼亞州、臺灣、紐約、德國等地汲取專利技術,廣泛兼顧其他眾多國家和地區(qū)。圖2直觀地說明了我國1975年—2010年期間在國際技術交流活動中,主要處于技術引進的階段。
為了更準確展示中國與其他地區(qū)的技術交流強度,列出了圖2中邊權重前16位的起始節(jié)點與目標節(jié)點(見表3)。從表中可以看出,其中前13條邊均是中國引用其他地區(qū),同時第8位、第10位與第14位則分別是加州、臺灣與日本引用中國專利。這表明我國在重點參考其他國家或地區(qū)的技術的同時,自身的專利技術也產生了一定的國際影響力。
4.1.2 技術領域引用網絡
本文所用的數據集中每個專利都隸屬于一個技術領域。因此,本部分構建了一個技術領域引用網絡,該網絡中每個節(jié)點代表一個技術領域,一條由節(jié)點A指向節(jié)點B的邊代表至少有一個屬于A技術領域的專利引用了B技術領域的專利,該邊的權重在數值上等于A技術領域的專利引用B技術領域專利的頻次。表4展示了網絡中接近中心度入度最高的10個技術領域。從表中可以發(fā)現,電氣系統(tǒng)和裝置、庫存材料和電連接器三個技術領域擁有最高的接近中心性(見表4),這表明它們到其他節(jié)點的距離之和最小。
本文從中介中心性的角度展示了入度最高的10個技術領域。從表中可以看出,庫存材料、電氣系統(tǒng)和裝置與金屬制造領域中介中心性最高(見表5)。這表明這些領域對于這個專利網絡有著較高的“資源控制”程度,處于引用網絡中信息流通的最關鍵位置。對比表4和表5可以發(fā)現,兩種中心性排名前十的技術領域存在一定的重疊:在10個技術領域中有5個存在于兩個排名的前十名(庫存材料、電氣系統(tǒng)和裝置、金屬制造、電連接器和電力通訊領域)。這些專利不論是在于其他技術領域的聯系還是在對整個網絡的控制方面都具有舉足輕重的地位。
另外,從兩表的專利數一欄可以發(fā)現,排名靠前的技術領域其包含的專利數并非都很多;相反,某些排名靠前的技術領域僅包含較少的專利數,如庫存材料等技術領域。這表明這些技術領域的入度高并非是由于其包含的專利多而造成的;其高入度更說明了該領域本身具有很強的影響力。
本文對技術領域引用網絡進行了可視化。鑒于圖中每個節(jié)點代表一個技術領域,為了更好的可視化效果,我們隱去了其中K核小于20和入度小于20的節(jié)點(見圖3)。圖中節(jié)點間的距離越小,表明從引用流動的角度講這兩個節(jié)點代表技術領域的關系越緊密。所有的主要技術領域可以明顯分為5類。經過反復比對和參照,沒有發(fā)現某一類簇僅包含有特定學科下的技術領域;換句話說,同一學科的技術領域在圖中更傾向于分布在各個類簇內。傳統(tǒng)觀念往往認為,同一學科內的技術領域之間技術流動應當較不同學科間技術領域的流動更為頻繁;但圖3的現象表明,與中國相關的專利引用網絡中,不同學科下的技術領域之間也存在較為頻繁的技術流動。這一結論凸顯出當前技術高速發(fā)展時代下不同學科間技術的交叉與相互借鑒。
4.1.3 專利引用網絡
最后考慮單個專利在引用網絡中的角色。單個專利的技術影響力(即被引次數)前文已經有所分析,這里主要分析技術控制力。
在所有專利構成的引用網絡中,中介中心度最高的10個專利均來自中國在1989年—2003年間獲得授權的10個專利。這些專利在國際技術流向中國、經過技術轉化、繼而為其他國家或地區(qū)所借鑒的技術流動路徑上,具有最強的控制能力,因此在溝通中國與其他國家或地區(qū)的技術資源交流方面處于極其重要的地位。它們在USPTO數據集中的專利代號為:4845863、6530903、5380690、6403367、5059178、4921278、5951963、5670037、6355491和6211104。主要來自服飾(靴、鞋、褲)、外科、催化劑與吸附劑、化學(分子生物與微生物)、化學(無機物)、印刷品、礦物油等領域。
本文展示了與中國相關的專利組成的整體引用網絡圖(由于原網絡節(jié)點過多,這里僅展示網絡中度數大于3的節(jié)點)。圖中的布局顯示,技術關系緊密的專利聚集在網絡中心位置,而技術關系松散的專利散布于網絡邊緣(見圖4)。網絡中有一些顯著的發(fā)現:一些內部關系密切并且數量眾多的專利形成數個大型的專利簇群,代表了中國相關專利的核心構成;同時還有一些專利形成了獨立、分散的小型專利簇群,它們自身內部也具有較高的技術凝聚力;除此之外,一些專利構成了明顯的技術流動結構,表現為一些長程的專利技術連線,這些連線有時成為不同專利簇群的溝通橋梁。
為了進一步展現專利網絡的最核心結構,我們利用條件“K核 >= 3,入度 >= 8”對圖4進行精簡,并標出專利代號(結果見圖5)。圖中節(jié)點與標簽大小與節(jié)點的入度(被引次數)呈正比。專利核心網絡分化成五個明顯的簇群,每個簇群里中國專利都處于絕對核心的位置但影響力相對較小,從引用箭頭的指向可以看出技術活動中主要是中國專利在引用其他國家或地區(qū)的專利。簇群1、簇群4、簇群5都相對獨立,簇群2與簇群3通過6752317(法國)、7142197(中國)、6585154(以色列)等專利建立聯系。從中發(fā)現每個簇群中的核心中國專利都來自非常相近甚至相同的技術領域。簇群1中的5個核心中國專利是6954125、7195500、7295415、7289306與6580344,均來自跟電氣系統(tǒng)與設備相關的領域,專利技術主要由紐約流向中國;簇群2中的3個核心中國專利是7262764、7133031與7142197,均來自345大類(計算機圖形處理與選擇性視覺顯示系統(tǒng)),專利技術主要由日本和其他地區(qū)流向中國;簇群3中的8個核心中國專利中有7個來自382大類(圖像分析),另一個則來自與之相關的數據處理(結構設計、建模、仿真與模擬),專利技術主要由加拿大、日本、紐約等地流向中國;簇群4中的3個核心中國專利均來自707大類(數據處理:數據庫與文件系統(tǒng)或數據結構),專利技術主要由加拿大、紐約等地流向中國;簇群5中的4個核心中國專利則有一半來自催化劑與吸附劑領域,另一半來自相關的礦物油領域,專利技術主要在中國內部流動。可以看出,簇群2與簇群3均與計算機圖形、圖像的處理有關,進一步佐證了二者之間的技術關聯性??偨Y來說,中國相關專利的核心網絡主要涉及電氣系統(tǒng)、計算機圖形處理、圖像分析、數據庫與文件系統(tǒng)以及化學材料等領域,中國專利在這些領域具有一定的國家影響,但仍以引進、吸收國際技術為主。endprint
5 結論
對USPTO的全球專利數據(1975年-2010年)中的我國專利數據分析可以發(fā)現,在這段時間內我國的國際專利活動既有技術引入、又有技術輸出,主要以學習國際技術為重頭,自主研發(fā)的技術初具一定的國際影響力,具體表現為:(1)專利數量持續(xù)、迅速增長,保持良好的上升態(tài)勢;(2)在特定領域具有顯著的技術影響力,如電連接器、電子系統(tǒng)與裝置、圖像分析等技術領域;(3)某些地區(qū)成為我國重要的技術參考來源,如日本、臺灣、德國等國以及美國的加利福尼亞、紐約、德克薩斯、新澤西等州;(4)我國國際專利的影響范圍主要在美國、德國以及中國、日本、臺灣、韓國、蒙古等亞洲地區(qū);(5)來自服飾(靴、鞋、褲)、外科、催化劑與吸附劑、化學(分子生物與微生物)、化學(無機物)、印刷品、礦物油等領域的專利在我國的技術流動路徑上扮演著重要的中介角色;(6)專利引用網絡中明顯分化出電氣系統(tǒng)、計算機圖形處理、圖像分析、數據庫與文件系統(tǒng)以及化學材料等五個核心領域。需要注意的是,相比于日本、德國、法國、英國、加拿大、韓國等國家,我國在USPTO中的專利不論在數量還是影響力方面都存在十分明顯的差距。因此,我國在國際專利技術活動中仍需進一步增大參與強度、提高技術創(chuàng)新質量。
參考文獻:
[1] Xia F,Wang W,Bekele T M,et al.Big Scholarly Data: A Survey[J].IEEE Transactions on Big Data,2017,3(1):18-35.
[2] Jaffe A B.Technological opportunity and spillovers of R&D:evidence from firms' patents, profits and market value[EB/OL].[2017-08-20].http://www.nber.org/papers/w1815.pdf.
[3] 中國國內發(fā)明專利擁有量去年首次突破100萬件[EB/OL].[2017-10-03].http://www.zaobao.com.sg/realtime/china/story20171003-800149.
[4] Garfield E.Science Citation Index-A New Dimension in Indexing[J].Science,1964,144(3619):649-654.
[5] 孫軼楠.基于專利引用的國際化技術流動測度研究——以玉米育種技術領域為例[J].情報雜志,2016,35(1):51-56.
[6] 趙黎明,高搖楊.專利引文分析在知識轉移機制研究中的應用[J].科學學研究,2002,20(3):297-300.
[7] 譚曉,張志強.基于專利分析的技術合作和流動研究[J].科學學研究,2013,31(9):1313-1320.
[8] Hummon N P,Doreain P.Connectivity in a citation network:The development of DNA theory[J].Social Networks,1989,11(1):39-63.
[9] 許琦.基于專利引證網絡的技術范式分析——以半導體制造領域為例[J].圖書情報工作,2013,57(4):112-119.
[10] Li X,Chen H,Huang Z,et al.Patent citation network in nanotechnology(1976-2004)[J].Journal of Nanoparticle Research,2007,9(3):337-352.
[11] 許琦,顧新建,陳芨熙.基于專利引證網絡的技術進化路線分析——以數據挖掘領域為例[J].科研管理,2013,34(2):27-35.
[12] 楊中楷,劉倩楠,于霜.基于專利引文網絡的技術領域間關系探析[J].科研管理,2011,32(5):149-155.
[13] 任龍,姜學民,傅曉曉.基于專利權轉移的中國區(qū)域技術流動網絡研究[J].科學學研究,2016,34(7):93-1004.
[14] 高繼平,丁壟,滕立,等.專利-論文混合共被引網絡下的知識流動探析[J].科學學研究,2011,29(8): 1184-1189.
作者簡介:閔超(1990-),男,南京大學信息管理學院博士研究生;步一(1994-),男,美國印第安納大學信息學、計算機與工程學院博士研究生,研究方向:科學計量;孫建軍(1962-),男,南京大學信息管理學院教授,博士生導師,研究方向:網絡信息資源管理、大數據分析。endprint