符川川
(南京大學(xué) 信息管理學(xué)院,江蘇 南京 210023)
近年來,全球化進程加速,新一輪科技革命競爭日益激烈,專利申請成為展現(xiàn)國家科技創(chuàng)新能力的重要手段。不少國家和地區(qū)及時洞察到這一發(fā)展態(tài)勢,并加大專利申請投入,以便形成系統(tǒng)的專利布局。我國為占領(lǐng)科技創(chuàng)新驅(qū)動產(chǎn)業(yè)變革的戰(zhàn)略制高點,明確把數(shù)字創(chuàng)意產(chǎn)業(yè)作為戰(zhàn)略性新興產(chǎn)業(yè)的發(fā)展任務(wù),并實施了一系列激勵政策促進數(shù)字產(chǎn)業(yè)的專利申請,以提高在該領(lǐng)域的國際競爭力。大數(shù)據(jù)分析技術(shù)是一種建立在海量數(shù)據(jù)基礎(chǔ)上的新興數(shù)據(jù)分析方法,其利用數(shù)據(jù)挖掘和機器學(xué)習(xí)從結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)中挖掘隱含的文本、語音、圖像等信息,從而實現(xiàn)大規(guī)模數(shù)據(jù)的處理分析、規(guī)則挖掘和模型預(yù)測,對加速數(shù)字創(chuàng)意產(chǎn)業(yè)的跨越式發(fā)展大有裨益。多媒體信息處理的快速普及和飛速發(fā)展使得數(shù)字聲音、數(shù)字圖像、數(shù)字視頻等成為大數(shù)據(jù)分析技術(shù)的主要作用對象,并將數(shù)據(jù)標(biāo)注和語義分析再翻譯成人類理解的信息,為不斷優(yōu)化多種深度神經(jīng)網(wǎng)絡(luò)模型處理指數(shù)級增長的文本、聲音、圖像等信息提供增強算力。透過專利信息視角研究大數(shù)據(jù)分析技術(shù)在多媒體信息處理中的應(yīng)用對于洞察專利分布、合理布局?jǐn)?shù)字產(chǎn)業(yè)具有重要意義。
大數(shù)據(jù)分析技術(shù)在多媒體信息處理中的應(yīng)用進入快速發(fā)展時期,其逐漸成為學(xué)界和工業(yè)界的研究熱點,國內(nèi)外有關(guān)大數(shù)據(jù)分析技術(shù)在多媒體信息處理中應(yīng)用的研究主要集中在以下三方面。第一,文本信息處理技術(shù)在多媒體信息處理中的應(yīng)用,大多基于文本信息處理技術(shù)抽取多媒體信息特征并挖掘本質(zhì)信息。在信息檢索領(lǐng)域,提出了有監(jiān)督的詞袋模型以提高多媒體信息檢索的精確度并減少檢索耗時[1];在自動摘要領(lǐng)域,構(gòu)建了文本自動綜述系統(tǒng)模型以抽取多媒體信息中的關(guān)鍵內(nèi)容并合成摘要[2];在多媒體信息要素抽取領(lǐng)域,提出了Golay Code 算法從多媒體數(shù)據(jù)集中的元知識提取元特征來研究數(shù)據(jù)點之間的關(guān)系模式[3];在新媒體交互式監(jiān)管領(lǐng)域,利用大數(shù)據(jù)分析技術(shù)將新媒體內(nèi)容進行過濾、排重、分類,從而形成監(jiān)控信息樹[4]。第二,語音信息處理技術(shù)在多媒體信息處理中的應(yīng)用,大多基于語音信息處理技術(shù)對多媒體信息特征進行分類。在語音聲調(diào)識別領(lǐng)域,提出K-means 初始化EM 算法進行語音聲調(diào)識別仿真[5];在語音情感識別領(lǐng)域,構(gòu)建LDA-kernel-KNNFLC 模型用于學(xué)習(xí)語音情感數(shù)據(jù)庫的特征空間以實現(xiàn)識別語音情感[6],探究了中間匹配內(nèi)核(IMK)的分類器性能以進行語音情感識別[7],優(yōu)化了支持向量機(SVM)對特征向量集的長時語音的變化長度模式以進行語音情感分類[8]。第三,圖像信息處理技術(shù)在多媒體信息處理中的應(yīng)用,大多基于圖像信息處理技術(shù)對多媒體信息內(nèi)容進行特征抽取。在圖片聚類領(lǐng)域,借鑒超圖非負(fù)矩陣分解模型對無標(biāo)簽圖片進行預(yù)處理以提高聚類精確度[9];在圖像加密領(lǐng)域,提出LSIC 模型進行灰度和彩色圖像加密[10],優(yōu)化了安全圖像密碼系統(tǒng)并進行深入的安全分析[11];在視頻場景檢測領(lǐng)域,改進頻譜聚類方法以有效地總結(jié)每個鏡頭的內(nèi)容并準(zhǔn)確地檢測大多數(shù)場景邊界[12];在圖像的人機交互領(lǐng)域,以多分辨率紋理圖像信息(MRTII)的新特征抽取算法表征和分類人眼對頻譜圖像的不同情感[13]。
通過文獻梳理發(fā)現(xiàn),專利信息視角下的大數(shù)據(jù)分析技術(shù)發(fā)展及演進頗受關(guān)注,研究內(nèi)容包括:基于專利地圖探索大數(shù)據(jù)技術(shù)在各國的發(fā)展現(xiàn)狀[14],基于專利分析我國大數(shù)據(jù)產(chǎn)業(yè)在國內(nèi)和國外的競爭態(tài)勢[15],基于專利可視化和產(chǎn)業(yè)動態(tài)探究大數(shù)據(jù)領(lǐng)域技術(shù)創(chuàng)新的演進[16],基于專利視角預(yù)見大數(shù)據(jù)產(chǎn)業(yè)技術(shù)路線圖[17]等?;趯@畔⒁暯菑暮暧^層面探析大數(shù)據(jù)分析技術(shù)的演進研究比較豐富,但探索微觀層面的研究有進一步提升的空間。因此,分析專利申請時間、地區(qū)、技術(shù)內(nèi)容等微觀內(nèi)容有助于更全面細(xì)致地了解大數(shù)據(jù)分析技術(shù)在多媒體信息處理中的應(yīng)用,并把握未來技術(shù)發(fā)展趨勢。本研究采集大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的相關(guān)專利,針對專利現(xiàn)狀、專利技術(shù)主題、專利申請人、重點專利等微觀內(nèi)容進行分析,以期明晰該領(lǐng)域?qū)@植记闆r,為我國數(shù)字產(chǎn)業(yè)的專利布局建言獻策。
從湯森路透專利數(shù)據(jù)庫(Thomson Reuters Integrity)下載得到1 085 件大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的專利,包括全球收錄專利的116 個國家和地區(qū)。在獲取初始專利后對其進行檢索設(shè)置,并進行相應(yīng)的去重處理。本研究經(jīng)過篩選得到956 件同族專利,檢索方式如表1 所示。
表1 檢索方式
利用專利申請量隨時間的推移而變化來分析當(dāng)前技術(shù)領(lǐng)域發(fā)展所處階段。由圖1 可知,1995—2005 年,全球的大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的專利申請量緩慢增長,個別年份沒有專利申請,年平均申請量不足2 件,處于萌芽期。2006—2017 年專利申請量快速增長,尤其在2013—2015年專利申請量成倍增長,處于成長期。2017—2018年專利申請量增幅有所放緩,處于成熟期。2018—2020 年專利申請量降幅明顯,處于衰退期,本領(lǐng)域的技術(shù)在該階段競爭激烈,需要提前進行預(yù)警,避免不必要的研發(fā)投入。
圖1 全球?qū)@暾埩?/p>
1.專利技術(shù)來源國/地區(qū)排名分析。分析大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的專利技術(shù)優(yōu)先權(quán)國家/地區(qū)(即技術(shù)來源國/地區(qū)),可以挖掘該領(lǐng)域特定技術(shù)的創(chuàng)新潛質(zhì)和落地可能,同時也可以追蹤持有特定技術(shù)的研發(fā)部門的聚集區(qū)。圖2 顯示世界知識產(chǎn)權(quán)五局以及中國臺灣地區(qū)的專利申請情況。由圖2 可知,中國、韓國、美國、日本、中國臺灣、法國排名前六位,其中中國的專利申請量占據(jù)絕對的數(shù)量優(yōu)勢,該優(yōu)勢得益于中國早期的專利布局,這也反映了中國大數(shù)據(jù)分析技術(shù)在多媒體信息處理中的應(yīng)用已經(jīng)進入“中國創(chuàng)造”階段。中國在該領(lǐng)域可以抓住專利提前布局的時機,將一些核心技術(shù)落地并形成產(chǎn)業(yè)化以搶占國際競爭制高點。
圖2 專利技術(shù)來源國/地區(qū)專利申請數(shù)量
2.專利技術(shù)在世界知識產(chǎn)權(quán)五局的流向。通過分析該領(lǐng)域的授權(quán)專利在中國、美國、歐洲、日本、韓國世界知識產(chǎn)權(quán)五局的流向可以獲取五局的專利優(yōu)先權(quán)情況以及專利布局情況。由圖3 可知中國的專利優(yōu)先權(quán)最多,遠高于其他四個專利局,但是中國的專利大部分布局在國內(nèi),很少布局在國外。美國、韓國、日本雖然專利優(yōu)先權(quán)較少,但是大部分布局在中國。上述現(xiàn)狀的原因在于,中國市場相對開放,對國內(nèi)和國外專利權(quán)限的地域性限制較少;中國的專利申請時間相對短于國外并且申請難度也低于國外。此外,中國的部分專利申請人重數(shù)量,輕質(zhì)量。因此,該領(lǐng)域中國的專利質(zhì)量同國外相比有一定差距。為打開該領(lǐng)域?qū)@膰H市場并提高競爭力,需要國內(nèi)專利申請人提前進行專利布局并提高申請專利的質(zhì)量。
圖3 專利技術(shù)的五局流向
3.我國各省的專利申請量。進一步縮小檢索范圍可獲知我國各省市在該領(lǐng)域的專利申請情況,從而洞悉各省市的科技創(chuàng)新能力以及對科技的重視程度。檢索后統(tǒng)計分析可知,該領(lǐng)域?qū)@暾埩颗琶珖笆坏氖∈蟹謩e為北京、廣東、江蘇、上海、山東、四川、安徽、浙江、湖北以及天津。這些省市表現(xiàn)出活躍的科技創(chuàng)新能力,其中大部分位于長三角、珠三角、京津冀三大經(jīng)濟帶上;這些省市的當(dāng)?shù)卣銐蛑匾曉擃I(lǐng)域?qū)@纳暾?表現(xiàn)為對專利申請費、審查費、年費、復(fù)審費等費用的減繳;降低專利申請人準(zhǔn)入門檻,施行專利申請的揭榜掛帥制度;對向國外申請該領(lǐng)域?qū)@慕M織或個人等,給予優(yōu)惠政策以激勵高質(zhì)量專利的申請。
對大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用的專利技術(shù)構(gòu)成進行分析,其重點在于分析該領(lǐng)域主要技術(shù)分支的覆蓋情況并深化對特定技術(shù)創(chuàng)新程度的了解,從而挖掘隱含的專利技術(shù)空白點以提前作好專利布局。圖4 表征各分類號對應(yīng)特定技術(shù)的專利情況。排名前十位的分別為G06F17、H04L29、G06Q50、G06Q10、G06K9、G06F16、G06Q30、H04L12、H04N21、H04N7,對應(yīng)著特定功能的數(shù)字計算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法、特定商業(yè)領(lǐng)域的系統(tǒng)或方法、閱讀或識別印刷或書寫字符或者用于識別圖形、信息檢索、數(shù)據(jù)交換網(wǎng)絡(luò)、交互式電視等。由此可知,特定功能的數(shù)字計算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法引領(lǐng)著多媒體信息處理,該技術(shù)蘊含著巨大的經(jīng)濟利益,可以為投資者提供一定的決策參考。
圖4 技術(shù)構(gòu)成
基于對大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中專利技術(shù)構(gòu)成的分析,本研究對重要技術(shù)在主要國家的分布進行分析。由圖5 可知,氣泡越大表明該國擁有的專利技術(shù)越多。根據(jù)氣泡大小可知,上述全球排名前十的技術(shù)專利大部分分布在中國、美國、韓國;中國在該領(lǐng)域的關(guān)鍵技術(shù)的專利數(shù)量大于美國和韓國,在該領(lǐng)域有著較強的競爭力,也反映中國的科技戰(zhàn)略在該領(lǐng)域已初見成效。
圖5 重要技術(shù)分支地域分布
根據(jù)特定公司擁有大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的專利數(shù)量可以研判該領(lǐng)域的競爭對手,并進行風(fēng)險規(guī)避。由圖6 可知,專利優(yōu)先權(quán)排名前十位的分別為國家電網(wǎng)公司、騰訊科技(深圳)有限公司、聯(lián)想(北京)有限公司、上海市電力公司、北京易游華成科技有限公司、北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司、南方電網(wǎng)深圳數(shù)字電網(wǎng)研究院有限公司、中國移動通信集團公司、北京派瑞根科技開發(fā)有限公司、深圳供電局有限公司。進一步分析發(fā)現(xiàn),該技術(shù)領(lǐng)域的競爭不在國外,主要集中在國內(nèi),主要專利權(quán)擁有者的積極競爭有利于該領(lǐng)域技術(shù)在國內(nèi)的發(fā)展。因此,為了提升在該領(lǐng)域的競爭力,有必要提前在國外進行專利布局。
圖6 專利主要申請人
當(dāng)上述專利競爭達到一定強度時會阻礙創(chuàng)新技術(shù)的發(fā)展,不斷設(shè)置專利圍欄會給后進者帶來極高的成本,反而不利于專利的申請。合作申請專利則可以減少專利申請的代價,因此,有必要合作申請專利。分析專利申請人的合作網(wǎng)絡(luò)可以發(fā)現(xiàn)潛在的合作對象。由圖7 知,國家電網(wǎng)公司與其他公司合作申請的該領(lǐng)域?qū)@^多,較多的合作專利有利于其向國外布局該領(lǐng)域?qū)@?/p>
圖7 專利合作申請
一般情況下,專利被引用的次數(shù)越多則該專利的質(zhì)量和經(jīng)濟價值越高,其影響力也就越大,進而成為核心專利。由表2 可知,被引專利最多的專利號分別為 CN101262494A、US20170235848A1、CN105187771A、CN104573619A、CN102945027A、CN104796485A、CN101025737A、CN103838617A、CN105678398A、CN104917669A。這些專利是大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的核心專利,其中華為技術(shù)有限公司被引用次數(shù)最多,表明該公司是本領(lǐng)域的領(lǐng)軍者,能為后續(xù)專利申請人指明方向。
表2 專利被引次數(shù)
大數(shù)據(jù)分析技術(shù)在多媒體信息處理應(yīng)用中的專利權(quán)利要求數(shù)量越多則其技術(shù)范圍越廣,專利家族越大,其他新申請的專利難以繞過,那么專利質(zhì)量就越高。由圖8 可知,專利權(quán)利要求數(shù)量排名前十的專利號分別為CN110073301A、CN1294812A、CN1183841A、CN103339913A、CN104254863A、CN105229687A、CN109219801A、CN1672178B、CN1568466A、CN1049 51077A,對應(yīng)的權(quán)利要求數(shù)量(項)分別為1 442、352、292、260、190、94、60、59、58、42,其中強力物聯(lián)網(wǎng)投資組合2016 有限公司的專利權(quán)利要求數(shù)量最多,其擁有的專利技術(shù)范圍較廣,同行難以繞過,因此該公司具備較強的科技競爭力。
圖8 專利權(quán)利要求數(shù)量
借助對該領(lǐng)域重點專利的創(chuàng)新詞云分析可以抽取該領(lǐng)域的技術(shù)主題詞,并逐步探索該領(lǐng)域的研發(fā)重點以及未來的風(fēng)向。本研究進行中文分詞、英文切詞等預(yù)處理,并清洗一些噪音數(shù)據(jù)。基于此,本研究應(yīng)用機器學(xué)習(xí)算法對該領(lǐng)域的專利文本進行聚類,并可視化專利的關(guān)鍵詞。由圖9 可知基于多媒體、服務(wù)器、數(shù)據(jù)庫、多媒體信息、數(shù)據(jù)采集、互聯(lián)網(wǎng)、大數(shù)據(jù)分析技術(shù)、管理系統(tǒng)、分布式、數(shù)據(jù)存儲等關(guān)鍵詞的專利數(shù)量最多,表明基于這些關(guān)鍵詞的專利屬于該領(lǐng)域的核心專利。
圖9 創(chuàng)新詞云
通過專利地圖可視化探析該領(lǐng)域的重點專利技術(shù)布局,專利地圖①由國際專利分類號聚類生成地形,在此基礎(chǔ)上,對重點專利進行文本分析并抽取標(biāo)簽詞。其中,專利地圖的高峰表示重點專利技術(shù)聚集的區(qū)域,低谷反映該領(lǐng)域?qū)儆诳瞻?可以提前進行專利布局。專利地圖可表征該領(lǐng)域的高價值專利,經(jīng)過聚類抽取的主要標(biāo)簽分別為客戶、全景、決策、評估、廣告,電視、機器人、廣播、日志、重現(xiàn),圖書館、多媒體系統(tǒng)、云端、黃頁、走失,遙控、節(jié)點、衛(wèi)士、消息、網(wǎng)關(guān),通信、無線、智能家居、功能、接口,模型、構(gòu)建、數(shù)據(jù)挖掘、一體化、二維碼,輿情、航空、評價、臨床、存儲。基于這些標(biāo)簽專利屬于該領(lǐng)域的熱點專利,具有客觀經(jīng)濟和技術(shù)價值。
本研究基于專利信息視角探索大數(shù)據(jù)分析技術(shù)在多媒體信息處理中的應(yīng)用。從專利現(xiàn)狀分析、專利技術(shù)主題分析、專利申請人分析、重點專利分析四個角度進行有關(guān)技術(shù)應(yīng)用的解析,得出的結(jié)論和相應(yīng)政策建議如下:
第一,分析該領(lǐng)域?qū)@默F(xiàn)狀可知,全球在該領(lǐng)域的專利申請量降幅比較明顯,但是我國在該領(lǐng)域?qū)@暾埩空紦?jù)較大份額。該領(lǐng)域在我國已經(jīng)進入“中國創(chuàng)造”階段。我國在該領(lǐng)域的專利申請量主要集中在三大經(jīng)濟帶上。我國在該領(lǐng)域的專利大部分布局在國內(nèi)?;诖?我國需要加大對該領(lǐng)域關(guān)鍵性技術(shù)的研發(fā)投入,提高專利審查員和專利申請人的業(yè)務(wù)素質(zhì)以提升授權(quán)專利的質(zhì)量,從而在國外布局該領(lǐng)域的專利中搶占市場先機。
第二,對該領(lǐng)域的專利技術(shù)主題進行分析可知,該領(lǐng)域主要對應(yīng)著特定功能的數(shù)字計算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法、特定商業(yè)領(lǐng)域的系統(tǒng)或方法、閱讀或識別印刷或書寫字符或者用于識別圖形、信息檢索、數(shù)據(jù)交換網(wǎng)絡(luò)、交互式電視等。未來的技術(shù)空白點可能是上述某一技術(shù)的深化或者若干技術(shù)的組合。為提高該領(lǐng)域?qū)@跈?quán)率,需要分析上述技術(shù)構(gòu)成并挖掘上述技術(shù)以外的空白點,而挖掘技術(shù)空白點可以催生出一些新興產(chǎn)業(yè)。因此,需要培養(yǎng)交叉型復(fù)合人才以洞悉該領(lǐng)域的空白點。此外,重要技術(shù)主要集中在中國、美國和韓國,但是中國的這些重要技術(shù)在國外專利授權(quán)率較低,需要加強原始創(chuàng)新以提高專利質(zhì)量。
第三,對專利申請人進行分析可知,該領(lǐng)域的主要專利申請人集中在我國的企業(yè),我國企業(yè)在全球具有較強的競爭力;國內(nèi)在該領(lǐng)域的專利合作者主要集中在國家電網(wǎng)公司。為提高我國在該領(lǐng)域的技術(shù)競爭力和話語權(quán),需要轉(zhuǎn)變“重數(shù)量輕質(zhì)量”的專利申請模式,并積極同國外專利申請者合作,促進我國從專利大國邁向?qū)@麖妵?/p>
第四,對重點專利進行分析可知,基于多媒體、服務(wù)器、數(shù)據(jù)庫、多媒體信息、數(shù)據(jù)采集、互聯(lián)網(wǎng)、大數(shù)據(jù)分析技術(shù)、管理系統(tǒng)、分布式、數(shù)據(jù)存儲等關(guān)鍵詞的專利屬于該領(lǐng)域的核心專利?;诖?需要敏銳地洞察一些專利的分項技術(shù)是否屬于上述關(guān)鍵詞所涉及的技術(shù),從而研判這些專利是否為重點專利,并進行技術(shù)生命周期分析以決定是否值得進入。
注釋:
①因版面所限,專利地圖未標(biāo)出。