劉 媛
(重慶大學(xué)法學(xué)院,重慶 400044)
自然語言是人類語言集團在一定條件下自然形成和使用的口頭和書面語言,表現(xiàn)為一些自然形成的語詞指號體系,是語詞指號和語詞意義的統(tǒng)一體[1]。自然語言處理(natural language processing,NLP)技術(shù)就是機器理解和運用人類語言的能力[2],它是一門融合了語言學(xué)、計算機科學(xué)、數(shù)學(xué)的科學(xué)。1949年,美國科學(xué)家Weaver[3]寫就了《翻譯備忘錄》(Translation Memorandum),標志著現(xiàn)代機器翻譯概念的正式形成。當前,全球正處在人工智能(AI)第三次浪潮之中,自然語言處理作為人工智能的核心技術(shù)之一,幫助我們實現(xiàn)人與機器快速準確的信息傳遞,為人工智能與其他產(chǎn)業(yè)的深度融合提供了重要支撐。它廣泛應(yīng)用于無人駕駛、智能家居、機器翻譯等領(lǐng)域,是風險投資和科學(xué)研究的熱門領(lǐng)域,具有極高的產(chǎn)業(yè)價值。美國是在自然語言處理領(lǐng)域擁有巨大優(yōu)勢的技術(shù)強國,在中美貿(mào)易摩擦的背景下,對美國相關(guān)專利數(shù)據(jù)進行分析,可以全面了解該國在此領(lǐng)域的專利競爭態(tài)勢,為中國制定產(chǎn)業(yè)和技術(shù)發(fā)展戰(zhàn)略、企業(yè)研發(fā)決策提供參考。
當前,國內(nèi)外對于中美人工智能技術(shù)實力的判斷大相徑庭。清華大學(xué)的研究報告提出中國超過美國,成為人工智能領(lǐng)域技術(shù)起源第一大國,專利技術(shù)布局程度位居榜首[4];《烏鎮(zhèn)指數(shù):全球人工智能發(fā)展報告2017》中提到,在自然語言處理技術(shù)專利申請數(shù)量方面,中國自2004年起就超越美國,隨后逐年拉開距離[5];而牛津大學(xué)的學(xué)者則認為,中國目前的人工智能實力實際僅約為美國的一半[6];韓國學(xué)者甚至聲稱,盡管近來有很多論文緊張地指出中國大陸在AI領(lǐng)域的力量,但認為中國大陸依然是相對不重要的AI技術(shù)來源地區(qū),中國臺灣比中國大陸擁有更多的AI專利[7]。而之所以會得出不同結(jié)論,關(guān)鍵原因在于研究者們采用了不同的檢索和分析方式?,F(xiàn)有專利分析文獻大多數(shù)沒有公開檢索式,這導(dǎo)致同行無法對數(shù)據(jù)進行監(jiān)督和查證,研究成為自說自話。
考慮到自然語言處理技術(shù)涉及到《國際專利分類表》(International Patent Classification,IPC)中的多個類別,同時,為了最大范圍地進行精確檢索,參考現(xiàn)有文獻,本文檢索條件采用關(guān)鍵詞檢索,關(guān)鍵詞位于標題和摘要中,檢索式為:(((((languag* OR linguist* OR sentenc*) AND ((sentenc* OR lexic*) OR(analy* OR semantic*)))) OR (((languag* OR linguist*OR sentenc*) AND ((dialog* OR talk OR conversation)OR (model* OR manage* OR recoding* OR history*OR DB OR (Data and base)))) OR (((voice* OR speech*OR acoustic* OR sound* OR audio* OR phonetic*) and(((natural* AND language*)) OR (inference* OR detect*OR recogni* OR cogniti* OR interface OR capture*))))OR (((voice* OR speech* OR dialogu* OR conversat*OR speaking* OR language*) OR (combine OR unite OR join OR synthe*)) AND corpus*)) OR (((languag* OR linguist* OR sentenc*) and (morpheme* OR morpholog*)AND (process* OR analy* OR parsing* OR analy* OR assay)))))[7];專利類型限定為發(fā)明,發(fā)明專利授權(quán)日的時間限定在1999年1月1日至2018年12月31日,檢索時間為2019年1月8日。為避免重復(fù)統(tǒng)計,對具有同一優(yōu)先權(quán)文件的專利進行簡單同族合并。因為美國專利申請自申請日起18個月自動公布,或者根據(jù)申請人要求在18個月以內(nèi)公布,還有一些特殊情況不公布,所以近18個月的專利數(shù)據(jù)不能完全呈現(xiàn)客觀情況,僅供參考。
本文通過IncoPat專利數(shù)據(jù)庫進行檢索,獲得1999—2018年美國自然語言處理領(lǐng)域(以下簡稱樣本)專利數(shù)據(jù),運用圖表軟件對數(shù)據(jù)進行統(tǒng)計和可視化處理,采用文字與圖表結(jié)合的方式,從專利申請和授權(quán)趨勢、專利技術(shù)、專利相關(guān)主體、訴訟及運營等4個方面進行專利情報剖析。
(1)專利申請趨勢。因美國公開專利申請文獻是從2001年3月15開始,此前僅公開授權(quán)專利,所以這里分析申請趨勢只能以2001年起算。2001—2018年,樣本專利申請有46 958件,簡單同族后有45 682件,由圖1可知,整體而言,美國自然語言處理領(lǐng)域?qū)@暾埩砍什ɡ耸缴仙隣顟B(tài)。21世紀初,人工智能仍處在第二次浪潮結(jié)束后的寒冬[8],但隨著互聯(lián)網(wǎng)爆炸性的普及,軟硬件條件和海量數(shù)據(jù)開始對人工智能,包括自然語言處理技術(shù)帶來利好;2001—2006年,專利申請穩(wěn)步增長,但自2007年起又開始疲軟無力,逐年下降,2010年跌至2 235件,直到2012年才恢復(fù)到與2006年基本持平的數(shù)量,究其原因,主要是受到2008年金融危機影響,市場震蕩、資本寒冬,惡劣的內(nèi)外部環(huán)境迫使科技公司紛紛倒閉,同時美國政府削減公共科研資金,企業(yè)縮減研發(fā)經(jīng)費,直接導(dǎo)致了專利申請數(shù)量的下挫;此后,經(jīng)濟逐漸復(fù)蘇,2012—2016年,美國在自然語言處理領(lǐng)域的融資規(guī)模已經(jīng)遙遙領(lǐng)先,占全球NLP領(lǐng)域總?cè)谫Y的50%到80%,每年新增的自然語言處理企業(yè)占當年全球NLP領(lǐng)域新增企業(yè)的40%左右[5],2013年與新一輪人工智能爆炸幾乎同步,自然語言處理領(lǐng)域的專利申請量一躍而上,以極快的速度躍過3 000件大關(guān),此后一直穩(wěn)定地保持在高位水平,逐漸進入技術(shù)成熟期。
(2)專利授權(quán)趨勢。1999—2018年,樣本專利總授權(quán)數(shù)量是37 370件,簡單同族后是36 316件。其中,1999—2011年這13年間,專利授權(quán)量保持在1 000~2 000件范圍內(nèi);隨著人工智能第三次浪潮來臨,2012—2016年的專利授權(quán)量躍上2 000件,增勢迅猛;此后,僅用了5年時間,于2017年進入“3 000+”時代。
圖1 1999—2018年樣本專利申請與授權(quán)數(shù)量
(1)10個主要技術(shù)方向。以IPC中的小類代碼為技術(shù)方向,表1展示了樣本發(fā)明專利主要集中的10個小類。其中,G06F(電數(shù)字數(shù)據(jù)處理)和G10L(語音分析識別)分居專利授權(quán)量的冠亞軍,二者占到樣本專利總數(shù)的61.6%,是創(chuàng)新熱度最高、發(fā)展速度最快的領(lǐng)域;處在第二梯隊的是H04M(電話通信)、H04L(數(shù)字信息的傳輸)、H04N(圖像通信)、H04R(聲-機電傳感器)、H04B(傳輸)5個小類,授權(quán)專利數(shù)量從5 000至2 000件不等;第三梯隊是H04W(無線通信網(wǎng)絡(luò))、G06Q(特殊目的的數(shù)據(jù)處理系統(tǒng)或方法)、G08B(信號裝置或呼叫裝置)、G06K(數(shù)據(jù)識別),授權(quán)專利數(shù)量為1 000余件。
表1 1999—2018年樣本10個主要技術(shù)方向?qū)@跈?quán)量
(2)10個技術(shù)方向?qū)@跈?quán)趨勢。1999—2018年,G06F類和G10L類是樣本專利授權(quán)增速最快的兩個技術(shù)方向,近6年尤為明顯,一路遙遙領(lǐng)先;此外,H04R以傳感器為代表的硬件類表現(xiàn)也很搶眼,20年來增長了約15.7倍,應(yīng)該是自然語言處理領(lǐng)域下一個技術(shù)爆炸點。H04L和H04N有著相似的趨勢,樣本專利授權(quán)量分別增長了3.7倍和3.3倍。H04M雖然起步早,但多年來維持在200~400件左右的授權(quán)量,2018年被H04L趕超。H04B與H04M雷同,兩者數(shù)據(jù)表現(xiàn)均疲軟無力,屬于發(fā)展早、后勁弱,亟待技術(shù)革新的方向。后3位H04W、G06、QG08B的樣本專利授權(quán)量分別增長了5.6倍、8.2倍和2.6倍,由于它們的基數(shù)本來偏少,尚需要進一步的積累。見表2所示。
表2 1999—2018年樣本10個主要技術(shù)方向的專利授權(quán)量 單位:件
(3)被引頻次最高的前10件專利。被引頻次,指的是某個專利文獻在首次公開之后被后續(xù)專利文獻引用的總次數(shù)[9]。專利的被引頻次能夠反映技術(shù)重要程度,是判斷一件專利在本領(lǐng)域是否具有基礎(chǔ)和核心地位的關(guān)鍵指標。表3列出了在樣本專利中被引頻次最高的前10件專利,它們的申請日都很早,除排名第一的以外,其他皆是在20世紀末提出的申請;較早的申請時間也導(dǎo)致其中8件專利保護期已屆滿,只有排名前兩名的專利尚處在有效期,第10名的專利因2011年沒有按時交納年費而失效。值得關(guān)注的是,“申請人”一欄中的Hoffberg,其本人身兼發(fā)明家和專利律師兩種角色,在專利運營中非?;钴S;在“當前專利權(quán)人”一欄中,微軟技術(shù)許可公司也很醒目,微軟公司在NLP領(lǐng)域的專利運營水平不容小覷。
表3 1999—2018年樣本高被引頻次專利(前10名)
對專利各類相關(guān)主體進行分析,有助于我們辨別自然語言處理領(lǐng)域的主導(dǎo)者,進一步了解各大創(chuàng)新主體的專利競爭實力、持續(xù)發(fā)展能力及其技術(shù)布局戰(zhàn)略。
(1)申請人(已獲權(quán))國別分布。樣本專利中,在美國提出發(fā)明專利申請并獲得授權(quán)的主體中,為美國籍的多達24 501件專利,占總數(shù)的67.47%,本土創(chuàng)新實力很強;其次,日本籍主體占12.48%,成為在美國進行專利布局最多的外國國家,韓國籍主體占3.60%,中國籍主體共1 104件專利(含中國臺灣653件),占3.04%,可見,亞洲國家搶占美國市場的競爭非常激烈;德國作為老牌技術(shù)強國,占2.27%,名列第五,也是歐洲諸國的排頭兵;其后是加拿大(2.16%)、英國(1.27%)、法國(1.16%)、荷蘭(0.88%)、瑞典(0.80%)。
(2)主要專利申請人授權(quán)趨勢。據(jù)表4顯示,IBM不僅很早就在自然語言處理領(lǐng)域進行專利布局,持續(xù)投入鑄造強大技術(shù)實力,近3年來授權(quán)量迅猛,2018年甚至獲得218件授權(quán)專利。至于微軟,雖然從2015年起專利授權(quán)量開始大跌,2018年“交白卷”,但這并不意味著它從該領(lǐng)域退出,相反,微軟自推出智能助理Cortana(微軟小娜)起,必然需要大量的專利作為支撐,事實上,排名第九的微軟技術(shù)許可公司承擔了大部分專利任務(wù),把母公司的專利業(yè)務(wù)分擔出去;谷歌也在做類似安排。三星和索尼兩家日本公司比較穩(wěn)健。紐昂斯(Nuance)作為目前全球最大的語音識別科技公司,是蘋果語音助手Siri的技術(shù)提供商,從2010年起其樣本專利授權(quán)量開始攀升。創(chuàng)建于1877年的AT&T,是美國老牌固網(wǎng)電話服務(wù)供應(yīng)商及第二大的移動電話服務(wù)供應(yīng)商,但直到2008年才實現(xiàn)專利零突破。亞馬遜表現(xiàn)出后發(fā)制人之勢,2018年專利授權(quán)量僅次于IBM,其在2014年推出的智能音箱Echo的市場占有率排名第1名,專利是它攻城略地的必備武器。
表4 1999—2018年樣本主要專利申請人授權(quán)趨勢(前10名) 單位:件
(3)標準化專利申請人(已獲權(quán))與標準化當前專利權(quán)人。從上文的分析可知,科技公司常常因市場布局、風險分散,分流母子公司業(yè)務(wù)等因素,以旗下某個/些公司的名義進行專利申請,因此,對們進行標準化處理,把母子公司的數(shù)據(jù)進行整合,才能看到其全面而真實的技術(shù)實力。從表5可知,經(jīng)過標準化后,索尼和三星的排名調(diào)換了,AT&T跌出前10名,日本電氣躋身第9名。另一方面,最初的專利權(quán)人可能會對手中的專利進行轉(zhuǎn)讓,那些渴望快速獲得技術(shù)的公司也會通過購買、加入專利池、并購等方式積極儲備專利,因此,通過對當前專利權(quán)人進行標準化分析,我們發(fā)現(xiàn),紐昂斯持有的專利最多,成為行業(yè)領(lǐng)軍者;英特爾、高通、富士通3個科技巨頭通過多種方式獲得了可觀的專利,均有一定優(yōu)勢。
表5 1999—2018樣本標準化專利申請人(已獲權(quán))與標準化當前專利權(quán)人(前10名)
表5 (續(xù))
(4)發(fā)明人及其技術(shù)方向。主要發(fā)明人的數(shù)據(jù)展示了該領(lǐng)域的核心技術(shù)人才及其擅長方向。從專利授權(quán)量的分布看(見圖2),Bangalore作為AT&T實驗室的首席技術(shù)官,在自然語言處理領(lǐng)域很有建樹,論文的被引率也非常高,其發(fā)明專利集中在G06F和G10L兩類。Acero在G10L小類上特別突出,與Bangalore在G10L的專利數(shù)量不相上下,他的技術(shù)成果絕大多數(shù)由微軟持有。Rhoads參與發(fā)明的專利在五大類別都有可觀的分布,這在發(fā)明人中較為少見,他是Tektronix(泰克)公司的首席科學(xué)家,該公司是測試、測量和監(jiān)測領(lǐng)域的全球領(lǐng)導(dǎo)企業(yè),因他曾供職于美國知名的音頻、視頻、圖片識別公司Digimarc,所以當前數(shù)據(jù)顯示其近60%發(fā)明成果由Digimarc享有。其他7位發(fā)明人都以G10L類見長,需要注意的是Rahim、Tur、Gilbert、Riccardi 這4位發(fā)明人都有AT&T背景;此外,Sharifi來自谷歌。唯一上榜的中國發(fā)明人Li Deng來自微軟,Moore V S來自IBM??傮w來看,科技公司是技術(shù)人才極為重要的成長土壤,其中,AT&T成為自然語言處理領(lǐng)域的“黃埔軍?!?,培養(yǎng)了很多優(yōu)秀的人才。
圖2 1999—2018年樣本主要發(fā)明人及在5個技術(shù)方向的專利授權(quán)量
(1)授權(quán)專利轉(zhuǎn)讓情況。從樣本已獲得授權(quán)的專利轉(zhuǎn)讓趨勢,我們可以看到NLP領(lǐng)域在不同時間段的技術(shù)轉(zhuǎn)化、應(yīng)用、推廣與合作的情況。圖3顯示出在1999—2013年,專利轉(zhuǎn)讓數(shù)量呈小幅攀升,技術(shù)運營和實施的熱度正在醞釀;2014年,專利轉(zhuǎn)讓突然躍升到5 745件,究其主要原因,是因為當年美國科技行業(yè)并購異常頻繁,而并購中一般會將專利打包轉(zhuǎn)讓,其中大事件包括微軟收購諾基亞手機業(yè)務(wù)及其專利組合、谷歌收購摩托羅拉移動后轉(zhuǎn)手出售給了聯(lián)想、蘋果收購了20家規(guī)模不同的科技公司等等,經(jīng)過此次行業(yè)“洗牌”,專利進一步集中到科技巨頭手中,轉(zhuǎn)讓需求開始減少;2015年之后專利轉(zhuǎn)讓數(shù)量回落也印證了以上結(jié)論。
圖3 1999—2018年樣本授權(quán)專利轉(zhuǎn)讓趨勢
(2)主要轉(zhuǎn)讓/受讓人及其轉(zhuǎn)讓/受讓專利數(shù)量。轉(zhuǎn)讓/受讓人數(shù)據(jù)可以表明,哪些主體在具體實施專利運營,以及技術(shù)輸出/入活躍度。圖4(a)4(b)顯示,微軟轉(zhuǎn)讓的專利數(shù)量最多;AT&T股份公司及其資產(chǎn)公司、知識產(chǎn)權(quán)公司占據(jù)4席,頗有“狡兔三窟”之意;安華高科技(Avago Technologies)多年來不斷在電子通信行業(yè)擴展和收購,轉(zhuǎn)讓專利也很頻繁。在受讓專利方面,IBM成為最大買家;微軟旗下的技術(shù)許可公司位居第二;紐昂斯本身的研發(fā)實力和原有專利儲備不足,因此它主要是收購專利;索尼和三星為了在美國市場站穩(wěn)腳跟,也買入了很多的專利來保駕護航。此外,轉(zhuǎn)讓人和買受人中還出現(xiàn)美國四大銀行中的3個,即美國銀行(Bank of America)、花旗銀行(CitiBank)、摩根大通銀行(JPMorgan Chase Bank)。除了自有的專利外,銀行作為債權(quán)人或經(jīng)紀人,在破產(chǎn)、質(zhì)押等過程中會涉及到大量專利的轉(zhuǎn)讓和受讓,這也從側(cè)面反映了美國科技與金融兩大行業(yè)關(guān)系密切。
圖4 1999—2018年樣本專利轉(zhuǎn)讓/受讓人情況(前10名)
(3)涉訴專利數(shù)量。普華永道的報告顯示,近5年來,美國總體專利訴訟案件數(shù)量持續(xù)走低,與授權(quán)量走高形成截然相反的趨勢[10]。在這樣的大背景下,加上2014年的行業(yè)“洗牌”,美國自然語言處理領(lǐng)域訴訟案件涉及的授權(quán)專利數(shù)量以該年為轉(zhuǎn)折點,結(jié)束了2000年以來的高增長,近5年大幅下跌(見圖5),再一次反映了主要競爭者逐步變?yōu)樯贁?shù)科技巨頭的行業(yè)現(xiàn)狀。
圖5 1999—2018年樣本涉訴授權(quán)專利數(shù)量
(4)主要訴訟當事人。實踐中,一件專利前后涉及十余個訴訟案件較為常見,母、子公司同時成為訴訟當事人或第三方也經(jīng)常發(fā)生。為避免重復(fù)統(tǒng)計多個案件和母子公司,通過對訴訟當事人進行標準化處理,以涉案專利數(shù)量為指標,本文得到了表6所示數(shù)據(jù)。涉及的案件類型除常見的在美國進行的司法案件,還包括美國專利商標局專利審查和上訴委員會(PTAB)審理了復(fù)審案件。訴訟當事人包括了原被告、反訴原被告、第三方、復(fù)審請求人。涉案專利不限于自己持有的專利,還包括侵犯他人的專利。數(shù)據(jù)顯示,蘋果成為涉及專利數(shù)量最多的訴訟當事人,其后是微軟、谷歌、三星等行業(yè)巨頭。
表6 1999—2018年樣本訴訟當事人及涉案專利數(shù)量
通過對1999—2018年美國自然語言處理領(lǐng)域?qū)@麛?shù)據(jù)的分析,本文可以得到以下結(jié)論:
(1)在競爭環(huán)境方面,自然語言處理技術(shù)的機遇伴隨著人工智能第三次浪潮而到來,2014年之后,逐漸進入技術(shù)成熟期[11]。美國的專利申請量和授權(quán)量都增長迅速,其中,G06F和G10L是最重要的技術(shù)熱點,側(cè)重軟件領(lǐng)域,H04R所代表的硬件領(lǐng)域也極有爆發(fā)潛力,從“軟”到“硬”說明自然語言處理技術(shù)商業(yè)化落地速度加快。美國在NLP領(lǐng)域起步早、發(fā)展快,在全球技術(shù)競爭中占據(jù)了絕對的領(lǐng)先地位,其本土市場擁有多家標桿性的科技企業(yè)、成熟的科技與金融聯(lián)動機制以及較好的科研基礎(chǔ)和人才隊伍。此外,日、韓兩國的實力也非同一般。
(2)在創(chuàng)新和競爭主體方面,科技企業(yè)成為最主要的主體,它們的技術(shù)研發(fā)針對性和目的性強,創(chuàng)新意愿強,發(fā)明成果應(yīng)用程度高,尤其是美、日、韓的代表性企業(yè),不管是傳統(tǒng)巨頭還是后起之秀,多年的經(jīng)營使它們具備扎實的技術(shù)基礎(chǔ),擁有推動自然語言處理技術(shù)迭代和升級的實力。同時,隨著行業(yè)“洗牌”和競爭加劇,各大企業(yè)成立多個子公司以應(yīng)對專利訴訟、許可、買賣等事項,保護企業(yè)的核心業(yè)務(wù)不受侵擾,專利技術(shù)和人才也逐漸集中到少數(shù)企業(yè)手中,形成了較為明顯的馬太效應(yīng)。
《中國制造2025》把人工智能列為智能制造核心信息設(shè)備的關(guān)鍵技術(shù),中國《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006—2020年)》也把中文信息處理列為前沿技術(shù)之一,不管是國家層面的戰(zhàn)略規(guī)劃,還是產(chǎn)業(yè)發(fā)展的現(xiàn)實需要,自然語言處理技術(shù)已然是中國人工智能產(chǎn)業(yè)發(fā)展的重要一環(huán)。當前,中國與美、日、韓在NLP領(lǐng)域的差距較大,建議從以下方面進行改進:
第一,培育以企業(yè)為主導(dǎo)的創(chuàng)新格局?,F(xiàn)今,美國在自然語言處理領(lǐng)域已擁有涵蓋基礎(chǔ)層、技術(shù)層和應(yīng)用層的完整產(chǎn)業(yè)鏈,市場與企業(yè)的規(guī)模和成熟度都遠超中國。有數(shù)據(jù)顯示,美國在NLP領(lǐng)域的創(chuàng)業(yè)公司有252家,中國僅有92家[12]。與美國不同,專利數(shù)據(jù)和論文發(fā)表數(shù)量表明[11,13],中國在NLP領(lǐng)域的主要創(chuàng)新主體并不是科技企業(yè),而是高校和科研機構(gòu),而他們并不是市場主體,只有讓處在競爭中的企業(yè)成為創(chuàng)新的主導(dǎo)者,才能締造出充滿活力的市場和產(chǎn)業(yè)。2017年,中國采取扶持巨頭企業(yè)做大技術(shù)平臺以帶動全行業(yè)發(fā)展的策略,科技部設(shè)立百度、阿里巴巴、騰訊和科大訊飛為首批國家新一代人工智能開放創(chuàng)新平臺,初步顯現(xiàn)出積極影響。然而,創(chuàng)新格局的培育是一個龐大工程,還需要系統(tǒng)的人才梯隊、成熟的市場機制、完善的法律制度、良好的營商環(huán)境,以及保護創(chuàng)新的社會共識等眾多板塊的協(xié)調(diào)發(fā)展。
第二,加快科研成果轉(zhuǎn)化。世界知識產(chǎn)權(quán)組織的報告指出,全球人工智能專利申請前20名學(xué)術(shù)機構(gòu)中有17家來自中國,人工智能相關(guān)科學(xué)出版物數(shù)量前20名學(xué)術(shù)機構(gòu)中有10家來自中國,10年里中國論文數(shù)量增加了150%[14]??梢姡袊娜斯ぶ悄芫哂胁诲e的學(xué)術(shù)研究基礎(chǔ)。但另一方面,中國人工智能論文的引用率卻被美國遠遠甩在后面,低于世界平均水平[13],論文質(zhì)量還有待提高。高校和科研機構(gòu)利用公共資金產(chǎn)生的技術(shù)成果,轉(zhuǎn)化率并不理想,造成了很大的浪費。這一問題不僅存在于自然語言處理領(lǐng)域,在其他技術(shù)領(lǐng)域也較為常見[15]。為了鼓勵科技成果轉(zhuǎn)化,中國已采取的措施有修訂《促進科技成果轉(zhuǎn)化法》、建設(shè)高??萍汲晒灰拙W(wǎng)站、設(shè)立高??萍汲晒D(zhuǎn)化和技術(shù)轉(zhuǎn)移基地等等,這些以行政手段為主的措施起到了一定效果,但轉(zhuǎn)化的動力根本來源于市場。因此,需要優(yōu)化科研成果的知識產(chǎn)權(quán)和利益分配機制,激勵科研人員的主動性;加大引入專利市場運營主體、中介機構(gòu),擴寬供需信息渠道;條件成熟的高校成立專門的知識產(chǎn)權(quán)運營公司,避免校內(nèi)行政人員低效率管理。
第三,加強在美國的專利布局。雖然百度、中國科學(xué)院、浙江大學(xué)等在國內(nèi)的自然語言處理專利申請數(shù)量非常突出,但他們的美國專利卻寥寥無幾;而中國企業(yè)在美國布局該領(lǐng)域?qū)@囊匀A為技術(shù)有限公司、鴻海集團、臺灣工研院、深圳市騰訊計算機系統(tǒng)有限公司、中興通訊股份有限公司為主,其美國專利數(shù)量依舊很少,與日韓企業(yè)相差甚遠。在技術(shù)競爭全球化的今天,不能無視作為科技行業(yè)必爭之地的美國市場,我們應(yīng)當加快在美國的NLP領(lǐng)域?qū)@季?,尤其是重點技術(shù)方向,運用靈活的專利運營策略,以在激烈的競爭中贏得主動權(quán)。
第四,注重專業(yè)人才培養(yǎng)。中國在自然語言處理領(lǐng)域的高校專業(yè)體量偏小,專業(yè)人才儲備不足,員工人數(shù)僅為美國的1/3[12]?;A(chǔ)層面人才薄弱、頂尖領(lǐng)軍人才欠缺,無法持續(xù)為產(chǎn)業(yè)輸出有生技術(shù)力量,制約了中國NLP產(chǎn)業(yè)的長期發(fā)展。因此,我們亟需夯實相關(guān)專業(yè)課程建設(shè),完善在職人員技能培訓(xùn)體系,搭建人才成長平臺,把培養(yǎng)自然語言處理專業(yè)人才作為一項長期工作堅持下去。
致謝:感謝重慶大學(xué)法學(xué)院2018級知識產(chǎn)權(quán)法研究生郭芳制作本文部分圖表。