謝湘寧
專利挖掘工作是企業(yè)進(jìn)行專利布局及實(shí)施專利管理工作的基礎(chǔ),因此,專利挖掘中有效的挖掘方法,是助力企業(yè)專利挖掘工作的一個(gè)利器。專利挖掘工作中,如何確定待挖掘的數(shù)據(jù)源,即從何種對(duì)象入手實(shí)施專利挖掘,是達(dá)成專利挖掘的項(xiàng)目目標(biāo)的一個(gè)關(guān)鍵。通常情況下,企業(yè)會(huì)考慮主要基于如下幾類數(shù)據(jù)源來規(guī)劃挖掘工作:
1.基于企業(yè)產(chǎn)品來挖掘某一技術(shù)領(lǐng)域的專利;
2.基于某一類技術(shù)現(xiàn)有的專利來挖掘外圍專利;
3.基于單一競(jìng)爭(zhēng)對(duì)手的專利來有針對(duì)性的實(shí)施專利挖掘;
4.針對(duì)一類產(chǎn)品挖掘其在某一技術(shù)領(lǐng)域的標(biāo)準(zhǔn)專利。
此處需要注意的是,企業(yè)在上述挖掘工作中,都同時(shí)面臨如何管理好待挖掘的數(shù)據(jù)源的問題。那么,是否可以找到一種可靠的數(shù)據(jù)管理模型,來提供高效的數(shù)據(jù)管理方式?
在此,我們先引入一個(gè)在計(jì)算機(jī)的數(shù)據(jù)挖掘領(lǐng)域廣泛使用的概念“數(shù)據(jù)存儲(chǔ)庫”(例如數(shù)據(jù)倉庫)。數(shù)據(jù)挖掘可以應(yīng)用于任何類型的數(shù)據(jù)存儲(chǔ)庫,一般情況下,數(shù)據(jù)存儲(chǔ)庫可以包括如下幾種類型:數(shù)據(jù)倉庫、關(guān)系數(shù)據(jù)庫、事物數(shù)據(jù)庫、萬維網(wǎng)、一般文件和數(shù)據(jù)流等。本文將重點(diǎn)關(guān)注數(shù)據(jù)倉庫。所謂數(shù)據(jù)倉庫,是一種具有收集并組織多維度數(shù)據(jù)功能的信息存儲(chǔ)庫,正是基于這種特性,本文考慮將其作為著重討論的一種應(yīng)用于專利挖掘工作的數(shù)據(jù)管理模型。
下面就針對(duì)基于企業(yè)產(chǎn)品來挖掘某一技術(shù)領(lǐng)域的專利挖掘工作,以依靠自主研發(fā)技術(shù)而聞名的A企業(yè)為例,討論一下在專利挖掘過中如何應(yīng)用數(shù)據(jù)倉庫這種數(shù)據(jù)管理模型,使得專利挖掘工作更簡(jiǎn)單、挖掘結(jié)果更準(zhǔn)確。
假設(shè)A企業(yè)是一個(gè)成功的跨國公司,我們當(dāng)前的任務(wù)是挖掘該公司每種產(chǎn)品在人工智能領(lǐng)域的專利,A公司產(chǎn)品部門分布全球,涉及的產(chǎn)品線多達(dá)幾十個(gè),且每個(gè)產(chǎn)品線在人工智能領(lǐng)域都有完善的自主開發(fā)的技術(shù)集。目前,該企業(yè)計(jì)劃布局每個(gè)產(chǎn)品在人工智能領(lǐng)域的專利。
分析可知,A公司產(chǎn)品線多,從數(shù)據(jù)管理的角度來看,每個(gè)產(chǎn)品在人工智能領(lǐng)域開發(fā)的技術(shù)方案相對(duì)分散,散布在多個(gè)開發(fā)部門的開發(fā)組中實(shí)現(xiàn),因此,在專利挖掘過程中,A公司應(yīng)考慮如何高效、無遺漏地挖掘并管理來自不同開發(fā)組開發(fā)的專利方案。圖1展示了一種數(shù)據(jù)倉庫構(gòu)造和使用的典型系統(tǒng)框架,經(jīng)過研究,可以考慮將圖1所示的數(shù)據(jù)倉庫的結(jié)構(gòu)模型應(yīng)用在該專利挖掘項(xiàng)目中,以高效、高質(zhì)地完成專利挖掘目標(biāo)。
數(shù)據(jù)倉庫的核心是多維數(shù)據(jù)庫結(jié)構(gòu)建模,該模型實(shí)現(xiàn)了一種典型的物理結(jié)構(gòu),即多維數(shù)據(jù)立方體(multidimensional data cube)。數(shù)據(jù)立方體可以提供數(shù)據(jù)的多維視圖,每個(gè)維對(duì)應(yīng)于模式中的一個(gè)或一組屬性,好處是可以快速查詢到匯總數(shù)據(jù)。
針對(duì)A公司的專利挖掘項(xiàng)目,在待挖掘的數(shù)據(jù)源是各個(gè)產(chǎn)品中人工智能領(lǐng)域的技術(shù)內(nèi)容的情況下,我們可以利用上述多維數(shù)據(jù)立方體構(gòu)建一種可靠的數(shù)據(jù)管理模型。如圖2所示,在此項(xiàng)目中,多維數(shù)據(jù)立方體中的三個(gè)維度可以定義為:產(chǎn)品(電視、音響、電飯煲、冰箱等)、人工智能技術(shù)(圖像識(shí)別、語義分析、信息檢索、深度學(xué)習(xí))和產(chǎn)品的應(yīng)用場(chǎng)景(物聯(lián)網(wǎng)、智能家居、導(dǎo)航、客服等),即本次項(xiàng)目的挖掘工作可以采用上述模型所限定的三個(gè)維度元素進(jìn)行組合遍歷,該多維數(shù)據(jù)立方體中的每個(gè)單元存儲(chǔ)挖掘到的專利的技術(shù)方案。如圖2所示,在物聯(lián)網(wǎng)場(chǎng)景下,同圖像識(shí)別相關(guān)的家用電視的專利技術(shù)方案內(nèi)容為S4,存放在單元<電視,圖像識(shí)別、物聯(lián)網(wǎng)>中,而其他立方體單元中可以存放遍歷其他幾個(gè)維度組合上挖掘到的技術(shù)方案。
下面就基于上述數(shù)據(jù)管理模型,簡(jiǎn)述A公司產(chǎn)品在人工智能領(lǐng)域的專利挖掘過程和挖掘結(jié)果。
1.1 產(chǎn)品維度
分析A公司的產(chǎn)品系列,可以綜合考慮產(chǎn)品的重要度、成熟度等幾個(gè)方向綜合確定產(chǎn)品的專利挖掘方向和重點(diǎn)。
在產(chǎn)品重要度的分類中,可以考慮將產(chǎn)品按照重點(diǎn)產(chǎn)品和非重點(diǎn)產(chǎn)品劃分,分別估算重點(diǎn)產(chǎn)品和非重點(diǎn)產(chǎn)品能產(chǎn)出的專利量。需要說明的是重點(diǎn)產(chǎn)品具有如下一個(gè)或多個(gè)屬性:市場(chǎng)占有率和增長率高、技術(shù)含量高、銷售利潤高等。
在產(chǎn)品成熟度的分類中,可以考慮將產(chǎn)品按照市場(chǎng)應(yīng)用和技術(shù)實(shí)現(xiàn)的成熟性進(jìn)行劃分,重點(diǎn)估算成熟度高的產(chǎn)品的專利量。需要說明的是高成熟度的產(chǎn)品包括如下一個(gè)或多個(gè)屬性:涉及前沿的實(shí)現(xiàn)完善的成熟技術(shù)、用戶反饋良好的方向等。
另外,關(guān)于新產(chǎn)品,需要根據(jù)具體情況部署關(guān)鍵技術(shù)的專利。
1.2 人工智能技術(shù)維度
針對(duì)人工智能技術(shù)所涉及的如圖3所示的多個(gè)分支技術(shù),結(jié)合已經(jīng)確定的產(chǎn)品挖掘方向,實(shí)現(xiàn)在深度、廣度兩個(gè)維度上分別進(jìn)行縱向布局和橫向布局。
人工智能技術(shù)的分支技術(shù)的分類如下圖3所示:
縱向布局的挖掘結(jié)構(gòu),主要是實(shí)現(xiàn)基于每一類分支技術(shù)開展縱向布局,可以圍繞某一類或某一個(gè)分支技術(shù)在延續(xù)、縱向這個(gè)維度上進(jìn)行的改進(jìn)和迭代,形成縱向布局結(jié)構(gòu)。
上述采用延續(xù)、縱向的布局方式,主要基于技術(shù)不斷更新發(fā)展的特性來確定。技術(shù)的不斷發(fā)展,必然產(chǎn)生迭代的技術(shù)改進(jìn)點(diǎn),因此,縱向布局結(jié)構(gòu)主要跟隨技術(shù)的更迭而產(chǎn)生。
橫向布局的挖掘結(jié)構(gòu),主要是實(shí)現(xiàn)基于不同類型技術(shù)的關(guān)聯(lián)因素開展的橫向布局,可以圍繞不同技術(shù)之間的關(guān)聯(lián)關(guān)系,形成橫向布局結(jié)構(gòu)。
采用不同技術(shù)之間的關(guān)系支持的布局方式,主要是因?yàn)楦黝惣夹g(shù)都處于相關(guān)技術(shù)群中,任何一項(xiàng)技術(shù)都不是孤立地發(fā)展。隨著相關(guān)技術(shù)群以及技術(shù)群與技術(shù)群之間的關(guān)聯(lián)日益密切,關(guān)聯(lián)技術(shù)之間的創(chuàng)新點(diǎn)必然不斷產(chǎn)生,因此,橫向結(jié)構(gòu)布局主要是基于相關(guān)技術(shù)之間的關(guān)系因素為支撐點(diǎn)。
1.3 應(yīng)用場(chǎng)景維度
基于本文所討論的專利挖掘方法,將最后一個(gè)挖掘維度——應(yīng)用場(chǎng)景與上述兩個(gè)維度的挖掘方向進(jìn)行結(jié)合,最終實(shí)現(xiàn)多維數(shù)據(jù)立方體在專利挖掘項(xiàng)目中的有效應(yīng)用。
基于本文討論的多類產(chǎn)品和人工智能技術(shù),當(dāng)前涉及到的應(yīng)用場(chǎng)景的類型大致如下圖4所示:
對(duì)于圖4中羅列的應(yīng)用場(chǎng)景,可以結(jié)合1.2中完成的技術(shù)布局結(jié)構(gòu),實(shí)現(xiàn)在網(wǎng)狀結(jié)構(gòu)上進(jìn)行網(wǎng)狀式布局。
技術(shù)總是從已知領(lǐng)域滲透至未知領(lǐng)域,并且隨著產(chǎn)品種類的增長,技術(shù)及技術(shù)之間更迭也是迭代發(fā)展,這也使得技術(shù)在不同領(lǐng)域應(yīng)用時(shí)會(huì)產(chǎn)生意想不到的新用途,從而可以蔓延出覆蓋型的網(wǎng)狀布局結(jié)構(gòu)。這種網(wǎng)狀布局結(jié)構(gòu),可以理解為產(chǎn)品的實(shí)現(xiàn)技術(shù)應(yīng)用在各個(gè)應(yīng)用場(chǎng)景下所形成的枝蔓結(jié)構(gòu)。
由此可知,基于1.1、1.2和1.3,我們可以完成A公司產(chǎn)品中關(guān)于人工智能專利的自主布局和挖掘工作;進(jìn)一步的,在產(chǎn)品后續(xù)的更新迭代過程中,A公司仍舊可以采用上述挖掘方式,作為繼續(xù)專利進(jìn)行申請(qǐng)。
此處需要說明的是,在A企業(yè)部署外圍專利、規(guī)避性專利和標(biāo)準(zhǔn)專利的過程中,同樣可以考慮使用本文涉及到的數(shù)據(jù)管理模型,來開展和規(guī)劃專利挖掘工作。
總結(jié)
專利挖掘的過程是一個(gè)反復(fù)循環(huán)的過程,每一個(gè)挖掘步驟如果沒有達(dá)到預(yù)期目標(biāo),都可以回到前面的步驟,重新調(diào)整并執(zhí)行專利挖掘。本文提供的關(guān)于數(shù)據(jù)倉庫的數(shù)據(jù)管理模型,為整個(gè)挖掘過程提供了一個(gè)可回溯的技術(shù)支持,即這種數(shù)據(jù)管理模型易查詢、易追溯、易替換的優(yōu)點(diǎn)能夠在專利挖掘的過程中,幫助企業(yè)回溯、調(diào)整之前的挖掘步驟,真正做到為企業(yè)的專利挖掘項(xiàng)目提供有效、高效的工具。endprint