文庭孝 李 俊
(中南大學(xué)信息安全與大數(shù)據(jù)研究院 長沙 410083)
專利文獻(xiàn)和專利信息是人類智慧的結(jié)晶,是人類開拓創(chuàng)新的智慧源泉。據(jù)統(tǒng)計(jì),世界上平均每10秒鐘就產(chǎn)生一份專利申請,每20秒鐘就出版一份專利文獻(xiàn),世界各國每年出版的專利文獻(xiàn)總量超過150萬件,占世界每年各種圖書期刊總出版量的1/4,全球?qū)@墨I(xiàn)累積量已超過1億件,電子化、數(shù)字化、網(wǎng)絡(luò)化專利文獻(xiàn)數(shù)量更是難以勝數(shù)。如歐洲專利局的Worldwide數(shù)據(jù)庫收藏了1836年迄今的專利文獻(xiàn)8 000多萬件,數(shù)量還在不斷得快速增長[1]。
專利文獻(xiàn)既是技術(shù)文本,也是法律文本,集技術(shù)信息、法律信息、經(jīng)濟(jì)信息和戰(zhàn)略信息等為一體。專利法律信息是專利信息的重要組成部分,在專利技術(shù)保護(hù)、專利質(zhì)量把握、專利價(jià)值評估、專利技術(shù)成熟度判定、專利侵權(quán)糾紛解決以及專利技術(shù)研發(fā)、專利技術(shù)引進(jìn)、專利產(chǎn)品銷售等方面發(fā)揮著重要的作用。
自1780年美國正式頒布專利法以來,隨著各國專利授權(quán)與保護(hù)制度的逐步建立與完善,專利申請與維權(quán)等實(shí)踐活動日益增多,相關(guān)研究成果也日益豐碩。與此同時,專利法律信息挖掘相關(guān)研究成果也廣泛分布于專利檢索、專利分析、專利地圖、專利文本挖掘、專利數(shù)據(jù)挖掘和專利引文分析等研究中[2]。整體來看,國內(nèi)外有關(guān)專利技術(shù)信息挖掘的相關(guān)研究成果較多,而有關(guān)專利法律信息挖掘的相關(guān)研究成果相對較少。
專利文獻(xiàn)是法律文件,公開專利技術(shù)的權(quán)利歸屬,明確記載專利技術(shù)的保護(hù)范圍及專利權(quán)人的姓名、地址、申請日期等各項(xiàng)法律信息[1],反映專利的有效性、地域性,如專利申請、專利授權(quán)、申請駁回、申請視撤、專利權(quán)恢復(fù)等法律狀態(tài)信息[3],是了解專利權(quán)內(nèi)容、范圍和有效性等法律狀況的有效信息源。
專利文獻(xiàn)中的法律信息是表示專利權(quán)的各種標(biāo)志,這些標(biāo)志包括技術(shù)信息(如發(fā)明名稱、摘要、權(quán)利要求書、說明書全文、附圖、關(guān)鍵詞、專利分類號、范疇分類、檢索范圍、引文等)、時間信息(如申請日、公開日、公告日、優(yōu)先權(quán)日等)、空間信息(地址、郵政編碼、國家代碼、優(yōu)先權(quán)國家、地區(qū)代碼、國省代碼等)、權(quán)利信息(如專利權(quán)人、法律狀態(tài)、權(quán)利要求書、申請?zhí)?、公開號、公告號、專利號、優(yōu)先權(quán)號、申請日、授權(quán)日等)、人員信息(如申請人、發(fā)明人、專利權(quán)人、專利代理人、審查員等)、專利族信息(同族專利數(shù)量、同族專利號、同族專利國家或地區(qū)等)等[1,4],從中可以提煉、挖掘、分析出相關(guān)的專利法律信息。
專利文獻(xiàn)中的專利信息一般分為外部(或外表)信息和內(nèi)部(內(nèi)容)信息兩個維度,專利法律信息包含在專利信息的兩個維度中。外部信息主要包括專利文獻(xiàn)首頁,即扉頁中的著錄信息;內(nèi)部信息主要包括專利文摘、權(quán)利要求項(xiàng)和技術(shù)說明書三個部分中的專利信息[5]。具體來說,表示外部或外表信息的專利文獻(xiàn)特征項(xiàng)主要有文獻(xiàn)號、專利號、文獻(xiàn)類別、國家代碼、申請?zhí)枴⑸暾埲掌?、?yōu)先申請?zhí)?、?yōu)先申請日期、優(yōu)先申請國家、公布或出版日期、展出日期(未審批)、展出日期(未批準(zhǔn))、公開說明書出版日期、審查未批說明書出版日期、批準(zhǔn)專利說明書出版日期、申請人、發(fā)明人、受讓人、律師或代理人等。表示內(nèi)容或內(nèi)部信息的專利文獻(xiàn)特征項(xiàng)主要有國際專利分類號、本國專利分類號、國際十進(jìn)制分類號、發(fā)明名稱、關(guān)鍵詞、文摘、引用文獻(xiàn)、專利權(quán)項(xiàng)、技術(shù)說明書、附圖等[6]。
專利具有時間性、地域性、權(quán)利獨(dú)占性等顯著特點(diǎn),構(gòu)成了專利法律信息的基本內(nèi)容[7]。專利具有公開(或申請)、授權(quán)和失效三種基本法律狀態(tài)[8]。其中公開(或申請)包括專利申請、駁回、撤回、視為撤回以及實(shí)質(zhì)審查、復(fù)審、著錄項(xiàng)變更等專利法律信息,授權(quán)包括專利授權(quán)、專利權(quán)轉(zhuǎn)讓、許可、強(qiáng)制許可、轉(zhuǎn)移、恢復(fù)等專利法律信息,失效包括專利權(quán)的視為放棄(未及時繳納年費(fèi))、撤銷、終止(專利保護(hù)期屆滿)、無效宣告等專利法律信息[9-10]。這些法律信息體現(xiàn)在專利文獻(xiàn)的著錄項(xiàng)目以及專利審查部門在專利審查過程中產(chǎn)生的各種專利文件中,為專利實(shí)施法律保護(hù)提供了可靠的法律依據(jù)。
專利文獻(xiàn)既是技術(shù)文本,也是法律文本,技術(shù)說明書和權(quán)利要求書是核心部分。專利說明書扉頁和權(quán)利要求書是專利法律信息最重要、最有效的信息來源。專利說明書扉頁揭示了專利的基本法律狀態(tài)信息,而權(quán)利要求書清楚、簡要地表述了專利技術(shù)請求保護(hù)的范圍,經(jīng)審查授權(quán)后可以作為判斷是否侵權(quán)的法律依據(jù),也是確定產(chǎn)品生產(chǎn)國,或準(zhǔn)備輸出和引進(jìn)時不致造成侵權(quán)的法律依據(jù)[11]。同時,也可以為專利申請審查、專利糾紛處理、專利技術(shù)引進(jìn)等提供法律依據(jù)[1,4,10]。
基于專利分析的專利法律信息挖掘是指專利法律信息分析,即對專利法律信息進(jìn)行整理、歸納、分析,對相關(guān)專利的法律狀態(tài)有個全面、清晰的了解,有利于根據(jù)專利的法律狀態(tài)規(guī)避法律風(fēng)險(xiǎn),挖掘失效專利、尋找商機(jī),判斷專利技術(shù)的質(zhì)量和價(jià)值[9]。
專利分析涉及專利技術(shù)層面、經(jīng)濟(jì)層面、法律層面(權(quán)利層面)和競爭層面(戰(zhàn)略層面)的分析[12]。法律層面或權(quán)利層面的分析,即專利法律信息分析,主要包括專利法律狀態(tài)分析、專利權(quán)利要求分析、專利侵權(quán)訴訟分析、專利權(quán)利歸屬分析和專利價(jià)值分析等。也有學(xué)者認(rèn)為專利法律信息分析包括專利性分析、專利法律狀態(tài)分析、專利侵權(quán)分析和同族專利分析四個方面[1]。
專利分析也稱專利信息分析、專利情報(bào)分析、專利統(tǒng)計(jì)分析、專利計(jì)量分析,是指對來自專利文獻(xiàn)中大量或個別的專利信息進(jìn)行加工及組合,并利用統(tǒng)計(jì)方法或數(shù)據(jù)處理手段使這些信息具有縱覽全局及預(yù)測的功能,并通過專利分析使它們由普通的專利信息上升為企業(yè)經(jīng)濟(jì)活動中有價(jià)值的專利情報(bào)[12-13]。專利分析主要是從專利文獻(xiàn)中抽取大量的專利信息,利用定性、定量方法和專利圖表挖掘隱藏在專利文獻(xiàn)背后的情報(bào),揭示技術(shù)、對手、市場、研發(fā)、人才、伙伴、法律等專利信息,幫助企業(yè)了解對手、了解市場、指導(dǎo)研發(fā)、找到專利人才、找到合作伙伴、得到公知公用技術(shù)、制定專利戰(zhàn)略、避免專利侵權(quán)、應(yīng)對專利訴訟等[14]。專利分析可將專利信息轉(zhuǎn)化成具有較高技術(shù)與商業(yè)價(jià)值的專利情報(bào)[4]。
專利分析的本質(zhì)是對專利著錄信息、文本內(nèi)容、專利引文、專利數(shù)量等進(jìn)行定向選擇和科學(xué)抽象,分析其相互關(guān)聯(lián),挖掘深藏在其中的客觀事實(shí)真相,并轉(zhuǎn)化為有價(jià)值的專利競爭情報(bào)[11,15]。專利分析涉及管理學(xué)、法學(xué)、經(jīng)濟(jì)學(xué)、自然科學(xué)等多個學(xué)科領(lǐng)域, 屬于交叉研究領(lǐng)域[15]。
專利分析方法根據(jù)性質(zhì)一般分為定性分析、定量分析及定性定量分析(擬定量分析)方法三種[4]。定性分析是指通過對專利的“質(zhì)”、專利文獻(xiàn)的內(nèi)在特征和內(nèi)容進(jìn)行歸納、總結(jié)、分析與綜合等思維加工,達(dá)到認(rèn)識專利本質(zhì)、揭示內(nèi)在規(guī)律的目的,一般用于獲取技術(shù)動向、企業(yè)動向、特定權(quán)利狀況等信息。定量分析利用統(tǒng)計(jì)學(xué)和文獻(xiàn)計(jì)量學(xué)等各種方法和手段,以數(shù)學(xué)模型和圖表為表達(dá)方式,對其中所含的各種情報(bào)要素進(jìn)行統(tǒng)計(jì)排序、對比分析和研究,從不同的角度研究專利文獻(xiàn)中所記錄的技術(shù)、法律和經(jīng)濟(jì)信息,從而揭示專利情報(bào)流的深層動態(tài)特征,了解技術(shù)、經(jīng)濟(jì)發(fā)展的過去及現(xiàn)狀,并據(jù)此進(jìn)行技術(shù)評估和技術(shù)預(yù)測[4,16]。具體的專利分析方法很多,都可以對專利分類號、專利發(fā)明人、專利權(quán)人、專利申請日(授權(quán)公布日)、專利申請國和專利法律狀態(tài)等相關(guān)法律信息進(jìn)行定性和定量分析。
專利法律狀態(tài)信息的類型多樣,一般按專利生存情況分為“有效”和“失效”兩類,其中有效和失效又分為多樣類型。中國發(fā)明專利按審查情況可分為“公開”“實(shí)質(zhì)審查”“有權(quán)”“失效”四類[13]。專利法律狀態(tài)分析的內(nèi)容有特征點(diǎn)分析(分析單個專利對象中的法律狀態(tài)構(gòu)成特征,結(jié)合商業(yè)、技術(shù)、政策,以及其他專利統(tǒng)計(jì)信息等剖析特征點(diǎn)出現(xiàn)的原因)和比較分析(運(yùn)用“自身縱向比較”和“自身比他人”的方法比較不同法律狀態(tài)的構(gòu)成差異,結(jié)合商業(yè)、技術(shù)、政策,以及其他專利統(tǒng)計(jì)信息等剖析差異出現(xiàn)的原因,進(jìn)行合理推測)[13]。
專利法律狀態(tài)分析還可以利用專利指標(biāo)來分析[4],如專利授權(quán)率(專利授權(quán)量與專利申請量之比,用于從整體上測算專利申請的技術(shù)質(zhì)量)、專利存活率(專利存活量與專利申請量之比,用于測算法律狀態(tài)處于有效狀態(tài)的專利占比情況)。
通過對不同對象的專利法律狀態(tài)構(gòu)成進(jìn)行分析,可以衡量競爭對手的技術(shù)研發(fā)實(shí)力和專利技術(shù)含量高低,評估專利威脅;可以衡量技術(shù)領(lǐng)域的專利活躍程度,評估專利風(fēng)險(xiǎn)[17]。張運(yùn)鴻、張善杰以德溫特專利數(shù)據(jù)庫為基礎(chǔ),對我國的微電子機(jī)械系統(tǒng)傳感器專利技術(shù)的專利法律狀態(tài)信息進(jìn)行了分析[18]。王偉基于德溫特專利數(shù)據(jù)對我國光纖預(yù)制棒領(lǐng)域的專利法律狀態(tài)的分布及趨勢進(jìn)行了分析[19]。
專利權(quán)利要求書是確定專利保護(hù)范圍的主要依據(jù),是專利申請文件中最核心的部分之一。專利權(quán)利要求數(shù)通常被用來研究專利的保護(hù)效果,一般認(rèn)為,專利權(quán)利要求數(shù)越多,保護(hù)范圍越大,越容易被替代,保護(hù)效果越低[20-21]。
專利權(quán)利要求包括產(chǎn)品權(quán)利要求和方法權(quán)利要求。權(quán)利要求中記載的所有技術(shù)特征共同限定了該權(quán)利要求的保護(hù)范圍。權(quán)利要求分析從所涉及的技術(shù)內(nèi)容(如創(chuàng)新點(diǎn)、保護(hù)范圍)、結(jié)構(gòu)以及布局模式等方面進(jìn)行,包括權(quán)利要求保護(hù)的主題、權(quán)利要求之間引用關(guān)系等[11]。
根據(jù)需求不同,專利權(quán)利要求分析包括保護(hù)范圍分析、侵權(quán)對比分析、撰寫缺陷分析、穩(wěn)定性分析等[13]。從分析對象來看,權(quán)利要求的保護(hù)范圍分析包括“單件專利的保護(hù)范圍分析”和“多件專利的保護(hù)范圍分析”。多件專利的保護(hù)范圍分析又包括同一專利申請人的多件專利保護(hù)范圍分析和不同專利申請人的多件專利保護(hù)范圍分析。從分析內(nèi)容來看,權(quán)利要求的保護(hù)范圍分析包括“權(quán)利要求書的結(jié)構(gòu)分析”(分析權(quán)利所包含的技術(shù)特征及多項(xiàng)權(quán)利要求之間的關(guān)系,確定整個專利權(quán)利要求書所覆蓋的直接范圍)和“權(quán)利要求書保護(hù)范圍影響因素分析”(分析說明書中的技術(shù)方案如何在權(quán)利要求書中體現(xiàn),以及專利和同族專利在審查過程中的相關(guān)文件是否對權(quán)利要求保護(hù)范圍進(jìn)行限制與縮?。?。權(quán)利要求保護(hù)范圍分析有助于找出權(quán)利和技術(shù)的空白點(diǎn),不但可以了解技術(shù)自由實(shí)施度,設(shè)計(jì)專利侵權(quán)風(fēng)險(xiǎn)的合理規(guī)避方案,而且可以為新技術(shù)專利申請規(guī)劃權(quán)利空間,以保證順利獲得授權(quán)并得到最大的經(jīng)濟(jì)利益。權(quán)利要求書保護(hù)范圍的影響因素分析有助于評估專利的穩(wěn)定性,為后續(xù)可能發(fā)生的無效申請或侵權(quán)訴訟提供參考[13]。
我國《專利法》規(guī)定:未經(jīng)專利權(quán)人許可,實(shí)施其專利,即侵犯其專利權(quán)。專利權(quán)的保護(hù)范圍以專利權(quán)利要求書為界限。專利侵權(quán)判定是專利訴訟、新產(chǎn)品開發(fā)、產(chǎn)品進(jìn)出口貿(mào)易、技術(shù)規(guī)避設(shè)計(jì)等技術(shù)、經(jīng)濟(jì)與法律活動中需要解決的重要問題。當(dāng)事人和其他訴訟參與人在面臨專利訴訟時都需要進(jìn)行專利法律狀態(tài)檢索與分析、專利侵權(quán)檢索與分析[1]。
專利法律信息分析的重點(diǎn)在于專利性分析、專利侵權(quán)和專利訴訟分析等,其共同點(diǎn)在于對專利權(quán)利要求本身的解讀和分析。專利性分析是指通過定性分析,判斷創(chuàng)新技術(shù)與現(xiàn)有技術(shù)相比較是否具備了專利法規(guī)定的新穎性、創(chuàng)造性和實(shí)用性。專利侵權(quán)分析側(cè)重于對已經(jīng)發(fā)生或可能發(fā)生的專利侵權(quán)行為的判定,既包括企業(yè)對他人的侵權(quán),也包括他人對企業(yè)的侵權(quán)。專利侵權(quán)分析也可分為防止侵權(quán)分析和被動侵權(quán)分析[13]??梢詾橐呀?jīng)發(fā)生或可能發(fā)生的企業(yè)的專利侵權(quán)行為做出恰當(dāng)?shù)脑u估,為企業(yè)采取規(guī)避或警告、索賠或賠償、訴訟及結(jié)盟等策略提供建議[10]。專利訴訟分析包括專利侵權(quán)訴訟主體分析、專利侵權(quán)訴訟可能性分析、專利侵權(quán)訴訟戰(zhàn)略分析[13]。
專利侵權(quán)分析和專利訴訟分析可以幫助厘清行業(yè)內(nèi)不同訴訟主體的實(shí)際訴訟模式和應(yīng)訴經(jīng)驗(yàn)、訴訟主體在不同地域面對和進(jìn)行的專利訴訟情況。通過分析企業(yè)已經(jīng)發(fā)生的專利訴訟或者許可談判事項(xiàng),可以透視企業(yè)的專利申請、專利運(yùn)用、專利布局和專利保護(hù)策略及研發(fā)方向、研發(fā)合作和企業(yè)兼并乃至整體專利戰(zhàn)略等信息,幫助企業(yè)對有可能發(fā)生的專利訴訟提前做好準(zhǔn)備,為公司制定科學(xué)合理的應(yīng)對策略提供參考。還可以達(dá)到阻斷競爭對手進(jìn)入目標(biāo)市場、獲得侵權(quán)賠償、消耗對方公司資源、獲取對方情報(bào)、詆毀對方商業(yè)信譽(yù)、獲得專利許可費(fèi)用、影響下游客戶訂單等目的[4,13]。
專利權(quán)(Patent Rights)是指國家專利主管部門依據(jù)專利法授予發(fā)明創(chuàng)造人或?qū)@麢?quán)人在法律規(guī)定的有效期內(nèi),對其發(fā)明所享有的專有權(quán)、壟斷權(quán)、獨(dú)占權(quán),未經(jīng)專利權(quán)人許可,他人不得隨意使用該專利技術(shù)。專利權(quán)是一種專有的、排他的權(quán)利,但受到時間和空間的限制。
在專利權(quán)的獲取、運(yùn)用過程中形成的關(guān)于權(quán)利狀態(tài)信息則構(gòu)成了權(quán)屬信息,包括專利法律狀態(tài)、權(quán)利要求范圍(包括權(quán)利要求內(nèi)容和要求保護(hù)的地域)、專利權(quán)的所有者等。專利權(quán)屬分析有專利法律狀態(tài)確認(rèn)、避免侵權(quán)專利分析、可專利性分析和被訴侵權(quán)專利分析等[22]。
專利價(jià)值包括技術(shù)價(jià)值、經(jīng)濟(jì)價(jià)值和法律價(jià)值三個部分,專利的法律價(jià)值分析是專利價(jià)值評估重要組成部分,一般用專利的穩(wěn)定性、可規(guī)避性、依賴性、專利侵權(quán)可判定性、有效期、多國申請(同族專利數(shù))、專利許可狀態(tài)等作為專利法律價(jià)值的衡量指標(biāo)[23]。也有學(xué)者提出用專利被引次數(shù)、專利族大小、專利壽命、專利異議和專利訴訟等指標(biāo)綜合評價(jià)和分析專利的價(jià)值,其中多個指標(biāo)都與專利的法律價(jià)值密切相關(guān)[24]。根據(jù)專利壽命和專利族大小能更準(zhǔn)確地反映專利的價(jià)值。歐洲、德國的專利法在專利授權(quán)后的一定期限內(nèi)設(shè)置了專利異議,能夠成功抵御異議的專利可以認(rèn)為是有價(jià)值的專利[25]。專利權(quán)要求數(shù)通常也是考察專利價(jià)值的重要指標(biāo)。研究表明,有價(jià)值的專利表現(xiàn)為專利權(quán)要求的數(shù)量多而且技術(shù)覆蓋范圍廣,遭遇侵權(quán)和訴訟的頻率也較高[26]。一般認(rèn)為,價(jià)值高的專利遭遇訴訟的可能性較大,因此,是否遭遇并成功通過專利訴訟是專利價(jià)值的重要反映,遭遇訴訟的可能性與專利權(quán)要求的數(shù)量呈正相關(guān)。此外,專利權(quán)要求的數(shù)量還可以用來表征專利的技術(shù)覆蓋范圍[25]。
基于專利檢索的專利法律信息挖掘主要是指專利法律信息檢索,專利法律信息檢索的類型主要有同族專利檢索、專利法律狀態(tài)檢索、專利性檢索、專利侵權(quán)檢索、專利查新檢索、專利訴訟案例檢索等。專利法律信息檢索在專利權(quán)轉(zhuǎn)移或許可、規(guī)避侵權(quán)風(fēng)險(xiǎn)、發(fā)生侵權(quán)糾紛、判定發(fā)明專利性等方面具有重要的作用[10]。
專利檢索是專利信息挖掘和分析的前提和基礎(chǔ),其中專利法律信息檢索異常重要。專利檢索即專利信息查找,是指在專利信息源中查找所需信息或文獻(xiàn)的過程,具體包括專利性檢索、專題檢索、技術(shù)引進(jìn)專利檢索、研發(fā)立項(xiàng)專利檢索、申請人檢索、發(fā)明人檢索、防止侵權(quán)檢索、被動侵權(quán)檢索(無效專利檢索)、專利有效性檢索、專利地域效力檢索、同族專利檢索(專利號、申請?zhí)?、?yōu)先權(quán))、專利引文檢索、失效專利檢索、專利訴訟案例檢索、專利語義檢索、外觀設(shè)計(jì)檢索等[1]。專利檢索利用專利著錄信息,通過專利文獻(xiàn)標(biāo)引,提供多種檢索途徑和檢索入口,可以揭示專利申請(專利)號、申請日、公開(公告)號、公開(公告)日、專利名稱、專利摘要、主分類號、分類號、申請(專利權(quán))人、發(fā)明(設(shè)計(jì))人、主權(quán)項(xiàng)、地址、專利代理機(jī)構(gòu)、專利代理人、優(yōu)先權(quán)、國省代碼等專利信息,達(dá)到專利信息挖掘的目的[1]。因此,專利檢索是對已經(jīng)加工存儲的專利法律信息進(jìn)行挖掘和分析,一般可通過專利檢索系統(tǒng)、專利檢索平臺或?qū)@麛?shù)據(jù)庫來實(shí)現(xiàn)。各國專利局網(wǎng)站、商業(yè)數(shù)據(jù)庫和專利搜索引擎等中都有多個字段與專利法律信息密切相關(guān),包括專利權(quán)人、專利號、專利發(fā)明人、專利申請年、專利優(yōu)先年等。如基于網(wǎng)絡(luò)的 Innography 系統(tǒng)具有豐富的數(shù)據(jù)模塊和多樣的檢索分析功能,可以查詢和獲取 70 多個國家的同族專利、法律狀態(tài)和專利全文并進(jìn)行深度分析。其中專利相似指標(biāo)可幫助用戶快速查找相似專利,并應(yīng)用到專利的無效分析、侵權(quán)分析等領(lǐng)域[27]。因此,有學(xué)者認(rèn)為,可以通過檢索過期專利信息和專利法律狀態(tài)信息及利用失效專利數(shù)據(jù)庫挖掘免費(fèi)專利資源[28]。
同族專利信息是重要的專利法律信息。專利文獻(xiàn)在產(chǎn)生過程中會大量重復(fù)出現(xiàn),形成了一組組由不同國家出版的、內(nèi)容相同或基本相同的、具有共同優(yōu)先權(quán)的專利文獻(xiàn)。由至少一個優(yōu)先權(quán)聯(lián)系的一組專利文獻(xiàn),稱一個專利族,同一專利族中每件專利文獻(xiàn)被稱為專利族成員。同族專利檢索是指以某一專利或?qū)@暾垶榫€索,查找與其同屬于一個專利族的所有成員的過程。同族專利檢索可以通過同族專利檢索線索,即同族專利檢索要素來實(shí)現(xiàn),同族專利檢索要素有號碼、公司 /人名和主題詞三類[1,7,10]。
專利法律狀態(tài)是指在某一特定時間,某項(xiàng)專利申請或授權(quán)專利在某一國家的權(quán)利維持、權(quán)利范圍、權(quán)利類型、權(quán)利歸屬等狀態(tài),這些狀態(tài)直接影響到專利權(quán)的存在與否以及專利權(quán)利范圍的大小。此外,專利法律狀態(tài)還包括專利權(quán)歸屬、專利權(quán)是否有效、獲得許可證等專利產(chǎn)生、發(fā)展和變化過程中出現(xiàn)的其他法律信息[7]。
在專利產(chǎn)生、發(fā)展和變化過程中出現(xiàn)常見的專利法律狀態(tài)類型有:專利申請尚未授權(quán)、專利申請撤回、專利申請被駁回、專利權(quán)有效、專利權(quán)終止、專利權(quán)轉(zhuǎn)移、專利權(quán)有效期屆滿、專利權(quán)無效、專利權(quán)質(zhì)押、專利許可、專利權(quán)視為放棄等。一般可通過各國的專利法律狀態(tài)檢索系統(tǒng)來實(shí)現(xiàn)[1,7]。
專利法律狀態(tài)檢索是指對一項(xiàng)專利或?qū)@暾埉?dāng)前所處的法律狀態(tài)進(jìn)行的檢索,其目的是了解專利申請是否授權(quán),授權(quán)專利是否有效,專利權(quán)人是否變更,以及與專利法律狀態(tài)相關(guān)的信息[1,7,10]。專利法律狀態(tài)檢索包括專利有效性檢索、專利地域性檢索和專利變更信息檢索[9]。專利有效性檢索是指對一項(xiàng)專利或?qū)@暾埉?dāng)前所處的法律狀態(tài)進(jìn)行的檢索,目的是了解該項(xiàng)專利申請是否被授權(quán),授權(quán)專利是否有效(如時間上是否處于有效期)。專利地域性檢索是指對一項(xiàng)發(fā)明創(chuàng)造都在哪些國家和地區(qū)申請了專利所進(jìn)行的檢索,目的是確定該項(xiàng)專利申請的地域范圍(如同族專利檢索)。可檢索的其他專利法律狀態(tài)信息還有:專利或?qū)@暾埖闹浭马?xiàng)、變更信息、專利申請、審查或復(fù)審過程中的信息、授權(quán)后的專利權(quán)轉(zhuǎn)移、許可、異議等法律活動信息。
專利侵權(quán)檢索分為主動侵權(quán)檢索和被動侵權(quán)檢索。主動侵權(quán)檢索又稱防止侵權(quán)檢索,是指為了避免發(fā)生專利糾紛而主動針對某一產(chǎn)品或方法進(jìn)行專利檢索,找出其可能侵權(quán)的專利或?qū)@暾埐⑶以u估侵權(quán)風(fēng)險(xiǎn),也稱為“自由實(shí)施(Freedom To Operate, FTO)專利檢索”。被動侵權(quán)檢索是指被別人指控侵權(quán)時進(jìn)行的檢索,判斷專利侵權(quán)指控是否成立,找出對受到侵害的專利提出無效訴訟的依據(jù)。專利侵權(quán)檢索主要應(yīng)用于產(chǎn)品制造、產(chǎn)品上市、專利訴訟、防范他人侵權(quán)等方面[1]。專利侵權(quán)檢索也稱為專利侵權(quán)判定及對比文獻(xiàn)檢索,其目的是為了規(guī)避專利侵權(quán)及用于被控侵權(quán)抗辯[29]。我國學(xué)者翟東升構(gòu)建中文專利侵權(quán)檢索模型,并設(shè)計(jì)了中文專利侵權(quán)檢索系統(tǒng),用于自動判斷中文專利權(quán)利要求書中的專利侵權(quán)行為[30]。
在專利法律信息檢索中,專利查新檢索也稱專利性檢索和新穎性檢索,是指找出與發(fā)明創(chuàng)造技術(shù)主題相關(guān)的現(xiàn)有技術(shù)中的對比文獻(xiàn),或者找出抵觸申請文獻(xiàn)和防止重復(fù)授權(quán)的文獻(xiàn),并與發(fā)明創(chuàng)造技術(shù)主題進(jìn)行對比,判斷發(fā)明創(chuàng)造是否具有新穎性和創(chuàng)造性(可專利性)的檢索過程[1]。用戶在解決評估發(fā)明創(chuàng)造能否授權(quán)、確認(rèn)授權(quán)專利的穩(wěn)定性、幫助修改申請文件等問題時,以及在專利申請、專利審查和專利訴訟等過程中都需要進(jìn)行專利查新檢索。
失效專利是一種失去專利獨(dú)占權(quán)的公開技術(shù)信息。失效專利是龐大的、免費(fèi)的專利信息資源。部分失效專利失效后仍是該領(lǐng)域的重要技術(shù),仍然可以創(chuàng)造巨大的經(jīng)濟(jì)價(jià)值[1]?!笆А笔侵阜缮系暮x,針對的是專利權(quán)及專利申請權(quán),即失去了法律保護(hù)的專利。對專利所包含的法律性、技術(shù)性、市場性而言,失效專利只是不再受專利法保護(hù)。
失效專利有狹義和廣義之分,狹義的失效專利泛指因法律規(guī)定的各種原因而失去專利權(quán)、不再受到專利法律保護(hù)的專利,即失去專利權(quán)的專利。廣義的失效專利是指專利文獻(xiàn)公開的技術(shù)不享有本國的專利權(quán)的專利,既包括失去專利權(quán)的專利,也包括失去專利申請權(quán)的專利,即專利文獻(xiàn)公開的技術(shù)屬于不享有或不再享有專利權(quán)的發(fā)明創(chuàng)造。也有人認(rèn)為,因?qū)@麢?quán)的地域性失去法律保護(hù)的專利也屬于失效專利。因此,最廣義的失效專利是指“公開且不受保護(hù)”或“公開且失去權(quán)利”的專利[1,31]。
專利失效的原因有四種:申請階段失效(包括申請撤回或放棄、申請被視為撤回、申請被駁回等)、授權(quán)階段失效(包括專利權(quán)人未按規(guī)定繳納專利維持費(fèi)、專利權(quán)人以書面申請放棄專利權(quán),專利權(quán)的無效及撤銷等)、時效性失效(專利保護(hù)期屆滿)和地域性失效(未在法定期限內(nèi)就相同主題的發(fā)明創(chuàng)造在某國或某地區(qū)提出專利申請,無法受到該國家或地區(qū)法律保護(hù))[1]。也有學(xué)者認(rèn)為專利失效有五大成因:保護(hù)屆滿、喪失專利權(quán)(未按規(guī)定繳納專利維持費(fèi)、放棄專利權(quán)、專利撤銷及宣告無效、專利權(quán)終止)、專利申請未獲授權(quán)(專利申請被駁回、撤回、視為撤回、放棄)、未在中國申請的國外專利(喪失在華專利權(quán))、未向知識產(chǎn)權(quán)局提出專利申請的發(fā)明創(chuàng)造[31]。
失效專利檢索也稱為專利無效檢索。專利無效檢索是通過檢索專利文獻(xiàn)、非專利文獻(xiàn)發(fā)現(xiàn)破壞該授權(quán)專利新穎性、創(chuàng)造性的過程,目的是找出與某一專利權(quán)要求相關(guān)的專利,通過這些專利使該權(quán)利要求無效,甚至使整個專利無效[22]。當(dāng)專利審查員為判斷某一項(xiàng)申請的專利是否可以取得專利權(quán)時,需要調(diào)查過去是否有類似的專利已經(jīng)被授權(quán),這種搜索也被稱為專利無效性檢索[31]。失效專利可以通過專利(申請)號檢索、專利法律狀態(tài)檢索、時域檢索、地域檢索和申請人檢索等方式在各類專利數(shù)據(jù)庫和各國專利局網(wǎng)站進(jìn)行檢索[1]。
專利訴訟案例是指各國與專利相關(guān)的司法判決和行政決定,如各國法院的專利侵權(quán)訴訟判決,我國復(fù)審委員會的專利無效宣告和專利復(fù)審。無論是大陸法系還是普通法系國家,都有大量的專利訴訟案例,可以為專利訴訟代理律師迅速鎖定商業(yè)高風(fēng)險(xiǎn)的潛在客戶,為盡職調(diào)查提供充分的數(shù)據(jù)和資料,對所代理案件有影響的相關(guān)各方進(jìn)行分析和評估,并更有效地提出主張和辯護(hù);為專利法官處理同類案件和提高自身專業(yè)素養(yǎng)提供極佳的研究素材和資料;為專利代理人、專利教學(xué)研究人員和學(xué)生學(xué)習(xí)與研究專利實(shí)務(wù)提供良好的實(shí)務(wù)素材[1]。專利訴訟案例可以通過各國法院網(wǎng)站、商業(yè)專利數(shù)據(jù)庫中的專利訴訟信息、綜合類法律數(shù)據(jù)庫和主要國家復(fù)審委員會判例數(shù)據(jù)庫等進(jìn)行檢索[1,10,22]。
進(jìn)入21世紀(jì),隨著專利數(shù)據(jù)的不斷增長,越來越多的研究開始轉(zhuǎn)向如何快速并且準(zhǔn)確地檢索出所需要的專利[32]。2002年,日本國立情報(bào)學(xué)研究所在第三屆NTCIR會議開始舉辦了針對日語和英文跨語言專利檢索研討會,該會議對專利無效性檢索、專利跨語言檢索等研究方向起到很大的促進(jìn)作用[33]。
專利地圖(Patent Map,PM)是20世紀(jì)60年代為打破歐美等國技術(shù)壁壘、保護(hù)日本企業(yè)利益,日本特許廳(Japan Patent Office,JPO)首先研發(fā)的專利信息分析工具[34]。專利地圖是對專利情報(bào)分析結(jié)果的一種可視化表達(dá)[4]。世界知識產(chǎn)權(quán)組織(WIPO)指出,專利地圖也稱為技術(shù)路線圖(Technology Road Map),是對專利分析全部結(jié)果的可視化表達(dá),通過對目標(biāo)技術(shù)領(lǐng)域相關(guān)專利信息進(jìn)行搜集、處理和分析,使復(fù)雜多樣的專利情報(bào)得到方便有效的理解[35]。有學(xué)者認(rèn)為,專利地圖是專利信息圖形化處理、系統(tǒng)管理專利數(shù)據(jù)、協(xié)助制定專利戰(zhàn)略的方法,具體是指將專利情報(bào)的技術(shù)內(nèi)容,用關(guān)鍵詞等數(shù)據(jù)化處理后進(jìn)行加工分析,或者將各種專利著錄項(xiàng)用數(shù)據(jù)形式分類、整理,將其結(jié)果以圖表形式一目了然地加以表現(xiàn)[36-37]。也有學(xué)者認(rèn)為,專利地圖是指對大量的專利文獻(xiàn)進(jìn)行分析整理,特別是針對專利信息中的著錄特征項(xiàng)(專利申請?zhí)?、授?quán)號、專利名稱、發(fā)明人、國家、地區(qū)、時間、專利類型、IPC分類號等)和專利專有的權(quán)利信息進(jìn)行統(tǒng)計(jì)分析,將結(jié)果組合繪圖,繪制出符合要求的、一目了然的圖表,通過圖表輔助專利戰(zhàn)略的理論和方法[38-40]。專利地圖基于聚類(Clustering)、整合(Aggregation)等方式進(jìn)行數(shù)據(jù)化處理,將專利文獻(xiàn)在管理、技術(shù)、法律、經(jīng)濟(jì)中的價(jià)值提取出來。因此,專利地圖制作涉及文本挖掘(Text datamining)、數(shù)據(jù)挖掘(Data mining)、引文分析(Citation analysis)等技術(shù)[6]。
專利地圖一般分為專利技術(shù)地圖、專利管理地圖和專利權(quán)利地圖三種,將三種不同類型的專利地圖結(jié)合起來,可對專利文獻(xiàn)經(jīng)濟(jì)、技術(shù)、法律信息進(jìn)行全面挖掘[4]。其中專利權(quán)利地圖(Patent Claim Map)又稱為專利范圍地圖,是將專利權(quán)利要求作為主要分析對象,制作已有技術(shù)專利的權(quán)利范圍地圖,揭示權(quán)利要求內(nèi)容、范圍、權(quán)利轉(zhuǎn)讓、侵權(quán)可能性、權(quán)利狀態(tài)等法律信息。專利權(quán)利地圖有專利法律狀態(tài)解析圖(明確專利權(quán)人、專利有效性)、專利范圍構(gòu)成要件圖和專利范圍要點(diǎn)圖、同族專利圖、專利引用族譜圖等[41-42]。專利權(quán)利地圖可以起到確認(rèn)專利技術(shù)保護(hù)范圍、考察專利獲取的可能性、了解專利保護(hù)地域范圍、確定專利權(quán)期限、了解侵權(quán)可能、調(diào)研和檢索異議無效專利文獻(xiàn)等作用,從而幫助用戶識別可能的技術(shù)侵權(quán)、制定避免侵權(quán)策略、準(zhǔn)確應(yīng)對法律訴訟等[39-42]。
專利地圖的本質(zhì)是對專利信息進(jìn)行可視化(圖表)揭示和展示。專利地圖可以有效地揭示市場、競合、技術(shù)、研發(fā)、投資、法律、政策和戰(zhàn)略等綜合專利信息,可以幫助企業(yè)制定專利戰(zhàn)略,了解國內(nèi)外技術(shù)動態(tài)、發(fā)現(xiàn)和開發(fā)空白技術(shù)、了解專利技術(shù)發(fā)展趨勢、研究核心技術(shù)和關(guān)鍵技術(shù)點(diǎn)、掌握競爭公司和發(fā)明人、避免專利侵權(quán)和專利訴訟等[43]。專利地圖的類型不同,在專利信息挖掘中的作用也會不同,將不同類型的專利地圖有機(jī)結(jié)合起來,可對專利文獻(xiàn)中蘊(yùn)含的技術(shù)、經(jīng)濟(jì)、法律和戰(zhàn)略等專利信息進(jìn)行深度、全面地挖掘和剖析。其中,專利權(quán)利地圖就是對專利法律信息進(jìn)行可視化(圖表)挖掘、揭示和展示。Hyunseok Park等利用SAO技術(shù)對公司的專利侵權(quán)現(xiàn)象進(jìn)行了分析,并制作了相似專利地圖[44]。
專利挖掘,也稱為專利內(nèi)容挖掘、專利信息挖掘、專利文本挖掘、專利數(shù)據(jù)挖掘等,是指在創(chuàng)意設(shè)計(jì)、技術(shù)研發(fā)、產(chǎn)品開發(fā)、技術(shù)貿(mào)易、專利訴訟等活動中,對所取得的專利技術(shù)成果從技術(shù)、法律、經(jīng)濟(jì)和戰(zhàn)略層面進(jìn)行剖析、整理、拆分和篩選,從而發(fā)現(xiàn)和獲得有價(jià)值的專利信息的過程,其核心是專利技術(shù)信息、法律信息、經(jīng)濟(jì)信息和戰(zhàn)略信息挖掘[7,11,13]。專利挖掘的對象主要是專利文本和專利內(nèi)容,專利挖掘一般分為專利文本挖掘(也稱專利內(nèi)容挖掘)和專利數(shù)據(jù)挖掘(也稱專利信息挖掘)兩類。包括專利名稱、摘要、權(quán)利要求書、專利說明書等內(nèi)容所蘊(yùn)涵的專利信息[45]。
專利挖掘有助于從主題和內(nèi)容角度對專利文獻(xiàn)、數(shù)據(jù)庫和互聯(lián)網(wǎng)中包含的技術(shù)特征(術(shù)語、關(guān)鍵詞等)和法律信息(權(quán)利要求等)及其組合形成的衍生經(jīng)濟(jì)信息(專利價(jià)值、同族專利等)和戰(zhàn)略信息(專利布局、技術(shù)趨勢等)等進(jìn)行深層次分析,以測度專利文獻(xiàn)間的相似性,發(fā)現(xiàn)技術(shù)特征關(guān)聯(lián)、演變和規(guī)律等,從而有助于企業(yè)從宏觀層面把握技術(shù)發(fā)展趨勢,從微觀角度把握技術(shù)創(chuàng)新細(xì)節(jié),輔助企業(yè)技術(shù)創(chuàng)新決策[11]。因此,專利挖掘可以起到梳理技術(shù)創(chuàng)新成果、提升專利申請質(zhì)量、提前規(guī)避專利風(fēng)險(xiǎn)、發(fā)掘未來競爭優(yōu)勢等作用。在專利法律信息挖掘中,專利挖掘可用于專利侵權(quán)規(guī)避、反侵權(quán)識別和專利訴訟應(yīng)對等方面。
文本挖掘是一個新興的研究領(lǐng)域,1995 年, Feldman等人將數(shù)據(jù)挖掘技術(shù)運(yùn)用于非結(jié)構(gòu)化數(shù)據(jù)——文本上,首次提出了文本挖掘的概念[46]。
文本挖掘,也稱為文本數(shù)據(jù)挖掘或文本知識發(fā)現(xiàn),是指為了發(fā)現(xiàn)知識,從大規(guī)模文本庫中抽取隱含的、以前未知的、潛在有用的模式的過程[47]。目前文本挖掘研究主要圍繞文本挖掘模型、文本特征抽取與文本表示模型、模式發(fā)現(xiàn)(如關(guān)聯(lián)規(guī)則抽取、文本分類、文本聚類)等方面展開[48],并且文本挖掘技術(shù)已被應(yīng)用于專利分析方面[30,49-50]。
專利文本挖掘是指使用文本挖掘的方法對專利文獻(xiàn)中富含文本內(nèi)容的題名、摘要和權(quán)利要求等字段進(jìn)行研究,得到在專利術(shù)語、分類和聚類等方面的研究結(jié)果[51]。專利文獻(xiàn)中包含著專利申請?zhí)?、申請人、申請日、發(fā)明人、分類號等結(jié)構(gòu)化信息和專利摘要、技術(shù)背景及權(quán)力要求等非結(jié)構(gòu)化文本信息,蘊(yùn)涵了重要技術(shù)細(xì)節(jié)和技術(shù)保護(hù)等內(nèi)容,人工閱讀和分析這些文本信息十分耗時費(fèi)力。如何從這些非結(jié)構(gòu)化文本中抽取潛在信息、揭示技術(shù)的細(xì)節(jié)及其相互關(guān)聯(lián)關(guān)系、挖掘暗含的商業(yè)趨勢、啟發(fā)工業(yè)技術(shù)創(chuàng)新、輔助決策制定等,成為當(dāng)前專利挖掘與分析領(lǐng)域的研究熱點(diǎn)[52]。文本挖掘技術(shù)可以批量處理大量文本數(shù)據(jù),從中提取有用的信息,從而發(fā)現(xiàn)潛在的知識或模式,文本挖掘技術(shù)成為專利挖掘的重要應(yīng)用領(lǐng)域[53]。專利法律信息也自然成為文本挖掘的重要對象和內(nèi)容。
數(shù)據(jù)挖掘是采用數(shù)學(xué)、統(tǒng)計(jì)、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域的科學(xué)方法,從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取或發(fā)現(xiàn)隱含的、預(yù)先未知的并且具有潛在應(yīng)用價(jià)值的模式和知識,并應(yīng)用于預(yù)測以指導(dǎo)決策的過程[30,47]。自20世紀(jì)80年代以來,為了解決“數(shù)據(jù)豐富,知識貧乏”的困境,數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)和數(shù)據(jù)挖掘技術(shù)獲得了巨大成功并得到持續(xù)發(fā)展[47]。數(shù)據(jù)挖掘技術(shù)的發(fā)展為專利分析提供了有力的技術(shù)支持,目前數(shù)據(jù)挖掘技術(shù)已被廣泛用于專利分析領(lǐng)域,包括專利文獻(xiàn)評估、專利文獻(xiàn)自動分類、專利文獻(xiàn)推薦、專利技術(shù)預(yù)測和專利技術(shù)可視化等[54]。
21 世紀(jì)初,美國學(xué)者 Porter 等基于歷史科技文獻(xiàn)分析開辟了技術(shù)挖掘(Tech Mining)這一領(lǐng)域,挖掘?qū)ο蟀▽W(xué)術(shù)論文和專利文獻(xiàn)等;挖掘內(nèi)容不僅包括題名、作者、專利權(quán)人、專利發(fā)明人等外部著錄信息,還包括文摘、全文、專利權(quán)利要求等內(nèi)容信息;挖掘方法包括統(tǒng)計(jì)分析、知識抽取、文本挖掘、語義分析、聚類和關(guān)聯(lián)分析、數(shù)據(jù)可視化等[5,55-56]。Yang、Lucy Akers等人開發(fā)了一種新的數(shù)據(jù)挖掘工具用于挖掘?qū)@畔⒅须[藏的知識[57]。
專利數(shù)據(jù)挖掘使用數(shù)據(jù)挖掘方法直接處理專利元數(shù)據(jù),得到專利共引或共類統(tǒng)計(jì)、時間序列和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)等方面的研究結(jié)果[51]。應(yīng)用數(shù)據(jù)挖掘技術(shù)開展專利信息挖掘的目的是搜集、分析特定技術(shù)或產(chǎn)品的專利情報(bào),掌握該專利領(lǐng)域中不同公司的專利技術(shù)研究情況,并把單一的情報(bào)綜合起來,然后采取統(tǒng)計(jì)分析、技術(shù)群組、文本挖掘、組合理論、專利地圖等技術(shù),對其進(jìn)行情報(bào)分析,并以統(tǒng)計(jì)圖譜、關(guān)聯(lián)圖譜和報(bào)告等形式展現(xiàn)出來[52]。
專利數(shù)據(jù)因其與科技、法律、經(jīng)濟(jì)高度關(guān)聯(lián),被人們譽(yù)為“技術(shù)一體化信息”。隨著大數(shù)據(jù)時代的到來,專利數(shù)據(jù)挖掘與分析工作將從“盲人摸象”式的“揀著測、挑著存、采著樣處理”,逐步向“皰丁解?!笔降摹叭珮颖尽⒍嗑S度、動態(tài)實(shí)時化處理”方向發(fā)展。不僅各項(xiàng)專利著錄信息(專利權(quán)人、發(fā)明人、分類號、申請日等)成為重點(diǎn)挖掘與分析對象,相關(guān)的工業(yè)、企業(yè)、商業(yè)、法律及政策信息也會被廣泛挖掘和分析[58]。如Kim 等研究了專利侵權(quán)起訴網(wǎng)絡(luò),用于挖掘分析不同企業(yè)的角色[59]。翟東升構(gòu)建了基于本體的專利知識庫、面向主題的專利分析系統(tǒng)和中文專利侵權(quán)檢索模型,用于專利信息深度挖掘和應(yīng)用[30]。鄭貴忠、劉金蘭使用生命表法對專利的有效性和平均剩余有效期限等法律信息進(jìn)行了挖掘和分析[60]。
專利法律信息挖掘與分析通常需要借助專門的專利數(shù)據(jù)庫和專利挖掘工作來實(shí)現(xiàn)。如德溫特專利數(shù)據(jù)庫除能夠進(jìn)行專利法律狀態(tài)信息檢索外,其自帶的專利數(shù)據(jù)處理與分析軟件TDA能夠處理和挖掘分析基本專利國、基本專利號、基本專利年、引文專利、德溫特入藏號、德溫特分類、家族專利國、家族專利號、家族專利年、國際分類號、發(fā)明人、德溫特手工代碼、專利權(quán)人、專利優(yōu)先權(quán)國家、優(yōu)先號、優(yōu)先年、技術(shù)焦點(diǎn)、專利標(biāo)題、美國專利號、美國專利年以及文摘等專利法律信息[61]。
1949 年,Seidel最早提出了專利引文分析的概念,認(rèn)為“專利引文”是后繼專利基于相似的科學(xué)觀點(diǎn)而對先前專利的引證,同時他還提出了高頻被引專利的技術(shù)相對重要性[62]。
專利引文包括申請人給出的引文(專利文獻(xiàn)和科學(xué)論文)和審查員寫進(jìn)去的對比引文(專利文獻(xiàn)和科學(xué)文獻(xiàn))。專利文獻(xiàn)中的專利引文具有提供索賠證據(jù)的作用和目的[63-64]。審查員引文(專利審查對比文獻(xiàn))是審查員經(jīng)過相關(guān)性程度比較并標(biāo)識了相應(yīng)字母的對比文件,對于專利訴訟證據(jù)的獲取意義重大[65]。
專利引文分析是利用各種數(shù)學(xué)及統(tǒng)計(jì)學(xué)的方法和比較、歸納、抽象、概括等邏輯方法,對專利文獻(xiàn)中的引用與被引用現(xiàn)象進(jìn)行分析,以便揭示其數(shù)量特征和內(nèi)在規(guī)律的專利計(jì)量分析方法[36,66]。
隨著專利引文數(shù)據(jù)日趨規(guī)范和透明,引文數(shù)據(jù)開發(fā)技術(shù)亦日益成熟。1964年,美國的《科學(xué)引文索引》(SCI)首次編制了專利引文索引(Patent Citation Index),但只收錄了科技文獻(xiàn)中引用的專利文獻(xiàn)。20世紀(jì)80年代,美國的CHI Research公司把科學(xué)引文分析技術(shù)擴(kuò)展到專利引用分析,用于分析企業(yè)競爭方向、技術(shù)跟蹤和其他產(chǎn)業(yè)技術(shù)分析。美國的 MICROPATENT 公司開發(fā)了美國專利文摘數(shù)據(jù)庫(CAPS),收集1975 年以來的美國專利中的所有引文信息,并在檢索界面中設(shè)立了引文檢索入口。美國的MOGEE 研究與分析協(xié)會開發(fā)了專利引文分析數(shù)據(jù)庫(PCAD),包括1975 年至今的美國專利及其引文。歐洲專利局(EPO)開發(fā)的 EPOQUE 系統(tǒng)也包含了專利引文數(shù)據(jù)庫 REFI。在專利引文分析中最著名的是英國德溫特公司于 1995 年建立的專利引文索引(Patent Citation Index)數(shù)據(jù)庫。1998 年,德溫特公司與美國科技信息研究所(ISI)合并,成立了Thomson Science and Technology(TST),共同開發(fā)德溫特創(chuàng)新索引數(shù)據(jù)庫(Derwent Innovation Index,DII)[36,67-68]。
許多專利檢索和分析系統(tǒng)具有專利引文分析功能,可以進(jìn)行專利法律信息挖掘與分析。如Innography專利檢索、挖掘與分析系統(tǒng)有專門通過前3代引文跟蹤專利無效證據(jù)和后3代引文跟蹤獲取專利侵權(quán)的專利無效檢索及侵權(quán)檢索,專利訴訟證據(jù)獲取顯得更為簡單便捷;WIPS和PATENTICS兩大專利檢索平臺的分析系統(tǒng)都有專利引文檢索模塊,為獲取專利訴訟證據(jù)提供支持。大數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù)的發(fā)展為專利引文潛在價(jià)值的充分挖掘提供了可能性,借助先進(jìn)技術(shù)可以挖掘的價(jià)值主要體現(xiàn)在3個方面[65]:一是專利訴訟中的證據(jù)價(jià)值;二是知識交流和專利影響力的測量工具價(jià)值;三是企業(yè)潛在競爭(合作)關(guān)系挖掘中的情報(bào)價(jià)值。
專利引用網(wǎng)絡(luò)分析是專利引文分析的重要方向,通過對專利權(quán)人的引用網(wǎng)絡(luò)進(jìn)行分析,可以檢測核心專利權(quán)人、發(fā)現(xiàn)潛在競爭對手等。Sternitzke等研究發(fā)現(xiàn),LED 領(lǐng)域?qū)@麢?quán)人引用網(wǎng)絡(luò)分析可以用于解釋專利權(quán)人的市場行為,如合作和專利侵權(quán)訴訟等[69]。Hsueh 等指出,基于網(wǎng)絡(luò)分析的引用分析是專利引文分析的一種替代方法[70]。基于專利文獻(xiàn)的引用關(guān)系,可以延伸出對專利權(quán)人和發(fā)明人之間的引用關(guān)系,可用于鑒別關(guān)鍵發(fā)明人或?qū)@麢?quán)人、發(fā)掘競爭對手[71]。
(來稿時間:2017年9月)
參考文獻(xiàn):
1.肖滬衛(wèi).專利戰(zhàn)術(shù)情報(bào)方法與應(yīng)用[M].上海:上??茖W(xué)技術(shù)文獻(xiàn)出版社,2015:19,21,111,113,204,514.
2.魏曉峰.基于文獻(xiàn)計(jì)量的國際專利情報(bào)研究進(jìn)展分析[J].情報(bào)科學(xué),2013(5):155-160.
3.孟俊娥.專利檢索策略及應(yīng)用[M].北京:知識產(chǎn)權(quán)出版社,2010:4-6.
4.肖滬衛(wèi).專利地圖方法與應(yīng)用[M].上海:上海交通大學(xué)出版社,2011:5,8,14,17,44,75.
5.趙蘊(yùn)華,桂婕,張運(yùn)良,等.基于深度標(biāo)引的專利文本挖掘框架研究[J].數(shù)字圖書館論壇,2008(11):1-5.
6.王曰芬,岑詠華,王雪芬.可視化技術(shù)在專利信息挖掘與分析中的應(yīng)用研究[J].數(shù)字圖書館論壇,2007(2):33-39.
7.楊鐵軍.專利信息利用技能[M].北京:知識產(chǎn)權(quán)出版社,2011:287-333.
8.霍中詳.公知公用技術(shù)信息的挖掘[M].北京:知識產(chǎn)權(quán)出版社,2014:6.
9.牟萍.專利情報(bào)檢索與分析[M].北京:知識產(chǎn)權(quán)出版社,2012:158-159.
10.李建蓉.專利信息與利用[M].北京:知識產(chǎn)權(quán)出版社,2006:9,335,364.
11.董新蕊,朱振宇.專利分析運(yùn)用實(shí)務(wù)[M].北京:國防工業(yè)出版社,2016:109-113.
12.文庭孝.專利信息計(jì)量學(xué)[M].北京:科學(xué)出版社,2016:103-105.
13.馬天旗.專利分析方法、圖表解讀與情報(bào)挖掘[M].北京:知識產(chǎn)權(quán)出版社,2015:35-36.
14.蔡爽,黃魯成.面向技術(shù)戰(zhàn)略的專利分析方法述評[J].技術(shù)經(jīng)濟(jì),2008(6):36-40.
15.欒春娟,羅海山,金保德.國際專利研究的核心期刊與主要學(xué)科分布[J].情報(bào)科學(xué),2010(11):1689-1692.
16.暴海龍,朱東華.專利情報(bào)分析方法綜述[J].北京理工大學(xué)學(xué)報(bào)(社會科學(xué)版),2002(S1):91-93.
17.馬芳,王效岳.基于數(shù)據(jù)挖掘技術(shù)的專利信息分析[J].情報(bào)科學(xué),2008(11):1672-1675.
18.張運(yùn)鴻,張善杰.物聯(lián)網(wǎng)核心技術(shù)專利態(tài)勢分析:以MEMS技術(shù)為例[J]. 物流科技, 2012(5):1-4.
19.王偉.基于專利信息的中國光纖預(yù)制棒技術(shù)競爭態(tài)勢分析[J].科技管理研究,2012(10):33-36.
20. Watanabe C, et al. Patent statistics: deciphering a ‘real’versus a ‘pseudo’ proxy of innovation[J]. Technovation, 2001(21):783-790.
21.姜全紅,張志輝.專利資源量化分析研究綜述[J].情報(bào)學(xué)報(bào),2007(1):134-140.
22.甘紹寧.專利信息分析管理與應(yīng)用[M].北京:知識產(chǎn)權(quán)出版社,2015:77,205.
23.國家知識產(chǎn)權(quán)局,知識產(chǎn)權(quán)交易所.專利價(jià)值評估操作手冊[M].北京:知識產(chǎn)權(quán)出版社,2012.
24.李清海,劉洋,吳泗宗,等.專利價(jià)值評價(jià)指標(biāo)概述及層次分析[J].科學(xué)學(xué)研究,2007(2):281-286.
25. Lan jouw J, Shankerman M. Stylized Facts of Patent Litigation: Value, Scope and Ownership[R].NBER Working Paper No. 6297, 1997.
26. Lerner J. The importance of patent scope: an empirical analysis[J]. Rand Journal of Economics, 1994, 25(2):319- 333.
27.王旭,劉姝,李曉東.快速挖掘核心專利 -Innography專利分析數(shù)據(jù)庫的功能分析[J].現(xiàn)代情報(bào),2013(9):106-111.
28.徐璐,林楠,鄭洪洋.如何挖掘?qū)@畔⒅械拿赓M(fèi)資源[J].遼寧經(jīng)濟(jì),2010(12):85.
29.陳伯仲.專利信息分析利用與創(chuàng)新[M].北京:知識產(chǎn)權(quán)出版社,2012:284-285.
30.翟東升.專利知識挖掘關(guān)鍵技術(shù)研究[M].北京:知識產(chǎn)權(quán)出版社,2013:239.
31.霍中詳.公知公用技術(shù)信息的挖掘[M].北京:知識產(chǎn)權(quán)出版社,2014:23-33.
32.陳旭,彭智勇,劉斌.專利檢索與分析研究綜述[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2014(3):420-426.
33. Iwayama M, Fujii I A, Kando N, et al. Overview of patent retrieval task at NTCIR-3[C]//The ACL-2003 Workshop on Patent Corpus Processing, Sapporo, Japan, 2003:24-32.
34. Japan Patent Office, Asia-Pacific Industrial Property Center, JIII. Guide Book for Practical Use of “Patent Map for Each Technology Field” [EB/OL].[2017-05-12].http://www.okpatents.com/phosita/images/patent_map_JPO.pdf.
35. WIPO. Patent map with exercises[EB/OL].[2017-04-25].http://www.WIPO.int/meetings/en/doc_details.jsp?doc_id=19674.
36.侯筱蓉.基于引文路徑分析的專利技術(shù)演進(jìn)圖研究[D].重慶:重慶大學(xué)碩士學(xué)位論文,2008:5-7.
37.丁月華,李程雄,文貴華,等.專利戰(zhàn)略分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J] .計(jì)算機(jī)工程,2005(15):211-212.
38. Anant Shivraj. Patent Mapping: The Technology in Patents[J]. Innovation Magazine, 2004(4):1-4.
39.張帆,肖國華,張嫻.專利地圖典型應(yīng)用研究[J].科技管理研究,2008(2):190-193.
40.岑詠華,王曰芬,王曉蓉.面向企業(yè)技術(shù)創(chuàng)新決策的專利數(shù)據(jù)挖掘研究綜述(上)[J].情報(bào)理論與實(shí)踐,2010(1):126-130.
41.沙振江,張蓉,劉桂鋒.國內(nèi)專利地圖研究進(jìn)展與展望[J].情報(bào)理論與實(shí)踐,2014(8):139-144.
42.肖國華.專利地圖研究與應(yīng)用[D].成都:四川大學(xué)碩士學(xué)位論文,2006:3-5.
43. Hyunseok Park,Janghyeok Yoon,Kwangsoo Kim.Identifying patent infringement using SAO based sematic technological similarities[J]. Scientometrics, 2012, 90(2):515-529.
44.李紅,楊向飛.專利地圖在R&D機(jī)會發(fā)現(xiàn)領(lǐng)域的應(yīng)用綜述[J].科技進(jìn)步與對策,2015(16):155-160.
45.岑詠華,王曰芬,王曉蓉.面向企業(yè)技術(shù)創(chuàng)新決策的專利數(shù)據(jù)挖掘研究綜述(下)[J].情報(bào)理論與實(shí)踐,2010(2):124-128.
46. Ronen Feldman,Ido Dagan. Knowledge Discovery in Textual Databases(KDT) [C].Proceedings of the First International Conference on Knowledge Discovery and Data Mining. Montreal,Canada,1995:112-117.
47.陳炘,米黑爾·羅科.納米科技創(chuàng)新與知識圖譜:世界納米科技專利與文獻(xiàn)分析[M].吳樹仙,王琛,譯.北京:科學(xué)出版社,2013:49,142.
48.諶志群,張國煊.文本挖掘與中文文本挖掘模型研究[J].情報(bào)科學(xué),2007, 25(7):1046-1050.
49. Gabriel Pui Cheong Fung,Jeffrey Xu Yu,Wai Lam.Stock Prediction: Integrating Text Mining Approach using Real-Time News[C]. Proceedings of 2003 IEEE International Conference on Computational Intelligence for Financial Engineering. Hong Kong,China,2003:395-402.
50. Aaron M Cohen,William R Hersh. A Survey of Current Work in Biomedical Text Mining[J]. Briefings in Bioinformatics,2005, 6(1):57-71.
51.屈鵬,張均勝,曾文,等.國內(nèi)外專利挖掘研究(2005—2014)綜述[J].圖書情報(bào)工作,2014(20):131-137.
52.袁冰,朱東華,任智軍.基于數(shù)據(jù)挖掘技術(shù)的專利情報(bào)分析方法及實(shí)證研究[J].情報(bào)雜志,2006(12):99-102.
53.胡阿沛,張靜,雷孝平.基于文本挖掘的專利技術(shù)主題分析研究綜述[J].情報(bào)雜志,2013(12):88-93.
54.張龍暉.大數(shù)據(jù)時代的專利分析[J].信息系統(tǒng)工程,2014(2):148-149.
55. Porter A L, Cunningham S W. Tech Mining: Exploiting New Technologies for Competitive Advantage[M]. Hoboken, New Jersey: John Wiley & Sons, Inc., 2005.
56.胡正銀,方曙.專利文本技術(shù)挖掘研究進(jìn)展綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2014(6):62-70.
57. Yang Y Y, Akers L, Klose, Yang C B. Text mining and visualization tools - Impressions of emerging capabilities[J]. World Patent Information, 2008, 30(4):280-293.
58.鄧鵬.大數(shù)據(jù)時代專利分析服務(wù)的機(jī)遇與挑戰(zhàn)[J].中國發(fā)明與專利,2014(2):29-31.
59. Kim H,Song J. Social network analysis of patent infringement law suits[J].Technological Forecasting &Social Change,2013, 80(5):944-955.
60.鄭貴忠,劉金蘭.基于生存分析的專利有效模型研究[J].科學(xué)學(xué)研究,2010(11):1677 -1683.
61.王春,楊志萍,方曙.利用德溫特分析家軟件開展專利情報(bào)研究[J].現(xiàn)代情報(bào),2005(12):14-17.
62. Seidel, A. A Citation System for Patent Office[J]. Journal of the Patent Office Society, 1949(31):554.
63.陳凱,徐峰,程如煙.非專利引文分析研究進(jìn)展[J].圖書情報(bào)工作,2015(5):137-144.
64.張虎膽,楊冠燦,吳恒,等.審查員引文是否應(yīng)作為專利引文“噪音”被剔除?[J].圖書情報(bào)知識,2013(6):77-83.
65.肖冬梅,陳穎.專利審查員引文的特征與價(jià)值[J].圖書情報(bào)工作,2015(19):6-14.
66. Karki, M. M. S. Patent citation analysis: a policy analysis tool [J]. World Patent Information, 1997, 19(4):269-272.
67.龐景安,黃迎燕.國內(nèi)外專利引文數(shù)據(jù)庫的研究與發(fā)展[J].情報(bào)科學(xué),2004(2):182-187.
68.陳亮,張志強(qiáng),尚瑋姣.專利引文分析方法研究進(jìn)展[J].現(xiàn)代圖書情報(bào)技術(shù), 2019(7): 75-81.
69. Sternitzke C,Bartkowski A,Schramm R. Visualizing patent statistics by means of social network analysis tools[J]. World Patent Information,2008, 30(2):115-131 .
70. Hsueh C C, Wang C C.The use of social network analysis in knowledge diffusion research from patent data[C].2009 International conference on advances in Social network analysis and mining, Athens: IEEE,2009:393-398.
71.陳云偉,方曙.社會網(wǎng)絡(luò)分析方法在專利分析中的應(yīng)用研究進(jìn)展[J].圖書情報(bào)工作,2012(4):90-95.