〔摘要〕專利分析報(bào)告是針對(duì)世界上最大的技術(shù)信息源專利而進(jìn)行的情報(bào)分析產(chǎn)品,能為決策者提供較為全面的技術(shù)信息。而專利分析報(bào)告內(nèi)容要素全面準(zhǔn)確的揭示則是其價(jià)值最大化發(fā)揮的重要基礎(chǔ)。本文總結(jié)了中文專利分析報(bào)告需標(biāo)引的內(nèi)容要素及其特點(diǎn),根據(jù)其內(nèi)容要素文本特征來(lái)選取相應(yīng)的標(biāo)引方式,并分析了中文專利分析報(bào)告標(biāo)引質(zhì)量的影響因素,從而構(gòu)建科學(xué)合理的標(biāo)引質(zhì)量控制機(jī)制。
〔關(guān)鍵詞〕專利分析報(bào)告;內(nèi)容要素;標(biāo)引;質(zhì)量控制;機(jī)制
DOI:10.3969/j.issn.1008-0821.2017.05.006
〔中圖分類(lèi)號(hào)〕G25553〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2017)05-0033-04
A Study of Indexing Control Mechanism for the
Content Elements of the Patent Analysis ReportsZhang Jing1,2,3
(1.Library of Chinese Academy of Sciences,Beijing 100190,China;
2.University of Chinese Academy of Sciences,Beijing 100049,China;
3.Archives of Chinese Academy of Sciences,Beijing 100190,China)
〔Abstract〕Patent analysis reports are carried out to provide more comprehensive technical information for policy-makers according to patent,the worlds largest technology information source.The fully and accurately indexing for content elements of the patent analysis reports is an important foundation to maximize its value.The content elements required indexing and its characteristics of Chinese patent analysis were summarized to select the appropriate indexing method.Then the factors affecting the indexing quality were found to build a scientific and rational indexing control mechanism.
〔Key words〕patent analysis report;content elements;indexing;quality control;mechanism
戰(zhàn)略決策的制定必須依據(jù)一定數(shù)量的可靠信息[1]。而專利是技術(shù)創(chuàng)新和科學(xué)技術(shù)發(fā)明的產(chǎn)物,是世界上最大的技術(shù)信息源,全世界技術(shù)成果的80%都能在專利文獻(xiàn)中找到[2]。相比其他信息資源,專利文獻(xiàn)具有內(nèi)容新穎、系統(tǒng)詳盡、格式規(guī)范、分類(lèi)科學(xué)等特點(diǎn)[3],是重要的戰(zhàn)略情報(bào)分析數(shù)據(jù)來(lái)源。通過(guò)專利分析能夠?yàn)闆Q策者提供較為全面的技術(shù)信息:產(chǎn)業(yè)發(fā)展現(xiàn)狀、技術(shù)背景信息、關(guān)鍵發(fā)明技術(shù)路線、核心研究團(tuán)隊(duì)、主要競(jìng)爭(zhēng)者及其技術(shù)布局等內(nèi)容,能有效地支撐決策者評(píng)估技術(shù)前景、發(fā)現(xiàn)新的人/物等技術(shù)資源、認(rèn)知自己現(xiàn)有技術(shù)的改進(jìn)點(diǎn)、發(fā)現(xiàn)解決特殊技術(shù)問(wèn)題的方法或途徑、預(yù)見(jiàn)未來(lái)技術(shù)布局重點(diǎn)等。
作為專利情報(bào)分析的主要產(chǎn)品,針對(duì)專利分析報(bào)告進(jìn)行長(zhǎng)期保存,有利于維護(hù)已有研究成果,便于研究方法與成果的交互與共享,為后續(xù)相關(guān)研究及決策提供借鑒與數(shù)據(jù)支持,減少科研資源的重復(fù)配置,更充分地發(fā)揮已有成果的價(jià)值。而種種目的能夠達(dá)成的基礎(chǔ)在于,能夠針對(duì)情報(bào)研究人員及決策者的使用目的,持續(xù)、有效地對(duì)專利分析報(bào)告進(jìn)行標(biāo)引。而針對(duì)專利分析報(bào)告的利用更多的是基于內(nèi)容要素的,因此需要對(duì)專利分析報(bào)告內(nèi)容要素的標(biāo)引管理機(jī)制進(jìn)行科學(xué)合理的設(shè)計(jì)與規(guī)劃。
1專利分析報(bào)告內(nèi)容要素及其特點(diǎn)
專利分析報(bào)告是對(duì)專利說(shuō)明書(shū)與專利公報(bào)中大量的專利信息進(jìn)行分析、加工、組合,并利用統(tǒng)計(jì)學(xué)方法和各種信息處理技術(shù)將之轉(zhuǎn)化為具有總攬全局及預(yù)測(cè)功能的情報(bào)[4]產(chǎn)出,是專利情報(bào)分析人員與技術(shù)專家合作分析產(chǎn)出的智力成果,具有主題集中、分析數(shù)據(jù)來(lái)源多樣、報(bào)告格式較為規(guī)范、分析層次多、技術(shù)分析內(nèi)容豐富、分析結(jié)論較為正式等特點(diǎn)。
整體來(lái)說(shuō),專利分析報(bào)告內(nèi)容的特點(diǎn)為:①基于不同的分析目的,分析框架會(huì)有所不同;②通常一份報(bào)告會(huì)涵蓋多數(shù)據(jù)庫(kù)、多檢索策略;③包含針對(duì)技術(shù)的細(xì)分框架;④可視化形式多樣;⑤技術(shù)專家的參與對(duì)分析方向有重要作用;⑥包含核心/重點(diǎn)專利著錄與內(nèi)容信息;⑦縮寫(xiě)及技術(shù)領(lǐng)域等編號(hào)內(nèi)容較多。通過(guò)總結(jié),可以發(fā)現(xiàn)中文專利分析報(bào)告需要標(biāo)引的內(nèi)容要素及其子要素,見(jiàn)表1。表1專利分析報(bào)告需標(biāo)引的內(nèi)容要素及其子要素
內(nèi)容要素子要素時(shí)間數(shù)據(jù)采集時(shí)間、分析完成時(shí)間人員分析人員、技術(shù)專家分析領(lǐng)域上位領(lǐng)域、子領(lǐng)域、技術(shù)框架分析框架——檢索策略數(shù)據(jù)源、檢索式分析指標(biāo)統(tǒng)計(jì)性、描述性、趨勢(shì)性、組合指標(biāo)圖柱/條等統(tǒng)計(jì)圖、地形圖、氣泡圖、引證圖等表二維表、三維表……文字技術(shù)背景、圖表解釋、結(jié)論核心專利信息專利號(hào)、題名、申請(qǐng)時(shí)間、授權(quán)時(shí)間、法律狀態(tài)、同族信息、專利權(quán)人等技術(shù)領(lǐng)域IPC、MC、EC、UPC等縮寫(xiě)國(guó)家代碼、文獻(xiàn)類(lèi)型代碼、機(jī)構(gòu)名稱縮寫(xiě)、專有名詞縮寫(xiě)等
21標(biāo)引方式選取原則
人工標(biāo)引與自動(dòng)標(biāo)引兩種主要方式中,人工標(biāo)引能有效利用人的智能,識(shí)別程度較高,但Cleverton[5]指出,人工標(biāo)引存在較高的標(biāo)引一致性的問(wèn)題,并且完全人工標(biāo)引已經(jīng)無(wú)法適應(yīng)信息時(shí)代的信息增速;而自動(dòng)標(biāo)引在規(guī)則內(nèi)可以有效解決一致性與工作量的問(wèn)題,但卻存在準(zhǔn)確率與召回率不高的問(wèn)題。黃紹杉等采用條件隨機(jī)場(chǎng)方法對(duì)英文專利摘要信息進(jìn)行自動(dòng)抽取,提交第八屆日本國(guó)立信息學(xué)研究所信息檢索和獲取系統(tǒng)測(cè)試集(NTCIR-8)評(píng)測(cè)會(huì)議的參賽結(jié)果為準(zhǔn)確率接近04,召回率尚不到016[6]??紤]到專利分析報(bào)告涵蓋的內(nèi)容遠(yuǎn)多于專利摘要的信息,且中文資料尚有分詞等獨(dú)特問(wèn)題的存在,針對(duì)專利分析報(bào)告的完全自動(dòng)標(biāo)引質(zhì)量尚有待商榷。
正如Lancaster和Warner所說(shuō),自動(dòng)標(biāo)引技術(shù)距離完全實(shí)際應(yīng)用仍有很長(zhǎng)的距離,只有機(jī)器具有足夠智能,才能完全替代人類(lèi)完成這項(xiàng)重要工作[7]。因此在目前的技術(shù)條件下,專利分析報(bào)告的標(biāo)引不能完全直接依賴自動(dòng)標(biāo)引技術(shù),應(yīng)通過(guò)人的監(jiān)管,保證標(biāo)引結(jié)果一致性與完備性的同時(shí),通過(guò)機(jī)器學(xué)習(xí)等手段,在標(biāo)引工作中不斷豐富完善基礎(chǔ)知識(shí)庫(kù),以實(shí)現(xiàn)自動(dòng)標(biāo)引系統(tǒng)的長(zhǎng)期完善。只有人工和自動(dòng)標(biāo)引相結(jié)合,才能提高標(biāo)引效果與標(biāo)引效率,才有利于標(biāo)引工作的持續(xù)發(fā)展。
總的來(lái)說(shuō),專利分析報(bào)告標(biāo)引方式的選取需要遵守以下幾個(gè)原則:①不盲目追求“全自動(dòng)”,要以提高標(biāo)引質(zhì)量,便于長(zhǎng)期保存和用戶再利用為首要目標(biāo);②在標(biāo)引人員監(jiān)控下,由計(jì)算機(jī)完成的工作是較為可靠的;③計(jì)算機(jī)做不好的,要由標(biāo)引人員來(lái)做,如對(duì)戰(zhàn)略情報(bào)研究成果的主題詞標(biāo)引;④計(jì)算機(jī)做得不好的,標(biāo)引人員要給予輔助;⑤采取各種手段,如機(jī)器學(xué)習(xí)等,讓計(jì)算機(jī)做更多的工作,逐步提高自動(dòng)化水平。
22專利分析報(bào)告內(nèi)容要素文本特征及標(biāo)引方式
專利分析報(bào)告的內(nèi)容要素具有如下文本特征:①技術(shù)領(lǐng)域通常有一個(gè)不斷細(xì)化的過(guò)程,具有相應(yīng)的上下位關(guān)系;②技術(shù)領(lǐng)域作為分析的重點(diǎn),是專利分析報(bào)告的核心信息,會(huì)在報(bào)告中反復(fù)出現(xiàn);③時(shí)間、人員、檢索策略等內(nèi)容要素具備明確的指示文本標(biāo)志,通常也都在特定位置出現(xiàn);④分析指標(biāo)多樣、表述方式多樣、展示形式多樣、涉及計(jì)算方法、含義、解釋等多方面的信息內(nèi)容。
總體來(lái)說(shuō),中文專利分析報(bào)告格式較為規(guī)范,除文字描述關(guān)鍵信息及分析指標(biāo)外,其他內(nèi)容要素多有相對(duì)穩(wěn)定的文本特征,見(jiàn)表2。
表2中文專利分析報(bào)告內(nèi)容要素文本特征及標(biāo)引方式
內(nèi)容要素文本標(biāo)志位置適合的標(biāo)引方式時(shí)間數(shù)據(jù)采集時(shí)間截止到、檢索時(shí)間、檢索日期摘要/檢索策略附近自動(dòng)分析完成時(shí)間——報(bào)告封面下方自動(dòng)人員分析人員負(fù)責(zé)人、完成人、分析人員……報(bào)告封面自動(dòng)技術(shù)專家院士、教授、博士……致謝、完成人員中自動(dòng)分析領(lǐng)域上位領(lǐng)域領(lǐng)域報(bào)告標(biāo)題、分析內(nèi)容反復(fù)出現(xiàn)自動(dòng)+人工子?領(lǐng)?域領(lǐng)域、技術(shù)方向一級(jí)標(biāo)題、相應(yīng)部分反復(fù)出現(xiàn)自動(dòng)+人工技術(shù)框架——內(nèi)容分析表格、標(biāo)題層次自動(dòng)+人工分析框架——目錄、摘要、報(bào)告起始部分自動(dòng)+人工表2(續(xù))
內(nèi)容要素文本標(biāo)志位置適合的標(biāo)引方式檢索策略檢索策略、檢索式、數(shù)據(jù)來(lái)源腳注、附錄自動(dòng)分析指標(biāo)——圖/表標(biāo)題、相應(yīng)部分多次出現(xiàn)自動(dòng)+人工圖、表圖、表正文中的圖表標(biāo)題自動(dòng)文字技術(shù)背景——報(bào)告開(kāi)始部分的定性描述自動(dòng)+人工圖表解釋見(jiàn)圖、見(jiàn)表……正文圖表標(biāo)題上下自動(dòng)+人工結(jié)論結(jié)論、建議、啟示摘要、小結(jié)自動(dòng)+人工專利專?利?號(hào)專利、國(guó)家代碼縮寫(xiě)+數(shù)字自動(dòng)其他著錄信息——專利信息一覽表格、正文專利號(hào)
后的描述文字自動(dòng)+人工技術(shù)內(nèi)容采用……解決……、主要……專利號(hào)后的文字描述、列表自動(dòng)+人工技術(shù)領(lǐng)域IPC、MC、EC、UPC……表頭、表名注釋、正文自動(dòng)縮寫(xiě)——列表解釋自動(dòng)
結(jié)合前述標(biāo)引方式的選取來(lái)看,時(shí)間、人員等有相對(duì)固定位置及文本標(biāo)志的內(nèi)容要素適合采用自動(dòng)標(biāo)引的方式進(jìn)行抽取,人工適當(dāng)檢驗(yàn)即可,可以減少人員工作量;技術(shù)領(lǐng)域、框架及解釋性文字關(guān)鍵信息的抽取就必須加入人工干預(yù),以在保持標(biāo)引結(jié)果一致性的基礎(chǔ)上,提高對(duì)關(guān)鍵技術(shù)信息揭示的準(zhǔn)確與完備程度。值得注意的是,專利分析指標(biāo)的分析內(nèi)容與層級(jí)是專利分析報(bào)告定量分析的核心,雖然分析指標(biāo)的種類(lèi)與數(shù)量在一定時(shí)間內(nèi)具有窮舉性,但其表述及展示方式的多樣性決定了它必須增加人工干預(yù)進(jìn)行指標(biāo)表述方式的歸一化處理,同時(shí)不斷完善分析指標(biāo)表述及展示庫(kù),以提升自動(dòng)標(biāo)引系統(tǒng)的能力。
3專利分析報(bào)告標(biāo)引流程及質(zhì)量影響因素
專利分析報(bào)告的標(biāo)引工作遵循文獻(xiàn)標(biāo)引工作的一般流程,包括5個(gè)基本步驟:查找并利用已有標(biāo)引成果、主題分析、轉(zhuǎn)換標(biāo)識(shí)、標(biāo)引記錄和標(biāo)引成果著錄、審核[8]。這是一項(xiàng)復(fù)雜的技術(shù)性工作,標(biāo)引質(zhì)量受各個(gè)工作環(huán)節(jié)的制約。
使用5M因素分析法,經(jīng)過(guò)頭腦風(fēng)暴,并與專家討論后,得出圖1所示的影響專利分析報(bào)告標(biāo)引質(zhì)量的相關(guān)因素:標(biāo)引人員、專利分析報(bào)告、進(jìn)行標(biāo)引工作的技術(shù)平臺(tái),以及制度環(huán)境。圖1專利分析報(bào)告標(biāo)引質(zhì)量影響因子
1)標(biāo)引人員是與標(biāo)引質(zhì)量直接相關(guān)的重要人物因素。標(biāo)引工作是一項(xiàng)需要耐心與細(xì)致的工作,標(biāo)引人員的工作態(tài)度好,用于標(biāo)引工作的時(shí)間足夠,則工作會(huì)比較細(xì)致,標(biāo)引質(zhì)量會(huì)較高。標(biāo)引人員關(guān)鍵信息識(shí)別能力越高,則能更準(zhǔn)確地把握專利分析報(bào)告內(nèi)容的核心,對(duì)其內(nèi)容要素的描述也就更到位。
2)專利分析報(bào)告是標(biāo)引的“原料”。其標(biāo)引的格式規(guī)范程度越高、信息點(diǎn)越完備,專利情報(bào)研究及決策者所需信息揭示得越充分,其日后的利用價(jià)值也越高。
3)標(biāo)引工作進(jìn)行的技術(shù)平臺(tái)是標(biāo)引工作的硬件條件,系統(tǒng)設(shè)計(jì)的越細(xì)致、越規(guī)范、越易用,則越有利于標(biāo)引工作的規(guī)范性開(kāi)展,有利于提高標(biāo)引質(zhì)量;系統(tǒng)的可擴(kuò)展性越強(qiáng),越有利于針對(duì)新出現(xiàn)的問(wèn)題隨時(shí)修改,有利于標(biāo)引流程與規(guī)范的完善;更為重要的,自動(dòng)標(biāo)引系統(tǒng)中針對(duì)專利分析報(bào)告關(guān)鍵信息的文本特征庫(kù)越完備,越有利于提高系統(tǒng)自動(dòng)標(biāo)引的準(zhǔn)確性。
4)環(huán)境因素主要包括與標(biāo)引工作相關(guān)的管理規(guī)范與要求。管理層越重視標(biāo)引工作、對(duì)標(biāo)引工作的工作量與績(jī)效設(shè)置越合理,就越能激發(fā)標(biāo)引人員的工作積極性;標(biāo)引規(guī)則越完善、質(zhì)量控制流程越合理,越有利于規(guī)范標(biāo)引人員的工作,能夠提高標(biāo)引質(zhì)量。
4專利分析報(bào)告標(biāo)引質(zhì)量控制機(jī)制
有效提升專利分析報(bào)告標(biāo)引質(zhì)量的關(guān)鍵在于針對(duì)影響標(biāo)引質(zhì)量的因素構(gòu)建相應(yīng)的關(guān)鍵環(huán)節(jié)質(zhì)量控制機(jī)制,見(jiàn)圖2。
圖2專利分析報(bào)告標(biāo)引質(zhì)量控制機(jī)制
1)標(biāo)引方式的選取是有效進(jìn)行標(biāo)引質(zhì)量控制的核心。針對(duì)不同內(nèi)容要素及其文本特征,選取恰當(dāng)?shù)臉?biāo)引方式。能夠在減少人工工作量,提高標(biāo)引效率與標(biāo)引結(jié)果一致性的同時(shí),提高關(guān)鍵信息的標(biāo)引結(jié)果準(zhǔn)確性與完備程度。
2)構(gòu)建嚴(yán)格合理的標(biāo)引工作流程,設(shè)置相應(yīng)崗位,是減少系統(tǒng)誤差的重點(diǎn)。①針對(duì)不同環(huán)節(jié)設(shè)定專職或兼職崗位,明確各個(gè)崗位的職責(zé)及細(xì)致的操作規(guī)范,責(zé)任到人;②在各環(huán)節(jié)的崗位職責(zé)上,下一環(huán)節(jié)有責(zé)任檢查上一環(huán)節(jié)工作;③計(jì)算機(jī)與人工檢查相配合進(jìn)行質(zhì)量控制;④美國(guó)國(guó)會(huì)圖書(shū)館提出了書(shū)目社會(huì)化的構(gòu)想,在Web20時(shí)代,專利分析報(bào)告的標(biāo)引工作也可以逐步吸引用戶參與,以便更貼近用戶需求。
3)制定嚴(yán)格的標(biāo)引規(guī)則,是提升人工標(biāo)引一致性和自動(dòng)標(biāo)引內(nèi)容完備性的重要手段。針對(duì)專利分析報(bào)告,必須標(biāo)引哪些內(nèi)容要素,不同內(nèi)容要素的標(biāo)引規(guī)范及加工標(biāo)準(zhǔn)都需有細(xì)致考慮,并在實(shí)際工作中不斷完善。
4)內(nèi)容要素文本特征庫(kù)的構(gòu)建與完善機(jī)制是不斷提升人工標(biāo)引與自動(dòng)標(biāo)引質(zhì)量的重要前提。內(nèi)容要素文本特征是人工標(biāo)引與自動(dòng)標(biāo)引過(guò)程中的重要參照標(biāo)準(zhǔn),在很大程度上會(huì)對(duì)標(biāo)引結(jié)果的一致性及完備性產(chǎn)生重要影響,因此在人工干預(yù)過(guò)程中,需要對(duì)計(jì)算機(jī)識(shí)別有問(wèn)題的文本特征進(jìn)行糾正,并補(bǔ)充進(jìn)入新的文本特征供機(jī)器學(xué)習(xí)及其他人員共享。
5)制定科學(xué)合理的管理規(guī)范,創(chuàng)造良性標(biāo)引工作環(huán)境,是專利分析報(bào)告標(biāo)引工持續(xù)發(fā)展的重要保障。管理規(guī)范涉及多方面內(nèi)容:人員績(jī)效考評(píng)機(jī)制、人員培訓(xùn)提升機(jī)制、對(duì)技術(shù)平臺(tái)維護(hù)和升級(jí)的相應(yīng)規(guī)定、各規(guī)定的完善機(jī)制等。
5小結(jié)
針對(duì)世界上最大的技術(shù)信息源專利而進(jìn)行的情報(bào)分析產(chǎn)品,即專利分析報(bào)告,能為決策者提供較為全面的技術(shù)信息。而專利分析報(bào)告內(nèi)容要素全面準(zhǔn)確的揭示則是其價(jià)值最大化發(fā)揮的重要基礎(chǔ)。
自動(dòng)標(biāo)引是信息時(shí)代標(biāo)引工作的發(fā)展方向,但現(xiàn)階段的技術(shù)水平?jīng)Q定了目前專利分析報(bào)告的標(biāo)引工作需要根據(jù)需標(biāo)引的內(nèi)容要素特點(diǎn)及其文本特征選取標(biāo)引方式,即某些關(guān)鍵信息的標(biāo)引必須加入人工干預(yù)。
因此,為了實(shí)現(xiàn)標(biāo)引結(jié)果一致性與完備性的最優(yōu),專利分析報(bào)告標(biāo)引需要針對(duì)各環(huán)節(jié)的質(zhì)量影響因素構(gòu)建合理的標(biāo)引流程,設(shè)置相應(yīng)崗位,制定細(xì)致明確的崗位規(guī)范與標(biāo)引規(guī)則,構(gòu)建相應(yīng)的內(nèi)容要素文本特征庫(kù)并不斷完善,按照科學(xué)合理的管理規(guī)范來(lái)實(shí)現(xiàn)專利分析報(bào)告標(biāo)引工作的持續(xù)發(fā)展。
參考文獻(xiàn)
[1]唐煒.面向戰(zhàn)略決策服務(wù)的專利分析指標(biāo)研究[D].北京:中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,2006.
[2]MBlackman.Provision of patent information:a national patent office perspective[J].World Patent Information,1995,17(2):115-123.
[3]胡阿沛,張靜,張曉宇.基于專利文獻(xiàn)的技術(shù)演化分析方法評(píng)述[J].現(xiàn)代情報(bào),2013,33(10):172-176.
[4]賴院根,朱東華,胡望斌.基于專利情報(bào)分析的高技術(shù)企業(yè)專利戰(zhàn)略構(gòu)建[J].科研管理,2007,(9):156-162.
[5]Cleverton,CW..Optimizing Convenient Online Access to Bibliographic Database[J].Information Services and Use,1984,(4):37-47.
[6]黃紹杉,喬曉東,桂婕,等.基于條件隨機(jī)場(chǎng)的專利摘要信息抽取研究[J].數(shù)字圖書(shū)館論壇,2010,(9):7-12.
[7]Lancaster,F(xiàn)W.and Warner A.Intelligent Technologies in Library and Information Ser-vice Applications.Medford,NJ,Information Today,2001.
[8]劉湘生,汪東波.文獻(xiàn)標(biāo)引工作[M].北京:北京圖書(shū)館出版社,2001:46-60.