陳飛
摘 要: UA025審查單元涉及兩大領(lǐng)域,分別是信息檢索和數(shù)據(jù)庫領(lǐng)域、圖像識(shí)別領(lǐng)域,這兩個(gè)領(lǐng)域IPC分類號(hào)下文獻(xiàn)量巨大,在實(shí)際檢索中關(guān)鍵詞難擴(kuò)展、噪聲大,利用CPC檢索能夠極大降低噪聲,大大提高檢索效率。本文先對UA025審查單元相關(guān)的IPC和CPC分類號(hào)進(jìn)行了梳理比較,從理論層面探討了采用CPC分類號(hào)能更有利于檢索,然后結(jié)合2個(gè)典型案例分析UA025領(lǐng)域CPC分類對檢索的有效性,以更全面的視角進(jìn)行CPC的檢索和審查。
關(guān)鍵詞: CPC;信息檢索;圖像識(shí)別
一、引言
從所使用的分類系統(tǒng)來看,世界知識(shí)產(chǎn)權(quán)組織使用的是國際專利分類體系(IPC),美國專利商標(biāo)局使用的是美國專利分類體系(USPC),歐洲專利局使用的主要是基于IPC的歐洲專利分類體系(ECLA/ICO),日本專利局使用的主要是基于IPC的日本專利分類體系(FI/FT),韓國知識(shí)產(chǎn)權(quán)局和中國國家知識(shí)產(chǎn)權(quán)局使用的均為IPC。
在上述各專利分類體系中,IPC被廣泛使用,但其存在更新速度慢、單一分類號(hào)下文獻(xiàn)量大的缺點(diǎn)。而且在審查實(shí)踐中IPC分類號(hào)不利于檢索的缺點(diǎn)也很突出。針對其他幾種分類體系都無法在全球廣泛推廣的局限性,2013年1月1日,美國專利商標(biāo)局和歐洲專利局宣布,正式啟用嶄新的聯(lián)合專利分類(CPC)這一用于專利文件的全球分類系統(tǒng),CPC是以歐洲專利局分類號(hào)ECLA作為整個(gè)分類體系的基礎(chǔ),同時(shí)結(jié)合美國專利分類實(shí)踐經(jīng)驗(yàn)構(gòu)建而成的聯(lián)合分類體系,CPC具有大于250000個(gè)細(xì)分,CPC分類號(hào)對IPC分類號(hào)進(jìn)行了更進(jìn)一步的細(xì)分,從而進(jìn)一步提高了檢索的準(zhǔn)確度和檢索效率。
二、UA025審查單元IPC與CPC分類體系比較
UA025審查單元的一個(gè)主審分類號(hào)是G06F17/30,涉及信息檢索及其數(shù)據(jù)庫結(jié)構(gòu)。該分類號(hào)屬于一點(diǎn)組,在CNABS數(shù)據(jù)庫中有8萬多篇文獻(xiàn),在VEN數(shù)據(jù)庫中有32萬多篇文獻(xiàn),并且該分類號(hào)下面沒有更細(xì)分的IPC分類號(hào)。因此,使用該IPC分類號(hào)進(jìn)行檢索時(shí)難度巨大,在實(shí)際檢索中通常主要采用關(guān)鍵詞進(jìn)行檢索,引入噪聲大。從CPC分類體系中可以看到,G06F17/30分類號(hào)下面有15個(gè)二點(diǎn)組,其下還被分為三點(diǎn)組、四點(diǎn)組,最多的層級(jí)甚至達(dá)到了六點(diǎn)組、七點(diǎn)組。
UA025審查單元的另一個(gè)主審分類號(hào)是G06K9/00-G06K9/82,主要是用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形。G06K9/00下的IPC分類號(hào)涉及一點(diǎn)組、二點(diǎn)組和三點(diǎn)組,相對于G06F17/30領(lǐng)域的分類號(hào)較為好用。IPC 分類號(hào)將G06K9/00-G06K9/82領(lǐng)域大致分為圖像捕獲、圖像預(yù)處理、圖像識(shí)別以及兩兩之間的組合,而CPC分類更為精細(xì),單是圖像識(shí)別就進(jìn)一步細(xì)分為指紋識(shí)別、簽名識(shí)別、三維物體識(shí)別、人臉識(shí)別、文檔識(shí)別等。經(jīng)過CPC的細(xì)分,每個(gè)分類號(hào)下面的文獻(xiàn)量都大大減少了,文獻(xiàn)的分類位置也更為準(zhǔn)確,這是很有利于檢索的。
三、CPC分類號(hào)在UA025審查單元檢索中的應(yīng)用
以上從理論層面分析了采用CPC分類號(hào)進(jìn)行檢索的有效性,下面分別采用IPC分類號(hào)和CPC分類號(hào)對2個(gè)實(shí)際案例進(jìn)行檢索,通過比較檢索過程表明,利用CPC分類號(hào)進(jìn)行檢索可以提高檢索效率。
【案例一】
權(quán)利要求1
1. 一種電子書籍資源信息網(wǎng)絡(luò)同步的方法,包括以下步驟:
(1)建立電子書籍章節(jié)信息邏輯結(jié)構(gòu),并將該章節(jié)信息邏輯結(jié)構(gòu)插入資源結(jié)構(gòu)存儲(chǔ)介質(zhì)中;
(2)按步驟(1)中所述的章節(jié)信息邏輯結(jié)構(gòu)錄入電子書籍的章節(jié)信息;
(3)建立資源信息邏輯結(jié)構(gòu),使資源信息邏輯結(jié)構(gòu)與所述電子書籍的章節(jié)信息進(jìn)行關(guān)聯(lián),并將該關(guān)聯(lián)插入資源結(jié)構(gòu)存儲(chǔ)介質(zhì)中;
(4)添加資源文件及資源信息,同時(shí)與章節(jié)信息進(jìn)行關(guān)聯(lián),并將其插入資源結(jié)構(gòu)存儲(chǔ)介質(zhì)中;
(5)打開書籍章節(jié)時(shí),通過章節(jié)信息檢索本地客戶端或網(wǎng)絡(luò)服務(wù)器,展示資源文件列表,并記錄每個(gè)資源文件的來源;
(6)查看資源時(shí),根據(jù)資源文件的來源打開該資源信息。
權(quán)利要求分析
本申請屬于信息檢索領(lǐng)域,主分類號(hào)是G06F17/30,從權(quán)利要求中可以提取關(guān)鍵詞“電子書”、“關(guān)聯(lián)”,對應(yīng)的英文關(guān)鍵詞是“ebook”、“associate”。
得到8篇結(jié)果,該結(jié)果即為可以評(píng)價(jià)本申請創(chuàng)造性的X類文獻(xiàn):US2008/0168073 A1。
【案例二】
權(quán)利要求1
1. 畫像系統(tǒng)的標(biāo)簽詞庫更新方法,其特征在于,包括以下步驟:
步驟1、獲取用戶的畫像數(shù)據(jù),所述畫像數(shù)據(jù)包括用于描述所述用戶的標(biāo)簽和所述用戶發(fā)表的原始文本;
步驟2、當(dāng)標(biāo)簽的數(shù)量與原始文本的數(shù)量的比值小于預(yù)設(shè)的第一閾值時(shí),對所述用戶發(fā)表的所有原始文本進(jìn)行分詞處理,以得到多個(gè)標(biāo)簽候選詞,并將標(biāo)簽候選詞發(fā)送至推薦系統(tǒng);
步驟3、推薦系統(tǒng)計(jì)算每一個(gè)標(biāo)簽候選詞與預(yù)設(shè)的詞向量模型文件中每一個(gè)詞的向量距離,將存在向量距離大于預(yù)設(shè)的第二閾值的標(biāo)簽候選詞加入到標(biāo)簽詞庫中,將不存在向量距離大于第二閾值的標(biāo)簽候選詞刪除。
權(quán)利要求分析
本申請屬于信息檢索領(lǐng)域,主分類號(hào)是G06F17/30,從權(quán)利要求中可以提取關(guān)鍵詞“畫像”、“標(biāo)簽”,對應(yīng)的英文關(guān)鍵詞是“image”、“picture”、“l(fā)abel”。
檢索得到74篇文獻(xiàn),通過閱讀文獻(xiàn),得到一篇可以評(píng)述本申請創(chuàng)造性的X類文獻(xiàn):US2008/0033983A1。
四、總結(jié)
UA025審查單元的CPC分類較IPC更加細(xì)化,尤其是涉及G06F17/30領(lǐng)域,在實(shí)際案例的檢索中發(fā)揮了重要作用,細(xì)分的CPC分類位置能夠提供準(zhǔn)確的技術(shù)信息,縮小檢索范圍,有效地降低檢索噪聲,提高檢索效率。CPC分類體系的出現(xiàn)可以彌補(bǔ)審查員,尤其是G06F17/30領(lǐng)域?qū)彶閱T過分依賴關(guān)鍵詞的缺陷,對審查員的檢索方式將產(chǎn)生很大的影響。而CPC條目眾多,對CPC分類號(hào)的熟練運(yùn)用是一個(gè)長期積累的過程,在平常的審查過程中,要積極加以運(yùn)用,以進(jìn)一步提高檢索水平和審查質(zhì)量。
參考文獻(xiàn)
[1] 李真等.聯(lián)合專利分類CPC系統(tǒng)介紹,專利文獻(xiàn)研究,2014(2):10-13.
[2] 王偉等,圖像領(lǐng)域G06K9/00的CPC分類研究,電視技術(shù),2014(z2):195-196.