国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于孿生神經(jīng)網(wǎng)絡(luò)的原創(chuàng)設(shè)計抄襲鑒定技術(shù)研究

2022-03-19 08:11劉奕彤王乙霖
科教導(dǎo)刊·電子版 2022年5期
關(guān)鍵詞:特征提取標(biāo)簽神經(jīng)網(wǎng)絡(luò)

劉奕彤 王乙霖

(上海立信會計金融學(xué)院 上海 201209)

0 引言

(1)研究背景。中國現(xiàn)今是世界第二大經(jīng)濟(jì)體,商品經(jīng)濟(jì)與文化產(chǎn)業(yè)的發(fā)展日新月異。在此背景之下,中國原創(chuàng)商品外觀設(shè)計的數(shù)量種類數(shù)目也呈井噴式增長。外觀形象設(shè)計作為消費者了解產(chǎn)品的最直觀的第一渠道,對消費者感知、區(qū)分不同商品以及商品在市場的流通都具有非常重要的作用。

近年來,盡管原創(chuàng)的設(shè)計理念越來越為人們所推崇,然而據(jù)有關(guān)調(diào)查顯示,抄襲商品外觀設(shè)計的行為仍然屢禁不止。

為解決上述問題,本文將提出一個原創(chuàng)設(shè)計抄襲鑒定系統(tǒng)。本系統(tǒng)旨在作為一種抄襲鑒定的輔助技術(shù)參與原創(chuàng)設(shè)計的保護(hù)工作之中。其工作原理是通過對互聯(lián)網(wǎng)上的各種外觀設(shè)計進(jìn)行實時監(jiān)控,若發(fā)現(xiàn)存在抄襲嫌疑的設(shè)計則及時反饋給用戶,提醒用戶進(jìn)行維權(quán)。除此之外,本系統(tǒng)還可以解放人力,輔助有關(guān)人員進(jìn)行原創(chuàng)外觀設(shè)計的審核工作。

(2)研究現(xiàn)狀。此類任務(wù)可參考傳統(tǒng)的模式識別問題考慮。模式識別的關(guān)鍵問題在于準(zhǔn)確提取并描述原創(chuàng)設(shè)計的特征?,F(xiàn)有的特征提取思路,包括構(gòu)建顏色直方圖來提取顏色特征,從圖像的自相關(guān)函數(shù)提取紋理特征,利用sift算法和hog算法提取圖像的輪廓與形狀特征。這些基于圖像底層特征的描述方法都只適用于簡單的分類任務(wù),在面對可能存在語義層面的抄襲行為時,這些方法的局限性就逐漸顯露。

卷積神經(jīng)網(wǎng)絡(luò)是一種相對新興的特征提取方法,以其局部權(quán)值共享的特殊結(jié)構(gòu)在模式識別方面有著獨特的優(yōu)越性。盡管由它提取出的特征不具有可解釋性,但在面對需要進(jìn)行語義描繪的任務(wù)時,它的識別準(zhǔn)確率明顯比上述算法高。在目前的研究中,雖然有許多研究圍繞神經(jīng)網(wǎng)絡(luò)的應(yīng)用展開,然而在解決相似設(shè)計是否存在抄襲這種問題上,國內(nèi)還沒有比較成熟的解決方法。針對此,我們提出了一種新的原創(chuàng)設(shè)計抄襲判斷模式,采用了孿生神經(jīng)網(wǎng)絡(luò)的框架,最終做出一個可以模擬人類意識判斷不同設(shè)計之間是否涉及抄襲的模型。

1 實現(xiàn)方法

1.1 構(gòu)建多聚焦式爬蟲組網(wǎng)的偽通用爬蟲

實現(xiàn)抄襲行為檢測和相似原創(chuàng)設(shè)計抄襲判斷的基礎(chǔ)是獲取足夠多的訓(xùn)練數(shù)據(jù)集。本項目為了保證獲取數(shù)據(jù)的先進(jìn)性,對于爬蟲技術(shù)的需求就是構(gòu)建多聚焦式爬蟲組網(wǎng)的偽通用爬蟲,從而覆蓋國內(nèi)相關(guān)的原創(chuàng)形象發(fā)布平臺來搜集相應(yīng)IP形象數(shù)據(jù)。

采用Scrapy網(wǎng)絡(luò)爬蟲框架進(jìn)行數(shù)據(jù)的采集。它的基本網(wǎng)絡(luò)運行框架如圖所示:

網(wǎng)絡(luò)運行框架圖

1.2 搭建孿生神經(jīng)網(wǎng)絡(luò),采用跳遠(yuǎn)鏈接結(jié)構(gòu)

采集數(shù)據(jù)之后,還需研究如何提取并利用數(shù)據(jù)的特征信息。本系統(tǒng)應(yīng)用了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的變種結(jié)構(gòu):孿生神經(jīng)網(wǎng)絡(luò),進(jìn)行圖像特征的提取工作。孿生神經(jīng)網(wǎng)絡(luò)由兩個子網(wǎng)絡(luò)構(gòu)成,它們在訓(xùn)練的過程中權(quán)值共享,在進(jìn)行反向傳播時同時改變兩個子網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),提取圖像特征。

孿生神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖

在基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)的選擇上,本文參考了VggNet的層次結(jié)構(gòu),將其設(shè)置為孿生神經(jīng)網(wǎng)絡(luò)的子網(wǎng)絡(luò)。為了提升網(wǎng)絡(luò)性能,本團(tuán)隊在更改VggNet網(wǎng)絡(luò)參數(shù)的同時,還在此網(wǎng)絡(luò)的部分卷積層之間添加了殘差塊(跳遠(yuǎn)鏈接)結(jié)構(gòu),讓卷積核提取的信息可以直接從淺層傳輸?shù)缴顚?,從而降低了網(wǎng)絡(luò)的訓(xùn)練難度,特征提取效果變好,效率變高,網(wǎng)絡(luò)性能最終得到提升。

vgg網(wǎng)絡(luò)結(jié)構(gòu)

1.3 根據(jù)權(quán)威的人工抄襲判斷結(jié)果設(shè)置模型的輸入標(biāo)簽

利用孿生神經(jīng)網(wǎng)絡(luò)進(jìn)行原創(chuàng)設(shè)計特征提取后,還需完善模型,使之可以自主判斷兩個設(shè)計之間是否存在抄襲嫌疑。為了實現(xiàn)這一點,本系統(tǒng)對提取出的特征編碼值利用歐式距離進(jìn)行相似度的測量,將計算出的距離用sigmoid函數(shù)映射到0-1之間,尋找最優(yōu)的可以判定為抄襲的閾值。

由孿生神經(jīng)網(wǎng)絡(luò)提取出的形象特征比使用傳統(tǒng)的特征提取方法(如sift、hog)提取的特征更加符合人類的思維模式。但因神經(jīng)網(wǎng)絡(luò)運行過程的黑箱化,人類無法得知它的特征提取依據(jù),也無法理解提取特征之后得到的圖片編碼信息。為使得模型輸出的抄襲判定結(jié)果更加科學(xué)、更加符合人類的思維模式,本研究在訓(xùn)練模型時即采用監(jiān)督學(xué)習(xí)的模式,在輸入訓(xùn)練圖片的同時給予對應(yīng)的標(biāo)簽信息。為了提高標(biāo)簽信息的權(quán)威性,我們盡可能從國家知識產(chǎn)權(quán)局的公告信息中獲取判決信息,依據(jù)官方判決設(shè)置標(biāo)簽;此外,針對部門沒有判決信息的圖片數(shù)據(jù),還通過人工推理判斷的手段,將圖片打上標(biāo)簽,供機(jī)器學(xué)習(xí)。

2 創(chuàng)新點

2.1 引入數(shù)據(jù)清理模塊,并對用于訓(xùn)練的IP圖像數(shù)據(jù)進(jìn)行下采樣與灰度化處理

在實際采集數(shù)據(jù)進(jìn)行訓(xùn)練時,我們發(fā)現(xiàn)采集到的圖片質(zhì)量參差不齊,因此我們在將圖片納入訓(xùn)練集之前首先進(jìn)行一步數(shù)據(jù)清洗工作,將分辨率過低的圖片以及完全相同圖片的舍棄。之后,對清洗好的數(shù)據(jù)集統(tǒng)一進(jìn)行下采樣操作,確定圖像的興趣區(qū)域,將圖片的像素統(tǒng)一為一樣的尺寸,并將圖片進(jìn)行灰度化處理使其變?yōu)楹诎讏D片,降低了訓(xùn)練的難度。

2.2 采用孿生神經(jīng)網(wǎng)絡(luò)與殘差網(wǎng)絡(luò)結(jié)合的方式提高網(wǎng)絡(luò)性能

本項目訓(xùn)練了一個可以智能判斷圖片對之間是否存在抄襲現(xiàn)象的模型。其中,模型框架采用了孿生神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并且為了提升特征提取效果和優(yōu)化網(wǎng)絡(luò)性能,本研究在設(shè)計孿生神經(jīng)網(wǎng)絡(luò)的子網(wǎng)絡(luò)結(jié)構(gòu)的時候在VggNet原網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上調(diào)整了網(wǎng)絡(luò)參數(shù),并在層級之間增加了跳遠(yuǎn)鏈接結(jié)構(gòu)。經(jīng)過此種調(diào)整,網(wǎng)絡(luò)的性能得到了提升。

2.3 根據(jù)權(quán)威的抄襲判斷結(jié)果設(shè)置圖片標(biāo)簽

在常規(guī)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練任務(wù)中,圖片數(shù)據(jù)集的來源一般是互聯(lián)網(wǎng)上的開源數(shù)據(jù)集,標(biāo)簽的設(shè)置也是依據(jù)原有數(shù)據(jù)集提供的信息,而不是人工手動判斷。為了使得模型訓(xùn)練結(jié)果與人類的思維模式更為貼近,本研究在設(shè)置標(biāo)簽時根據(jù)官方判決文書以及人眼手工判斷給圖片打上標(biāo)簽,從而使得模型的判斷效果更加好。

3 總結(jié)

本文利用原創(chuàng)設(shè)計數(shù)據(jù)進(jìn)行實驗,在考慮模擬人類思維進(jìn)行智能商標(biāo)查重問題的基礎(chǔ)上,提出了一種新型的抄襲判斷模式。通過搭建孿生卷積神經(jīng)網(wǎng)絡(luò),最終訓(xùn)練出一個可以有效提取商標(biāo)特征信息的網(wǎng)絡(luò)模型。

實驗結(jié)果表明,在網(wǎng)絡(luò)的卷積層之間增加殘差結(jié)構(gòu),不僅能夠顯著減少模型收斂速度,同時還能在一定程度上提高模型的判斷準(zhǔn)確率。由此可見,在面對淺層網(wǎng)絡(luò)不足以擬合整個樣本空間時,可以考慮在加深網(wǎng)絡(luò)層數(shù)的同時構(gòu)建一些殘差模塊,以提高模型效果。

針對本模型未來的發(fā)展方向,目前大致有三條路線:第一是更改網(wǎng)絡(luò)結(jié)構(gòu),尋求可以更好擬合整個樣本空間的網(wǎng)絡(luò)。第二條便是擴(kuò)充數(shù)據(jù)集,提高數(shù)據(jù)集質(zhì)量,優(yōu)化圖片預(yù)處理方法。第三條便是在原有基礎(chǔ)上,更改網(wǎng)絡(luò)參數(shù)或選取另外的損失函數(shù)或距離度量方式。但是這種方法對于模型效果的提高并沒有前兩種方法顯著。總而言之,如果本算法進(jìn)一步優(yōu)化,相信在準(zhǔn)確率上一定會有提高。

猜你喜歡
特征提取標(biāo)簽神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
基于Daubechies(dbN)的飛行器音頻特征提取
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
Bagging RCSP腦電特征提取算法
標(biāo)簽化傷害了誰
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于多進(jìn)制查詢樹的多標(biāo)簽識別方法
基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定