吳旭東 葉虹 黃毅能
摘要:本文首先提出鑒別古陶瓷的一些常見(jiàn)方法,分析了數(shù)據(jù)處理方法用于古陶瓷鑒定現(xiàn)狀,然后提出了運(yùn)用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)算法鑒別古陶瓷,基于傳統(tǒng)的目測(cè)法對(duì)明清古陶瓷底款進(jìn)行鑒別的不足,提出了運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)算法對(duì)明清古陶瓷底款進(jìn)行分類(lèi)和模式識(shí)別,取得了良好的效果,為人工智能在古陶瓷鑒別領(lǐng)域的應(yīng)用開(kāi)辟了新的思路。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);古陶瓷鑒定
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)32-0208-02
在古陶瓷的鑒定過(guò)程中,產(chǎn)品的斷源、斷代的鑒別一直是最重要也是技術(shù)難度最高的事情。自古以來(lái)才有的主要方法是“目測(cè)法”,此法主要依靠鑒定人依靠長(zhǎng)期積累下來(lái)的經(jīng)驗(yàn)來(lái)判斷,以陶瓷的外部特征為主(如外形、紋飾、胎釉、款式等)來(lái)識(shí)別。由于受鑒別者主觀(guān)判別因素影響較大,針對(duì)同一器皿,不同的人有不同的說(shuō)法,可謂“智者見(jiàn)智,仁者見(jiàn)仁”。此時(shí)一種科學(xué)、規(guī)范的鑒定方法顯得尤為重要了,通過(guò)古陶瓷的原材料,不同地域的原材料表現(xiàn)的不同化學(xué)和礦物質(zhì)特征來(lái)判別是非常重要的。
近年來(lái),隨著信息技術(shù)的飛速發(fā)展,科學(xué)的數(shù)據(jù)處理分析和算法在各行各業(yè)都得到了普及。越來(lái)越多的數(shù)據(jù)處理方法在古陶瓷斷源斷代的研究領(lǐng)域中開(kāi)始了應(yīng)用,其中較為傳統(tǒng)的是SVM支持向量機(jī)分類(lèi)法和多元統(tǒng)計(jì)分析法在當(dāng)今使用較為普及。而神經(jīng)網(wǎng)絡(luò)算法采用的是自動(dòng)學(xué)習(xí)并且無(wú)須明確單位數(shù)學(xué)表達(dá)式的特點(diǎn),在古陶瓷的研究和鑒別當(dāng)中也逐漸發(fā)展起來(lái),發(fā)展前景非常廣闊。
因此,本文試圖通過(guò)對(duì)青花瓷的鑒別分析,利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)算法運(yùn)用于古陶瓷鑒別中,采用人工智能較流行的軟件tensorflow,谷歌公司的神經(jīng)網(wǎng)絡(luò)算法,建立相應(yīng)的數(shù)學(xué)模型,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)算法對(duì)明清古陶瓷進(jìn)行分類(lèi)與模式識(shí)別,為古陶瓷的研究提供科學(xué)依據(jù)和參考價(jià)值。
1 卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
1.1 邊界檢測(cè)示例
如果我們有一張黑白的圖片,人眼看的話(huà)可以很清楚地看到人,想讓計(jì)算機(jī)去搞清楚這張照片上具體有哪些物體,可以做的事情是檢測(cè)圖像的垂直邊緣和水平邊緣。
垂直邊緣指圖片的豎直欄桿比較清楚、明顯,另外是水平的邊緣指欄桿的扶把手比較清晰,把圖片直觀(guān)的理解轉(zhuǎn)化為矩陣。假設(shè)我們有個(gè)灰度圖片(黑白圖片),大小為6*6像素,6*6*1的矩陣表示(如果是彩色照片,彩色有RGB三個(gè)通道,圖片便會(huì)是6*6*3的矩陣)。為了檢測(cè)圖片的垂直邊緣,可以構(gòu)建一個(gè)3*3的矩陣,稱(chēng)為過(guò)濾器/卷積核(filer/kernel)。3*3的過(guò)濾器/卷積核對(duì)6*6圖片進(jìn)行卷積運(yùn)算。讓過(guò)濾器在圖像上逐步滑動(dòng),對(duì)整個(gè)圖像進(jìn)行卷積計(jì)算得到一個(gè)4*4的圖像/矩陣。這種卷積計(jì)算可以得到圖像的邊緣,6*6*1的矩陣,0表示圖像暗色區(qū)域,10位圖像比較亮的區(qū)域,同樣用一個(gè)3*3過(guò)濾器,對(duì)圖像進(jìn)行卷積,卷積運(yùn)算得到的圖像中間亮,兩邊暗,亮色區(qū)域就對(duì)應(yīng)圖像邊緣。
1.2 卷積與過(guò)濾器
常見(jiàn)的過(guò)濾器包括:垂直過(guò)濾器、水平過(guò)濾器、Sobel過(guò)濾器和Scharr過(guò)濾器。卷積神經(jīng)網(wǎng)絡(luò)中把過(guò)濾器當(dāng)成需要學(xué)習(xí)的參數(shù),卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的目標(biāo)就是去理解過(guò)濾器的參數(shù)。
Padding:假設(shè)輸入的原始圖像大小為n*n,過(guò)濾器大小為f*f,則輸出圖像大小則為(n-f+1)*(n-f+1)。這樣做卷積運(yùn)算的缺點(diǎn)有兩個(gè),一個(gè)是卷積圖像的大小會(huì)不斷縮??;另一個(gè)是丟掉了很多圖像邊緣的信息。為了解決以上問(wèn)題我們就引入擴(kuò)充(padding)操作,在進(jìn)行卷積操作前,沿著圖像邊緣用0進(jìn)行圖像填充。對(duì)于3*3的過(guò)濾器,填充寬度為1時(shí),能夠保證輸出圖像和輸入圖像一樣大。
Padding的包括Valid與Same兩種模式:Valid:No padding,不進(jìn)行padding操作。輸入圖像n*n,過(guò)濾器f*f,輸出圖像大小為;(n-f+1)/(n-f+1);Same:進(jìn)行padding操作,輸出圖像和輸入圖像大小一致。卷積步長(zhǎng)(strides)一般是指過(guò)濾器在圖像上滑動(dòng)的距離,一般為1或者2。之前的例子中,卷積步長(zhǎng)都是1。與前面不同,我們假設(shè)卷積步長(zhǎng)為2。
帶有padding和stride進(jìn)行圖像卷積運(yùn)算,運(yùn)算后的圖像大小:彩色圖像(RGB)的卷積;過(guò)濾器就變?yōu)?*3*3,最后的3對(duì)應(yīng)為通道數(shù)channels/深度depth。原始圖片:大小為6*6,但是由于有R/G/B三種;所以圖片總大小時(shí)6*6*3。
1.3 幾種CNN算法
在以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的經(jīng)典算法包括Lenet、Alexnet、Googlenet 、VGG、深度殘差網(wǎng)絡(luò)和SqueezeNet模型,其中AlexNet是2012年ImageNet項(xiàng)目的大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)(ILSVRC)中的勝出者。AlexNet解決了圖像分類(lèi)的問(wèn)題,輸入是1000個(gè)不同類(lèi)型圖像(如貓、狗等)中的一個(gè)圖像,輸出是1000個(gè)數(shù)字的矢量。輸出向量的第i個(gè)元素即為輸入圖像屬于第i類(lèi)圖像的概率。因此,輸出向量的所有元素之和為1。輕量化網(wǎng)絡(luò):SqueezeNet,以更少的參數(shù)實(shí)現(xiàn)AlexNet相同的精度。
2 卷積神經(jīng)網(wǎng)絡(luò)運(yùn)用于古陶瓷智能鑒定
2.1 卷積神經(jīng)網(wǎng)絡(luò)運(yùn)用于明清古陶瓷底款鑒定
CNN模型中最關(guān)鍵實(shí)現(xiàn)的部分是卷積模塊,還包括激活、池化、全連接、Dropout等。本研究借助Tensorflow工具可以快速建立序列逐層的模型結(jié)構(gòu)。
本文在數(shù)據(jù)集中提供的部分底款文字包括(主要訓(xùn)練驗(yàn)證“大”“明”“清”“康”“熙”“宣”“德”“年”“制”,漢字共九個(gè)底款),不需要區(qū)分字體。
程序過(guò)程如下:古陶瓷訓(xùn)練集合:2145張圖片,數(shù)據(jù)集類(lèi)別9類(lèi)。驗(yàn)證集:528張圖片,數(shù)據(jù)集類(lèi)別9類(lèi)。選擇方案如下:訓(xùn)練樣本1900張;驗(yàn)證樣本500張;訓(xùn)練次數(shù)30次;批尺寸24。最終訓(xùn)練結(jié)果:訓(xùn)練集準(zhǔn)確率87.36%,驗(yàn)證集準(zhǔn)確率95.82%。通過(guò)提高訓(xùn)練次數(shù)與批尺寸的參數(shù)值,增加了訓(xùn)練的時(shí)間,同時(shí)也提高了準(zhǔn)確率。
2.2 基于青花、粉彩、斗彩底款文字釉色分析
訓(xùn)練集:1679張圖片,數(shù)據(jù)集類(lèi)別3類(lèi)。驗(yàn)證集:292張圖片,數(shù)據(jù)集類(lèi)別3類(lèi)。參數(shù)初始值:訓(xùn)練樣本1600張圖片;驗(yàn)證樣本290張圖片;訓(xùn)練次數(shù)30次;批尺寸24。訓(xùn)練集中,對(duì)斗彩、青花、粉彩進(jìn)行分類(lèi),對(duì)明清青花瓷底款的訓(xùn)練模型采用CNN原生模型,其中粉彩數(shù)據(jù)集的兩個(gè)卷積特征圖如圖4所示。
2.3 真假特征
組合真假德、年等字明顯特征,來(lái)鑒別底款文字的真假。年字特征:“年”字第四筆左斜。德字特征:一般情況下中間的一“橫”會(huì)省略不寫(xiě)。特征十分明顯,采用原生CNN算法模型,能夠很好地區(qū)分釉色和真假字的鑒別。
3 結(jié)論
本文借鑒古陶瓷鑒定中比較經(jīng)典的目測(cè)底款文字的方法,利用深度學(xué)習(xí)中的CNN卷積神經(jīng)網(wǎng)絡(luò)算法成功地將明、清陶瓷進(jìn)行分類(lèi)和訓(xùn)練并最終識(shí)別。實(shí)驗(yàn)中采用的AlexNet與SqueezeNet兩種算法,均取得了不錯(cuò)的效果。實(shí)驗(yàn)表明利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)明清古陶瓷底款的鑒定取得了一定的成效;雖然目前只是個(gè)初步探索階段,但對(duì)于古陶瓷的科技鑒定來(lái)說(shuō)卻有這深遠(yuǎn)的影響,把古陶瓷鑒定與最近興起的人工智能AI領(lǐng)域緊密地聯(lián)系在一起,為當(dāng)今魚(yú)目混珠的古陶瓷鑒定的市場(chǎng)提供一定的科學(xué)支持。從國(guó)內(nèi)外未來(lái)的發(fā)展趨勢(shì)來(lái)看,人工智能將會(huì)大量應(yīng)用于人類(lèi)社會(huì)的各個(gè)領(lǐng)域,可以肯定的是古陶瓷鑒別或鑒賞這一古老的學(xué)科領(lǐng)域必然會(huì)出現(xiàn)一大批人工智能的研究成果,這樣本文對(duì)于卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于這一古老的學(xué)科領(lǐng)域具有積極的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] 吳雋,羅宏杰,李家治.中國(guó)古陶瓷的斷源斷代[J].硅酸鹽學(xué)報(bào),2007,35(81):39-42.
[2] 秦諱晗,柳炳祥,彭文.一種基于粗糙集神經(jīng)網(wǎng)絡(luò)的陶瓷原料分類(lèi)方法[J].陶瓷學(xué)報(bào),2010 ,23(4):136-139.
[3] 王強(qiáng).基于CNN的字符識(shí)別方法研究[D].天津師范大學(xué),2014.
[4] 艾玉庭.景德鎮(zhèn)青花瓷的發(fā)色及鑒別[J].中國(guó)陶瓷,2005,41(6):58-63.
【通聯(lián)編輯:聞翔軍】