蔣麗麗+于翔
【摘要】 非物質(zhì)文化遺產(chǎn)保護(hù)已經(jīng)進(jìn)入數(shù)字化時(shí)代。國(guó)家和許多省在非物質(zhì)文化遺產(chǎn)數(shù)字化保護(hù)方面做了大量的工作和深度挖掘,但大多數(shù)仍處于探索發(fā)展階段,如何更好地利用先進(jìn)的基于內(nèi)容的數(shù)據(jù)庫(kù)技術(shù)以及相關(guān)數(shù)字化技術(shù)為非物質(zhì)文化遺產(chǎn)提供保護(hù)與傳承工作,仍需不停的探索與實(shí)踐。
【關(guān)鍵詞】 非物質(zhì)文化遺產(chǎn)傳承 數(shù)字化技術(shù) 圖像數(shù)據(jù)庫(kù)
引言
藍(lán)印花布已于2006年5月經(jīng)國(guó)務(wù)院批準(zhǔn)列入第一批國(guó)家級(jí)非物質(zhì)文化遺產(chǎn)名錄。本文通過(guò)研究探討了基于內(nèi)容的圖像數(shù)據(jù)庫(kù)技術(shù)以及相關(guān)數(shù)字化技術(shù)在非物質(zhì)文化遺產(chǎn)保護(hù)與傳承中的開(kāi)發(fā)與運(yùn)用,在利用基于內(nèi)容的圖像數(shù)據(jù)庫(kù)技術(shù)在傳統(tǒng)非物質(zhì)文化遺產(chǎn)保護(hù)方式方面實(shí)現(xiàn)突破,更加有效地提高了非物質(zhì)文化遺產(chǎn)的展示效果及保真效果,并為安全和長(zhǎng)久地保護(hù)與傳承該非物質(zhì)文化遺產(chǎn)邁出探索的一步。
一、應(yīng)用背景
非物質(zhì)文化遺產(chǎn)具有地域性強(qiáng),受眾群體小,傳播范圍小、受眾面窄等特點(diǎn),且多以傳統(tǒng)傳播方式為主,多數(shù)是望“數(shù)字化”興嘆![1]例如,南通藍(lán)印花布的主要傳承人吳元新教授通過(guò)多年的努力,整理收藏明清以來(lái)的上萬(wàn)件實(shí)物及圖片資料以及紋樣紙版,并以此出版了《中國(guó)藍(lán)印花布紋樣大全》。但是數(shù)量巨大的藍(lán)印花布的圖案紋樣,紋樣繁復(fù),內(nèi)容豐富,利用文本很難準(zhǔn)確描述其內(nèi)容;同時(shí),藍(lán)印花布分布廣泛,很多紋樣經(jīng)過(guò)長(zhǎng)時(shí)間保存后破損嚴(yán)重,傳統(tǒng)的保護(hù)方式給藍(lán)印花布的收集、整理以及傳承造成極大地?fù)p失。如何通過(guò)數(shù)字化技術(shù)手段對(duì)非物質(zhì)文化遺產(chǎn)進(jìn)行真實(shí)、系統(tǒng)和全面的整理、收集、記錄及處理非物質(zhì)文化遺產(chǎn)的信息,并利用先進(jìn)的模式識(shí)別、數(shù)據(jù)庫(kù)等技術(shù)為其建立圖像數(shù)據(jù)庫(kù),即是本文所闡述的主要內(nèi)容。
眾所周知,隨著計(jì)算技術(shù)的發(fā)展以及計(jì)算機(jī)硬件性能的提高,模式識(shí)別、人工智能、數(shù)據(jù)挖掘以及圖像處理等研究領(lǐng)域的發(fā)展也取得了長(zhǎng)足的進(jìn)步,促使利用計(jì)算機(jī)數(shù)據(jù)庫(kù)管理系統(tǒng)管理圖像變得十分必要。然而,目前圖像數(shù)據(jù)庫(kù)的開(kāi)發(fā)與建設(shè)方面存在以下不足:1、 針對(duì)圖像數(shù)據(jù)的描述不能方便的隨意擴(kuò)展,使其不能滿足基于圖像數(shù)據(jù)的科學(xué)研究對(duì)圖像數(shù)據(jù)描述特征屬性多樣性的需求;2、 影像圖像數(shù)據(jù)的存儲(chǔ)以及編號(hào)不能反映圖像數(shù)據(jù)之間的關(guān)聯(lián)性,比如不同時(shí)間點(diǎn)或者不同圖像采集模式所得到的圖像數(shù)據(jù)之間的關(guān)系,不能很好的得到體現(xiàn);3、圖像數(shù)據(jù)在服務(wù)器上的上傳和下載過(guò)程都在服務(wù)器端完成,這種設(shè)計(jì)增加了服務(wù)器端的負(fù)擔(dān),影響了針對(duì)數(shù)據(jù)倉(cāng)庫(kù)的上傳、檢索和下載速度。
通過(guò)對(duì)大量藍(lán)印花布圖案紋樣的分析、研究,針對(duì)其特點(diǎn)以及南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)設(shè)計(jì)需求,提出利用數(shù)據(jù)庫(kù)等先進(jìn)管理理念及信息化、數(shù)字化等技術(shù)手段對(duì)非物質(zhì)文化遺產(chǎn)----“藍(lán)印花布”開(kāi)發(fā),實(shí)現(xiàn)一種新的基于內(nèi)容的、可擴(kuò)展、高效存儲(chǔ)、可檢索的、以顏色信息為主形狀信息為輔的藍(lán)印花布圖案紋樣綜合檢索數(shù)據(jù)庫(kù)系統(tǒng),從而實(shí)現(xiàn)對(duì)藍(lán)印花布紋樣的保護(hù)與傳承。該系統(tǒng)不但可以真實(shí)地再現(xiàn)藍(lán)印花布的制作及其工藝流程;而且還可以利用數(shù)字化后的藍(lán)印花布紋樣進(jìn)行虛擬重組、修改,實(shí)現(xiàn)大眾的個(gè)性化需求,并通過(guò)現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)以及先進(jìn)的信息處理技術(shù)讓藍(lán)印花布及其所攜帶的文化信息在世界各地流傳,被越來(lái)越多的人所接受和喜愛(ài)。
二、南通藍(lán)印花布紋樣的數(shù)字化
2.1 數(shù)字化技術(shù)
數(shù)字化技術(shù)是一種信息處理技術(shù),即將許多復(fù)雜多變的信息轉(zhuǎn)變?yōu)榭梢远攘康臄?shù)字、數(shù)據(jù),再以這些數(shù)字、數(shù)據(jù)建立起適當(dāng)?shù)臄?shù)字化模型,把它們轉(zhuǎn)變?yōu)橐幌盗锌梢赃M(jìn)入計(jì)算機(jī)的二進(jìn)制代碼的技術(shù)。數(shù)字化技術(shù)是計(jì)算機(jī)技術(shù)、多媒體技術(shù)、智能技術(shù)和信息傳播技術(shù)的基礎(chǔ)。[2]
2.1.1 南通藍(lán)印花布紋樣的數(shù)字化采集
本文以南通藍(lán)印花布的紋樣為研究對(duì)象,利用數(shù)碼相機(jī)采集其數(shù)字化圖像,采集后的效果完全能滿足實(shí)驗(yàn)要求。
2.1.2 南通藍(lán)印花布紋樣的數(shù)字化預(yù)處理
藍(lán)印花布只有藍(lán)白兩色,因此,針對(duì)南通藍(lán)印花布紋樣這個(gè)顯著特點(diǎn),對(duì)其數(shù)字化圖像進(jìn)行相應(yīng)的預(yù)處理,例如灰度化處理,就是采用加權(quán)值法與最大值法結(jié)合的特點(diǎn),并經(jīng)大量試驗(yàn)后確定采用如下公式進(jìn)行灰度化處理:
鑒于不同藍(lán)印花布藏品其成色、磨損及其它原因,在對(duì)其顏色進(jìn)行數(shù)字化時(shí),確定藍(lán)印花布紋樣數(shù)字化顏色標(biāo)準(zhǔn)為:藍(lán)色RGB值{29,33,70}、白色RGB值{251,255,255}。
2.1.3 南通藍(lán)印花布數(shù)字化紋樣的提取
圖像分割是提取南通藍(lán)印花布數(shù)字化紋樣的基礎(chǔ)。國(guó)內(nèi)外廣泛使用的圖像分割方法主要有閾值分割、基于變形模型分割、基于區(qū)域生長(zhǎng)分割、聚類法分割等等。[1]不同圖像對(duì)象,其圖像分割的分類依據(jù)也不同,與之對(duì)應(yīng)的分割算法也完全不同。針對(duì)藍(lán)印花布具有明顯藍(lán)色顏色優(yōu)勢(shì)的特點(diǎn),通過(guò)大量實(shí)驗(yàn),并綜合比較上述幾個(gè)分割算法后,確定了通過(guò)加權(quán)值將基于閾值的分割算法及基于邊緣檢測(cè)的分割算法相結(jié)合來(lái)分割藍(lán)印花布紋樣的最終解決方案。其效果如圖1所示:
三、基于內(nèi)容的南通藍(lán)印花布紋樣數(shù)據(jù)庫(kù)的開(kāi)發(fā)與實(shí)現(xiàn)
基于內(nèi)容的數(shù)據(jù)庫(kù)不僅能對(duì)數(shù)據(jù)庫(kù)內(nèi)容提供增、刪、改、查等功能,而且還能實(shí)現(xiàn)數(shù)據(jù)庫(kù)內(nèi)容整理、整合等操作。而南通藍(lán)印花布紋樣不但內(nèi)容復(fù)雜多樣,而且數(shù)量眾多。因此,如何高效地利用圖像數(shù)據(jù)庫(kù)對(duì)這些海量紋樣進(jìn)行整理、收集,是本文重點(diǎn)闡述的內(nèi)容。而如何實(shí)現(xiàn)南通藍(lán)印花布紋樣的識(shí)別,則是實(shí)現(xiàn)基于內(nèi)容的南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)的關(guān)鍵。通過(guò)分析,確定顏色特征和形狀特征能有效區(qū)分南通藍(lán)印花布紋樣,高效提取這兩種特征對(duì)于實(shí)現(xiàn)基于內(nèi)容的藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)至關(guān)重要。
本文在JAVA EE 框架上,利用Opencv機(jī)器視覺(jué)庫(kù)與MySql數(shù)據(jù)庫(kù)相結(jié)合,開(kāi)發(fā)、實(shí)現(xiàn)基于內(nèi)容的南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)。
3.1 JAVA EE框架下OpenCV環(huán)境的搭建
實(shí)現(xiàn)基于內(nèi)容的藍(lán)印花布紋樣圖像檢索系統(tǒng),將JAVA EE框架結(jié)構(gòu)與OpenCV結(jié)合,不僅能對(duì)數(shù)據(jù)庫(kù)的圖像數(shù)據(jù)進(jìn)行管理,而且還滿足處理數(shù)據(jù)庫(kù)中的圖像信息的要求。另外,JAVA EE的MVC也為用戶提供良好的用戶界面。
3.2 藍(lán)印花布紋樣的特征提取
圖像特征的提取與表達(dá)是CBIR技術(shù)的基礎(chǔ)和核心技術(shù)。最客觀的圖像信息模型主要是以圖像低級(jí)特征為主,如顏色、形狀、紋理與空間關(guān)系等。基于內(nèi)容的圖像視覺(jué)信息主要有圖像信息的低級(jí)特征以及圖像內(nèi)容的語(yǔ)義描述兩部分。[3] 本文主要以顏色特征的提取與匹配為研究對(duì)象開(kāi)展研究。圖像特征的提取是基于內(nèi)容圖像檢索的基礎(chǔ),如何構(gòu)建反映適當(dāng)圖像內(nèi)容的特征是進(jìn)行圖像檢索的關(guān)鍵技術(shù)之一。[4]其中顏色特征因?yàn)楹蛨D像中所包含的物體或場(chǎng)景十分相關(guān),對(duì)圖像本身的大小、方向的不敏感且具有較強(qiáng)的魯棒性等特征在圖像檢索中應(yīng)用成為最為廣泛的圖像特征之一。[5]大量實(shí)驗(yàn)表明,南通藍(lán)印花布圖像紋樣的數(shù)字化研究中采用HSV顏色空間非均勻量化后提取直方圖,不但具有效率上的明顯優(yōu)勢(shì),還可以明顯降低噪聲對(duì)顏色的影響。[6]
3.3 圖像數(shù)據(jù)庫(kù)的檢索
基于內(nèi)容的圖像檢索CBIR是一種利用近似匹配技術(shù)實(shí)現(xiàn)利用圖像可視特征對(duì)圖像進(jìn)行檢索的技術(shù),其包括計(jì)算機(jī)視覺(jué)、圖像處理、圖像理解、人工智能、數(shù)據(jù)庫(kù)等多領(lǐng)域的技術(shù)成果。[3]其最主要特點(diǎn)是直接以媒體內(nèi)容為檢索信息線索,通過(guò)計(jì)算機(jī)的計(jì)算實(shí)現(xiàn)對(duì)圖像內(nèi)容的分析、特征提取以及索引,并采取某種相似性度量方法對(duì)圖像庫(kù)中的圖像進(jìn)行匹配獲得查詢結(jié)果。通過(guò)該技術(shù)可以有效避免人工描述的主觀性,并且大題減少人力物力。[7] 圖像特征的有效提取以及高效匹配是CBIR的的實(shí)現(xiàn)主要關(guān)鍵技術(shù)點(diǎn)。 [7]
利用OpenCV機(jī)器視覺(jué)庫(kù)的相關(guān)技術(shù),對(duì)藍(lán)印花布紋樣的數(shù)字化圖像在四種不同的相似距離下計(jì)算出相似度距離并進(jìn)行比對(duì)、分析,研究后確定采用correlation相似距離作為南通藍(lán)印花布顏色直方圖相似度計(jì)算的標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)南通藍(lán)印花布紋樣圖像特征的有效匹配。[8]
3.4基于內(nèi)容的南通藍(lán)印花布紋樣圖像檢索系統(tǒng)結(jié)構(gòu)圖
基于內(nèi)容的南通藍(lán)印花布紋樣圖像檢索系統(tǒng)是利用OpenCV機(jī)器視覺(jué)庫(kù)及相關(guān)技術(shù),對(duì)藍(lán)印花布紋樣的數(shù)字化圖像在四種不同的相似距離下計(jì)算出相似度距離并進(jìn)行比對(duì)、分析,研究后確定采用correlation相似距離作為南通藍(lán)印花布顏色直方圖相似度計(jì)算的標(biāo)準(zhǔn)來(lái)實(shí)現(xiàn)南通藍(lán)印花布紋樣圖像特征的有效匹配。該檢索系統(tǒng)架構(gòu)圖如圖2所示。系統(tǒng)運(yùn)行實(shí)際效果圖如圖3所示。
3.5 基于內(nèi)容的南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)圖
南通藍(lán)印花布紋樣不但復(fù)雜多樣,而且數(shù)量眾多。有效地對(duì)這些海量紋樣進(jìn)行鑒別、整理、管理,是項(xiàng)目重點(diǎn)要解決的問(wèn)題?;趦?nèi)容的數(shù)據(jù)庫(kù)不僅能對(duì)數(shù)據(jù)庫(kù)內(nèi)容提供增、刪、改、查等功能,而且還能實(shí)現(xiàn)數(shù)據(jù)庫(kù)內(nèi)容整理、整合等操作。因此,基于內(nèi)容的數(shù)據(jù)庫(kù)系統(tǒng)是解決該問(wèn)題的有效方法。通過(guò)分析,利用專利《南通藍(lán)印花布識(shí)別方法》,并在JAVA EE 框架上,通過(guò)Opencv機(jī)器視覺(jué)庫(kù)與MySql數(shù)據(jù)庫(kù)相結(jié)合,開(kāi)發(fā)、實(shí)現(xiàn)基于內(nèi)容的南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)系統(tǒng)架構(gòu)圖如圖4所示:
3.6 基于內(nèi)容的南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)的實(shí)現(xiàn)
搭建好JAVA EE環(huán)境后,將Opencv的java庫(kù)導(dǎo)入其中,實(shí)現(xiàn)JAVA EE與OpenCv的結(jié)合,并在系統(tǒng)中完成基于內(nèi)容的南通藍(lán)印花布紋樣圖像數(shù)據(jù)庫(kù)的開(kāi)發(fā)與實(shí)現(xiàn),其效果圖如圖5所示:
四、結(jié)論
在JAVA EE的編程環(huán)境下,利用機(jī)器視覺(jué)庫(kù)OpenCV及Mysql數(shù)據(jù)庫(kù)對(duì)南通藍(lán)印花布紋樣分別進(jìn)行圖像的預(yù)處理、分割、相似度計(jì)算等一系列實(shí)驗(yàn),并最終確定采用一系列實(shí)驗(yàn)結(jié)果,成功地開(kāi)發(fā)實(shí)現(xiàn)了一種新的基于內(nèi)容的、可擴(kuò)展、高效存儲(chǔ)、檢索的,以顏色信息為主以形狀信息為輔的藍(lán)印花布圖案紋樣綜合檢索系統(tǒng)及數(shù)據(jù)庫(kù)存儲(chǔ)系統(tǒng),實(shí)現(xiàn)了從數(shù)字化角度對(duì)藍(lán)印花布紋樣進(jìn)行保護(hù)與傳承。
參 考 文 獻(xiàn)
[1] 王耀希:《民族文化遺產(chǎn)數(shù)字化》,北京:人民出版社,2009年版,第9頁(yè)
[2]http://www.cssn.cn/gd/gd_rwhn/gd_gdxc/201508/t20150820_2127996.shtml
[3] 李明俐. 基于顏色與形狀特征的圖像檢索技術(shù)研究及系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) [D]. 西北大學(xué).2010:8-32.
[4] 袁杰.基于內(nèi)容的綜合多特征圖像檢索方法研究[D].杭州:浙江師范大學(xué):2009:17-33.
[5]翟劍鋒.基于多特征的圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) [D].北京:北京郵電大學(xué):2010:7-11.
[6]于翔.沈美 顏色相似度在南通藍(lán)印花布圖像檢索中的應(yīng)用研究 [J]青海大學(xué)學(xué)報(bào)(自然科學(xué)版型):2014.8 48-52
[7] Yoo H.W.,Jang D.S.,Juang S.H.,etal.Visual information retrieval System via content-based approach [J]. Pattern Recognition,2002,35:749-769
[8]沈美 于翔 基于內(nèi)容的南通藍(lán)印花布圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)----JAVA EE框架下的圖像相似度研究 [J]科技視界 2014(35)28~31
[9] 孟繁杰,郭寶龍. CBIR關(guān)鍵技術(shù)研究[j]計(jì)算機(jī)應(yīng)用與研究.2004:21-27