潘 燕
(福建農(nóng)業(yè)職業(yè)技術(shù)學(xué)院 福建 福州 350007)
目前,在可視化數(shù)據(jù)挖掘工作中,以傳統(tǒng)的方式并不能對諸多數(shù)據(jù)信息進(jìn)行挖掘。例如針對地質(zhì)體來講,其特點(diǎn)即為不規(guī)則、不連續(xù)且資料有限等,這時(shí)就可以借助三維建模技術(shù)來真實(shí)體現(xiàn)出地下的地質(zhì)體,既可以描述地質(zhì)構(gòu)造與屬性特點(diǎn)以及分布情況等,還可以在實(shí)現(xiàn)地質(zhì)數(shù)據(jù)三維可視化的基礎(chǔ)上,便于更加真實(shí)、直觀和形象地進(jìn)行現(xiàn)象分析,進(jìn)一步說明了三維建模不僅是為了模型的可視化效果,更重要的是為了在此基礎(chǔ)上能夠充分利用各類隱藏在數(shù)據(jù)中的知識。
科學(xué)計(jì)算可視化,在過程中可以運(yùn)用計(jì)算機(jī)圖形學(xué)與圖像處理技術(shù)將已經(jīng)產(chǎn)生的數(shù)據(jù)和數(shù)據(jù)計(jì)算結(jié)果轉(zhuǎn)變成圖像進(jìn)行展示。計(jì)算科學(xué)化的含義已經(jīng)得到了拓展,既包含了科學(xué)計(jì)算數(shù)據(jù)可視化,同時(shí)還包含了工程計(jì)算數(shù)據(jù)的可視化,例如有限元分析的結(jié)果[1],另外,還包含了測量數(shù)據(jù)的可視化,可以將其運(yùn)用到醫(yī)療領(lǐng)域中,保障斷層掃描或核磁共振數(shù)據(jù)的可視化,這也是可視化領(lǐng)域需要重點(diǎn)研究的課題。
數(shù)據(jù)挖掘可視化技術(shù)主要是尋找與分析數(shù)據(jù)庫,并且找出數(shù)據(jù)庫中有用的信息或潛在需要的信息過程,之后以直觀的方式呈現(xiàn)信息模式與數(shù)據(jù)之間的關(guān)聯(lián)。這種可視化的數(shù)據(jù)挖掘方法可以為決策人員深入分析數(shù)據(jù)關(guān)系[2]。模型是數(shù)據(jù)挖掘可視化的重要體現(xiàn),模型可視化方法與數(shù)據(jù)挖掘運(yùn)用的算法有一定的關(guān)聯(lián),如決策算法可以運(yùn)用三維建模方式來加以體現(xiàn),在過程中可視化可以通過立體圖形來體現(xiàn)知識發(fā)現(xiàn)過程,數(shù)據(jù)挖掘可視化技術(shù)屬于一種輔助方式,其運(yùn)用直觀的圖形方式將數(shù)據(jù)進(jìn)行呈現(xiàn),全面拓展了數(shù)據(jù)的表達(dá)與理解力,在數(shù)據(jù)深度挖掘方面有著十分重要的促進(jìn)作用,在發(fā)展中受到了廣泛關(guān)注和重視。
另外,三維建模與可視化工具在數(shù)據(jù)準(zhǔn)備階段的重要性相對明顯,在建模完成之后就可以直接對數(shù)據(jù)信息進(jìn)行分析,因?yàn)槿S形態(tài)有著直觀且可視化優(yōu)勢,同時(shí)還能夠在計(jì)算機(jī)中進(jìn)行體現(xiàn),在圖形的幫助下就會直接找出數(shù)據(jù)關(guān)系和異常數(shù)據(jù),這是以往單一借助數(shù)據(jù)分析難以實(shí)現(xiàn)的。三維建??梢暬瘮?shù)據(jù)分析技術(shù)全面拓展了以往傳統(tǒng)的圖標(biāo)功能,數(shù)據(jù)分析和剖析也較為清晰且深入,可以全面且有效地體現(xiàn)出數(shù)據(jù)信息的內(nèi)在本質(zhì)。
從內(nèi)容角度分析,三維模型檢索技術(shù)主要分為以下兩類:
1)基于幾何的三維模型內(nèi)容檢索技術(shù)
從幾何角度來開展三維模型內(nèi)容檢索主要是應(yīng)用統(tǒng)計(jì)模型中的幾何分布,也可以借助幾何變化來使三維模型轉(zhuǎn)變成為一種定向信息,之后再將模型之間的相似性轉(zhuǎn)變成向量間的相似性。針對幾何變化方式來講,其主要是利用三維模型的空間信息再通過數(shù)學(xué)變化方式呈現(xiàn)出向量信息,相關(guān)學(xué)者[3]提出了3D離散傅里葉變化的相似性評價(jià)模式,在過程中應(yīng)在離散化給定的三維模型中得出體素化模型,然后運(yùn)用加權(quán)主元分析來對已經(jīng)給定的三維模型轉(zhuǎn)變坐標(biāo),再借助3D離散傅里葉變化描述三維模型形狀,最后通過相應(yīng)的范式來對三維模型間的相似性特征開展評價(jià)。通常來講,從幾何角度來提出數(shù)據(jù)信息和內(nèi)容較為便捷,相似性評價(jià)效率也可以得到全面提升,但需要事先對模型開展PCA預(yù)處理,如果PCA對齊存在問題,那么就會直接影響到幾何變換檢索效率。
2)基于拓?fù)涞娜S模型內(nèi)容檢索技術(shù)
因?yàn)閹缀涡畔㈦y以很好地描述幾何體型結(jié)構(gòu)中的信息,這樣就會導(dǎo)致兩個(gè)結(jié)構(gòu)較為相似的三維模型在幾何三維模型中難以實(shí)現(xiàn)有效檢索,相似度也會相對較差。結(jié)構(gòu)信息在CAD模型中的重要性較為明顯,而拓?fù)浣Y(jié)構(gòu)能夠反映出模型內(nèi)部單元的關(guān)聯(lián)關(guān)系,進(jìn)而體現(xiàn)出模型的本質(zhì)特征。在開展CAD設(shè)計(jì)時(shí),結(jié)構(gòu)需求也普遍大于幾何需求,為進(jìn)一步滿足這一需求,隨之出現(xiàn)了拓?fù)淙SCAD模型內(nèi)容檢索技術(shù)。
模型拓?fù)浣Y(jié)構(gòu)基本上都需要在計(jì)算機(jī)中借助圖形或樹形結(jié)構(gòu)來加以呈現(xiàn),其中樹形結(jié)構(gòu)較為簡單,且算法也更加及時(shí)有效。但需要注意是,樹形結(jié)構(gòu)所表達(dá)的信息量較少,難以全面滿足實(shí)際需要[4]。從這一角度分析,基于內(nèi)容檢索可以將模型通過圖的方式呈現(xiàn),每一個(gè)圖中的結(jié)點(diǎn)都屬于一個(gè)單元模型,結(jié)點(diǎn)關(guān)聯(lián)關(guān)系即為單元之間的關(guān)系,當(dāng)前,具有代表性的拓?fù)浞椒ㄖ饕獮橐韵聨最悾浩湟患礊榛趯傩脏徑訄D。屬性鄰接圖主要針對的模型即為B-Rep模型,在過程中可以將各個(gè)表面視為節(jié)點(diǎn),面之間的相鄰關(guān)系即為圖結(jié)構(gòu),模型表面屬性與邊屬性就是圖節(jié)點(diǎn)和邊的屬性。從CAD模型的B-Rep表示中提取出MSG是一種極具代表性的工作模式,隨之將MSG轉(zhuǎn)變成為特征向量,應(yīng)依照圖譜理論來將其劃分為多個(gè)較小子圖,最后再運(yùn)用高維數(shù)據(jù)索引技術(shù)來支撐高效檢索[5]。其二為Reeb圖。Reeb圖即為通過圖節(jié)點(diǎn)來體現(xiàn)模型空間中相同屬性值的聯(lián)系區(qū),同時(shí)使用圖邊來體現(xiàn)區(qū)域之間的相鄰關(guān)系,進(jìn)而構(gòu)成圖結(jié)構(gòu)。在過程中相關(guān)工作人員可以選擇不同的屬性函數(shù),然后將Reeb圖演化成為多個(gè)變種,基于積分測地距離的多分辨率Reeb圖三維模型檢索方式具有較強(qiáng)的代表性,其主要是以不同密度來對函數(shù)值進(jìn)行劃分,這樣就會產(chǎn)生諸多不同分辨率的Reeb圖,進(jìn)而節(jié)點(diǎn)之間的包含關(guān)系就可以確定成為父子關(guān)系,依照這種方式來開展層次式匹配,這對于三維模型有效識別有一定的幫助。
針對可視化數(shù)據(jù)挖掘工作來講,以往傳統(tǒng)的分析方式難以對海量數(shù)據(jù)進(jìn)行全面且有效地分析,并且也難以實(shí)現(xiàn)可視化,而將可視化技術(shù)與信息獲取以及分析技術(shù)進(jìn)行融合,就可以很好地幫助可視化數(shù)據(jù)挖掘工作有序開展[6]。但需要注意的是,在過程中需要對可視化模型和可視化對象以及可視化技術(shù)度量評測模型進(jìn)行深入分析和探索,以下幾點(diǎn)即為可視化數(shù)據(jù)挖掘工作開展中需要注意的關(guān)鍵問題:
1)如何構(gòu)建選擇需要描述的數(shù)據(jù)對象和挖掘過程以及結(jié)果準(zhǔn)則等,如何建立科學(xué)有效的描述數(shù)據(jù)對象和挖掘過程及結(jié)果可視化模型等[7];
2)如何能夠科學(xué)給出評價(jià)可視化技術(shù),并且如何建立度量指標(biāo)和度量指標(biāo)體系及度量模型等;
3)如何保障用戶可以直接參與到分析過程中,如何有效實(shí)現(xiàn)決策支持;
4)如何在可視化的用戶決策中有效替代一個(gè)分析過程中的多個(gè)步驟;
5)如何在難以自動(dòng)生成決策時(shí)可以保障用戶借助可視化輔助支持來更好地完成各項(xiàng)決策。
當(dāng)前,這些方面的研究和探索并沒有全面實(shí)現(xiàn)突破,因此,需要相關(guān)工作人員細(xì)致分析和思考如何有效解決數(shù)據(jù)挖掘可視化中存在的問題,這對于科學(xué)發(fā)展和數(shù)據(jù)運(yùn)用有著十分重要的幫助[8]。另外,還應(yīng)探索如何將可視化與數(shù)據(jù)挖掘及數(shù)據(jù)分析過程進(jìn)行融合,在這一基礎(chǔ)上構(gòu)建一個(gè)完善且統(tǒng)一的可視化數(shù)據(jù)挖掘工具是需要深入思考的課題。
數(shù)據(jù)挖掘需要在數(shù)據(jù)的支撐下完成,也是基于數(shù)據(jù)推動(dòng)的一種歸納性學(xué)習(xí)方式,借助有效的數(shù)據(jù)分析不僅可以從中找出一些未知的知識,還可以發(fā)現(xiàn)諸多有用的知識?;诮5臄?shù)據(jù)挖掘模式也是在這一基礎(chǔ)上出現(xiàn)和發(fā)展的,即為從三維模型中提取知識和空間關(guān)系,也可以將沒有顯示出來的數(shù)據(jù)信息進(jìn)行存儲,使相關(guān)人員更好地理解數(shù)據(jù)信息并發(fā)現(xiàn)空間數(shù)據(jù)以及相關(guān)屬性數(shù)據(jù)關(guān)系等,三維模型的構(gòu)建可以通過簡單的方式來體現(xiàn)數(shù)據(jù)信息[9]。
針對建模數(shù)據(jù)挖掘的數(shù)據(jù)源來講,可以從要素類別這一層面將其劃分為空間數(shù)據(jù)和屬性數(shù)據(jù)兩種,隨之將其劃分為二維、三維、四維(時(shí)間維)以及不確定維等。另外,數(shù)據(jù)挖掘技術(shù)包含了統(tǒng)計(jì)分析和空間分析以及空間聚類等,建模數(shù)據(jù)挖掘在初期階段需要探究統(tǒng)計(jì)分析和三維緩沖區(qū)分析以及三維相交分析等,而關(guān)鍵技術(shù)則包含了三維建模技術(shù)與ArcGIS空間分析和基于SPSS Modeler的數(shù)據(jù)挖掘,工作開展思路即為如下內(nèi)容:借助三維建模來建立三維模型,將其作為數(shù)據(jù)源,其中需要包含ArcGIS的三維模型格式轉(zhuǎn)換,并且還需要在這一基礎(chǔ)上開展三維空間分析,使用ArcGIS實(shí)時(shí)數(shù)據(jù)篩選并提取剖面數(shù)據(jù)信息,并運(yùn)用SPSS Modeler軟件來對數(shù)據(jù)進(jìn)行深度挖掘,最后再將挖掘到的數(shù)據(jù)內(nèi)容體現(xiàn)到三維模型上,全面實(shí)現(xiàn)可視化表達(dá)。
在構(gòu)建模型庫的過程中,其建立難度主要體現(xiàn)在三維建模的精模和低模轉(zhuǎn)化階段,在構(gòu)建三維模型之前,應(yīng)對數(shù)字資源進(jìn)行全面收集和整理,資源主要包含了測量數(shù)據(jù)和設(shè)計(jì)圖紙以及常用模型的數(shù)據(jù)資源等,三維仿真系統(tǒng)中的模型資源庫是在三維靜態(tài)模型基礎(chǔ)上形成的,為確保靜態(tài)模型資源可以得到科學(xué)利用,需要設(shè)置模型信息分類存儲,這樣可以確保數(shù)據(jù)信息有效挖掘[10]。
靜態(tài)模型資源庫類型多樣,例如公共模型設(shè)施、水體模型以及建筑三維模型等,模型庫資源的構(gòu)建運(yùn)用了AutoCAD和3DSMAX,即為在AutoCAD中建立三維場景平面圖,然后將平面圖導(dǎo)入到3DSMAX中,這時(shí)就可以建立地面模型,同時(shí)科學(xué)分割地形與地勢,這樣就可以確保三維模型面數(shù)和貼面不會出現(xiàn)問題。在運(yùn)用3DSMAX開展初始模型建立時(shí),因?yàn)槠湓煨湍芰ο鄬^強(qiáng),并且模型仿真和立體效果都有一定優(yōu)勢,針對植物模型的創(chuàng)建來講,大部分植物建模的面數(shù)都相對較高,這樣就會產(chǎn)生諸多數(shù)據(jù),當(dāng)前植物建模效果展示真正應(yīng)用植物模型較少,基本上都是以面為單元進(jìn)行植物貼圖,這種方式也可以很好地體現(xiàn)出場景中的視覺效果,在這種三維模型構(gòu)建完成之后,就可以借助三維仿真資源數(shù)據(jù)庫來開展管理與操作。
三維模型資源庫可以將模型劃分為諸多類型,例如高、中、低精度模型,這種仿真場景可以很好地滿足近景、中景以及遠(yuǎn)景的不同需求,在攝影機(jī)跟隨路徑約束達(dá)到視圖遠(yuǎn)景時(shí),顯示的模型即為低精度模型,這樣就可以節(jié)省模型計(jì)算量,并且還可以實(shí)現(xiàn)實(shí)時(shí)交互的要求,反之則可以實(shí)現(xiàn)高精度的視覺要求。三維場景數(shù)據(jù)庫模型資源很好地體現(xiàn)出了真實(shí)環(huán)境中模型合并到虛擬場景中的細(xì)節(jié)效果反應(yīng),色彩強(qiáng)度也可以得到提升,進(jìn)而更好地開展數(shù)據(jù)深度挖掘[11]。
計(jì)算機(jī)仿真技術(shù)在虛擬環(huán)境中構(gòu)建三維幾何體模型雖然可以實(shí)現(xiàn)并體現(xiàn)交互效果,但針對實(shí)時(shí)仿真來講,其難以很好地滿足用戶對可視化視覺效果呈現(xiàn)的要求,三維物體性質(zhì)可以融合并運(yùn)用到動(dòng)態(tài)模型,即從三維物體運(yùn)行的位置和物體之間碰撞以及三維模型角度等方面來獲取信息。在過程中可以以視圖坐標(biāo)為核心,然后以運(yùn)動(dòng)物體自身坐標(biāo)的運(yùn)動(dòng)變化為軸向,在三維場景中,各個(gè)對象都有屬于自己的坐標(biāo),并且物體也可以以自身軸向開展運(yùn)動(dòng),這一坐標(biāo)即為自身坐標(biāo)系統(tǒng),同時(shí)這一坐標(biāo)系統(tǒng)的位置也會隨著物體變化而出現(xiàn)移動(dòng)、旋轉(zhuǎn)以及縮放等變化。針對三維動(dòng)態(tài)建模來講,可以借助關(guān)鍵幀設(shè)置來更好地完成動(dòng)態(tài)模型創(chuàng)建工作。另外,三維場景中還有一個(gè)世界坐標(biāo),場景中的所有模型都需要以這一坐標(biāo)為核心,通常來講,動(dòng)態(tài)現(xiàn)象建模主要運(yùn)用的是粒子系統(tǒng)和動(dòng)力學(xué)系統(tǒng),水景與云霧以及水體模型建模在地形變化中的作用都十分明顯,并且也是科學(xué)體現(xiàn)建筑表現(xiàn)效果的關(guān)鍵內(nèi)容,如果場景想要達(dá)到實(shí)時(shí)渲染這一要求,就需要運(yùn)用粒子系統(tǒng)來完成水晶動(dòng)態(tài)特效,然后再輸出動(dòng)態(tài)文件,最后再將其借助貼圖紋理的模式呈現(xiàn)到場景已經(jīng)建立好的面片中。針對虛擬對象reactor的空間綁定來講,其是配合粒子系統(tǒng)動(dòng)力學(xué)系統(tǒng)實(shí)現(xiàn)的,也是一種物理建模方式,即為借助對虛擬物體進(jìn)行空間綁定來確定reactor質(zhì)量和重力以及物體反彈參數(shù)值等,從這一角度分析,將其與三維建模及仿真平臺進(jìn)行融合就可以很好地呈現(xiàn)出一個(gè)虛擬的模型空間,以便為數(shù)據(jù)挖掘提供幫助和支持。
綜上所述,在三維建模中實(shí)施可視化數(shù)據(jù)挖掘是在虛擬層面實(shí)現(xiàn)了高層次數(shù)據(jù)挖掘,在此過程中需要有物理學(xué)和計(jì)算機(jī)圖形學(xué)的支撐,并且在一些環(huán)節(jié)中還會涉及動(dòng)力學(xué)系統(tǒng),即為三維模型的重力與摩擦力以及反彈值等。另外,除人機(jī)交互作用之外,還可以在計(jì)算機(jī)三維仿真系統(tǒng)平臺中體現(xiàn)出粒子系統(tǒng)與動(dòng)力學(xué)系統(tǒng),即為構(gòu)建粒子系統(tǒng)動(dòng)畫運(yùn)行模型,確保虛擬仿真系統(tǒng)平臺可以實(shí)現(xiàn)自主化控制,在這種場景設(shè)定完成以后,用戶可以不用進(jìn)行交互,這一層面的交互主要是指三維物體活動(dòng)變化和周圍環(huán)境與運(yùn)動(dòng)實(shí)體間的動(dòng)態(tài)關(guān)系,其在不受到用戶輸入控制下也能夠很好地完成數(shù)據(jù)挖掘。