国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

單硬件限制下的電磁環(huán)境加速繪制*

2016-10-10 02:31:31馮曉萌吳玲達(dá)于榮歡
關(guān)鍵詞:插值光線(xiàn)繪制

馮曉萌,吳玲達(dá),2,于榮歡,楊 超

(1. 裝備學(xué)院 復(fù)雜電子系統(tǒng)仿真實(shí)驗(yàn)室, 北京 101416;2. 國(guó)防科技大學(xué) 信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室, 湖南 長(zhǎng)沙 410073)

?

單硬件限制下的電磁環(huán)境加速繪制*

馮曉萌1,吳玲達(dá)1,2,于榮歡1,楊超1

(1. 裝備學(xué)院 復(fù)雜電子系統(tǒng)仿真實(shí)驗(yàn)室, 北京101416;2. 國(guó)防科技大學(xué) 信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室, 湖南 長(zhǎng)沙410073)

單硬件實(shí)現(xiàn)的高效電磁環(huán)境繪制適用范圍更廣;但是,并行光線(xiàn)投射繪制電磁環(huán)境時(shí),其效率受硬件性能制約。在研究硬件限制并行光線(xiàn)投射效率的基礎(chǔ)上,提出一種面向硬件制約的像素插值方法。當(dāng)硬件限制并行光線(xiàn)投射繪制不能實(shí)時(shí)完成時(shí),減少并行投射的光線(xiàn)數(shù)量,即部分圖像像素由光線(xiàn)投射生成,其余像素插值生成。像素插值以圖像質(zhì)量換取執(zhí)行效率,當(dāng)圖像更新停頓時(shí)重新使用光線(xiàn)投射生成插值獲得的像素,以恢復(fù)圖像內(nèi)容。實(shí)驗(yàn)結(jié)果表明,低硬件配置條件下,像素插值能夠大幅度提高繪制圖像的生成效率。同時(shí),對(duì)比多個(gè)體數(shù)據(jù)的繪制效果和誤差統(tǒng)計(jì)得出:電磁環(huán)境數(shù)據(jù)場(chǎng)最適合使用像素插值方法。

電磁環(huán)境;光線(xiàn)投射;硬件限制;像素插值;統(tǒng)一計(jì)算設(shè)備架構(gòu)

電磁環(huán)境已經(jīng)成為現(xiàn)代信息化戰(zhàn)場(chǎng)中決定勝負(fù)的關(guān)鍵因素,對(duì)其進(jìn)行可視化是虛擬戰(zhàn)場(chǎng)環(huán)境的重要研究?jī)?nèi)容。在現(xiàn)有技術(shù)中,效果最好的電磁環(huán)境可視化方法是體繪制方法[1]。

體繪制方法將三維數(shù)據(jù)場(chǎng)直接映射成二維圖像[2],以展示三維數(shù)據(jù)場(chǎng)中的相關(guān)信息,方便用戶(hù)觀察和理解數(shù)據(jù)場(chǎng)。體繪制方法生成的繪制結(jié)果展示了復(fù)雜電磁環(huán)境的內(nèi)部細(xì)節(jié)[3],為用戶(hù)觀察和理解電磁環(huán)境態(tài)勢(shì)提供了支持。光線(xiàn)投射算法[4]是繪制效果最好的體繪制算法。但是,其計(jì)算量大,達(dá)到實(shí)時(shí)繪制通常需要基于圖形硬件GPU的并行實(shí)現(xiàn)[5]。統(tǒng)一計(jì)算設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA)[6]出現(xiàn)后,GPU進(jìn)行通用計(jì)算更加方便,使用其加速體繪制的算法[7]越來(lái)越普遍。

文獻(xiàn)[5]總結(jié)了基于GPU的體繪制研究現(xiàn)狀,體繪制算法在GPU中并行實(shí)現(xiàn)后加速效果明顯,能夠交互繪制大規(guī)模體數(shù)據(jù)。文獻(xiàn)[3]中使用GPU對(duì)電磁環(huán)境體繪制進(jìn)行加速,提高了繪制效率。文獻(xiàn)[8]基于CUDA架構(gòu)加速繪制動(dòng)態(tài)電磁環(huán)境,繪制效率相比文獻(xiàn)[3]有所提升。

但是,CUDA加速依賴(lài)于硬件的自身性能,當(dāng)單個(gè)硬件限制體繪制執(zhí)行效率時(shí),使用多個(gè)硬件可以提高效率[9]。然而,單硬件環(huán)境比多硬件環(huán)境更容易獲得,使用單硬件完成電磁環(huán)境繪制的應(yīng)用范圍將更為廣泛,特別是針對(duì)指揮員的使用,低硬件配置更容易滿(mǎn)足需求。因此,研究單硬件條件下的電磁環(huán)境加速繪制問(wèn)題具有很強(qiáng)的實(shí)用意義。

1 光線(xiàn)投射的硬件限制

光線(xiàn)投射算法中光線(xiàn)相互獨(dú)立,易于并行實(shí)現(xiàn),從而提高其執(zhí)行效率。但是,同一并行光線(xiàn)投射算法在不同型號(hào)的顯卡上執(zhí)行時(shí)間不同,如圖1所示。

圖1 并行光線(xiàn)投射效率Fig.1 Efficiency of parallel ray-casting

圖1中,不僅硬件不同對(duì)應(yīng)的執(zhí)行時(shí)間不同,當(dāng)圖像分辨率超過(guò)一定規(guī)模后,兩個(gè)硬件的執(zhí)行時(shí)間均與分辨率成正比。而并行光線(xiàn)投射算法中,每個(gè)像素對(duì)應(yīng)一條光線(xiàn),說(shuō)明并行投射光線(xiàn)越多,執(zhí)行時(shí)間越長(zhǎng)。因此,在硬件保持不變且無(wú)法修改光線(xiàn)投射算法時(shí),若需要提高執(zhí)行效率,可適當(dāng)減少投射光線(xiàn)的數(shù)量。

2 像素插值

減少投射光線(xiàn)數(shù)量即減少光線(xiàn)投射生成的像素,此時(shí)能夠提高算法執(zhí)行效率,但是應(yīng)該同時(shí)保持圖像分辨率才有意義。因此,使用光線(xiàn)投射算法生成圖像中的部分像素,其余像素使用比光線(xiàn)投射計(jì)算量小的方法生成。

2.1像素插值可行性

光線(xiàn)投射算法是將三維數(shù)據(jù)場(chǎng)映射為二維圖像效果最好的方法,因此,在提高算法執(zhí)行效率的同時(shí)應(yīng)該保證光線(xiàn)投射對(duì)圖像生成的作用。圖像中部分像素使用光線(xiàn)投射算法生成,然后利用這些像素插值生成其余的像素,通過(guò)插值間接獲得光線(xiàn)投射的繪制效果。

在光線(xiàn)投射算法中,體數(shù)據(jù)為三維離散數(shù)據(jù)場(chǎng),光線(xiàn)穿越數(shù)據(jù)場(chǎng)時(shí),對(duì)數(shù)據(jù)的采樣點(diǎn)并非全部命中數(shù)據(jù)點(diǎn),通常需要使用采樣點(diǎn)附近的多個(gè)數(shù)據(jù)點(diǎn)進(jìn)行插值獲取采樣點(diǎn)值。說(shuō)明,插值過(guò)程在光線(xiàn)投射算法中已有使用,插值得到的數(shù)據(jù)值轉(zhuǎn)換為像素值的過(guò)程由傳遞函數(shù)[10]決定,可以看作是相鄰的可插值數(shù)據(jù)經(jīng)過(guò)傳遞函數(shù)變成了相鄰的像素。因此,相鄰像素間插值避開(kāi)了傳遞函數(shù),節(jié)省光線(xiàn)投射操作時(shí)間的同時(shí)引入了插值與傳遞函數(shù)不同所致的誤差。

電磁環(huán)境的可視化技術(shù)中[3,11],其數(shù)據(jù)場(chǎng)由連續(xù)的電磁信號(hào)值離散得到,數(shù)據(jù)點(diǎn)與數(shù)據(jù)點(diǎn)之間相關(guān)且無(wú)突變,較適合進(jìn)行插值。因此,電磁環(huán)境數(shù)據(jù)場(chǎng)相對(duì)一般體數(shù)據(jù)而言,其數(shù)據(jù)場(chǎng)內(nèi)部較適宜插值,從而經(jīng)過(guò)傳遞函數(shù)后得到的像素也會(huì)相對(duì)比較適宜插值。這一推論將在后面的實(shí)驗(yàn)結(jié)果中得到驗(yàn)證。

2.2保持圖像分辨率

為便于后續(xù)討論,定義下述4個(gè)用語(yǔ)。

1)源像素:光線(xiàn)投射生成的像素。

2)插值像素:通過(guò)插值生成的像素。

3)行插值:某像素利用其同一行左右相鄰的兩個(gè)像素進(jìn)行插值生成。

4)列插值:某像素利用其同一列上下相鄰的兩個(gè)像素進(jìn)行插值生成。

對(duì)某像素,插值生成的值與光線(xiàn)投射生成的值之間存在差異。因此,像素插值影響生成圖像的質(zhì)量。為盡量保證圖像質(zhì)量,插值像素?cái)?shù)量應(yīng)該盡量少,以減少像素值的誤差。

圖2 源像素與插值像素分布Fig.2 Distribution of source and interpolation pixels

圖2為源像素與插值像素?cái)?shù)量比例為1 ∶1時(shí)在生成圖像中的分布示意圖,其中顯示了兩種分布情況:圖2(a)至圖2(d)為第一種;圖2(e)和圖2(f)為第二種。這兩種分布中,插值像素與源像素的相對(duì)位置有規(guī)律性,利于并行程序的編寫(xiě)。

觀察圖2中的6幅子圖:當(dāng)插值像素位于圖像內(nèi)部時(shí)可以統(tǒng)一進(jìn)行行插值;當(dāng)插值像素位于圖像邊緣時(shí),需要特殊考慮。據(jù)此可知,圖2的第一種分布情況中,需要特殊考慮左右兩個(gè)邊緣的像素,并區(qū)分奇偶行;第二種分布情況則只需特殊考慮右側(cè)邊緣的像素,且不區(qū)分奇偶行。因此,圖2中的第二種分布情況插值類(lèi)型少,更易于實(shí)現(xiàn)并行編程。

2.3提高插值像素比例

圖2中,源像素與插值像素?cái)?shù)量比為1 ∶1,由圖1可知,減少一半的投射光線(xiàn)數(shù)量可以節(jié)省不到一半的執(zhí)行時(shí)間。當(dāng)需要節(jié)省更多的執(zhí)行時(shí)間時(shí),可以繼續(xù)減少投射光線(xiàn)的數(shù)量,即提高插值像素的比例。在圖2的基礎(chǔ)上繼續(xù)減少一半的源像素后,像素分布如圖3所示,源像素與插值像素的比例約為1 ∶3。此時(shí),相對(duì)圖2所示的分布,在執(zhí)行過(guò)程中光線(xiàn)投射時(shí)間減少、插值操作時(shí)間增加,總時(shí)間將會(huì)減少,從而進(jìn)一步提高生成圖像的效率。

圖3 源像素與插值像素近似比例1 ∶3Fig.3 Ratio of source pixel to interpolation pixel is 1 ∶3

圖3中的插值像素可以分兩步生成,首先生成圖中源像素下方相鄰的插值像素,將此時(shí)插值生成的像素看作源像素即與圖2中的第二種分布相同,然后再利用圖2中第二種分布的插值方法生成其余像素。在上述兩個(gè)插值步驟中,除邊緣像素需特殊考慮外,其他插值像素在第一步中進(jìn)行列插值,在第二步中進(jìn)行行插值,操作統(tǒng)一利于并行處理。

繪制電磁環(huán)境數(shù)據(jù)場(chǎng)時(shí),圖像邊緣通常對(duì)應(yīng)數(shù)據(jù)場(chǎng)的邊緣,而數(shù)據(jù)場(chǎng)邊緣的數(shù)據(jù)信息量很小,可以不精確顯示。因此,繪制電磁環(huán)境數(shù)據(jù)場(chǎng)時(shí),將位于圖像邊緣的插值像素設(shè)置為與其相鄰的源像素值,以盡量節(jié)省執(zhí)行時(shí)間。

圖3所示的分布中,源像素所占的比例已經(jīng)比較小,若再降低,將使誤差繼續(xù)擴(kuò)大,嚴(yán)重影響生成圖像的質(zhì)量。因此,非特殊需要將不再繼續(xù)提高插值像素比例。

3 恢復(fù)插值像素

像素插值在犧牲圖像質(zhì)量的前提下提高圖像生成速度,以支持圖像的高更新頻率。但是,當(dāng)圖像更新停頓時(shí),應(yīng)使用光線(xiàn)投射重新生成插值像素,以恢復(fù)圖像內(nèi)容。

3.1插值像素的恢復(fù)流程

從像素插值到恢復(fù)插值像素的流程如圖4所示。像素插值是一個(gè)循環(huán)過(guò)程,保證實(shí)時(shí)更新圖像,通過(guò)判斷“是否空閑”決定繼續(xù)循環(huán)還是跳出循環(huán)。跳出循環(huán)后,對(duì)插值生成的像素使用光線(xiàn)投射算法進(jìn)行恢復(fù)。

圖4 像素插值及恢復(fù)流程圖Fig.4 Flow of pixel interpolation and recovery

圖4中,上下兩個(gè)虛線(xiàn)框分別表示設(shè)備端(GPU)和主機(jī)端(CPU)中的操作,由主機(jī)端確定“是否空閑”,“是”表示暫時(shí)不需要更新圖像,“否”表示需要立即更新圖像。當(dāng)用戶(hù)通過(guò)主機(jī)端對(duì)體繪制進(jìn)行交互控制或者電磁環(huán)境數(shù)據(jù)場(chǎng)發(fā)生變化時(shí),均需要重新生成并顯示圖像,此時(shí)采用像素插值的方法提高圖像生成效率??臻e時(shí),設(shè)備端恢復(fù)圖像并顯示。此時(shí),若主機(jī)端需要繼續(xù)更新圖像,則從“開(kāi)始”操作重新執(zhí)行設(shè)備端的處理流程。圖4中表示GPU操作的虛線(xiàn)框中明確標(biāo)識(shí)了“開(kāi)始”未標(biāo)識(shí)“結(jié)束”,這是因?yàn)槭欠窠Y(jié)束由CPU控制,可以在任何操作時(shí)結(jié)束。

3.2是否空閑的判斷

圖4中,是否空閑的含義為是否需要更新圖像,由主機(jī)端決定,其因素主要有用戶(hù)交互、數(shù)據(jù)場(chǎng)變化等。用戶(hù)交互調(diào)整傳遞函數(shù)或者觀察視角時(shí),圖像需要根據(jù)用戶(hù)的調(diào)整及時(shí)更新,以反饋交互效果。當(dāng)硬件限制而不能實(shí)時(shí)更新圖像時(shí),可采用像素插值的方法提高圖像生成效率。然而,用戶(hù)的交互操作會(huì)有停頓即“空閑”,此時(shí)進(jìn)行像素恢復(fù)。同理,數(shù)據(jù)場(chǎng)變化有停頓時(shí)也進(jìn)行像素恢復(fù)。使用時(shí)間閾值ε判斷“空閑”狀態(tài):在ε時(shí)間內(nèi)既沒(méi)有用戶(hù)交互操作,數(shù)據(jù)場(chǎng)又未變化時(shí),認(rèn)定此時(shí)為“空閑”。

“空閑”狀態(tài)下恢復(fù)圖像是為了消除像素插值造成的生成圖像誤差,恢復(fù)圖像質(zhì)量,便于用戶(hù)更好地觀察電磁環(huán)境的繪制結(jié)果。

4 具體實(shí)現(xiàn)

依據(jù)圖4所示的流程進(jìn)行編碼實(shí)現(xiàn),程序主要分為兩個(gè)部分:主機(jī)端代碼和設(shè)備端代碼。主機(jī)端除負(fù)責(zé)將繪制電磁環(huán)境需要的數(shù)據(jù)和控制參數(shù)傳遞到設(shè)備端外,最主要的任務(wù)就是實(shí)時(shí)監(jiān)控“空閑”狀態(tài),并將結(jié)果反饋給設(shè)備端。設(shè)備端使用CUDA架構(gòu)并行實(shí)現(xiàn),光線(xiàn)投射、像素插值、像素替換等操作均并行實(shí)現(xiàn)。

算法1中顯示了主機(jī)端控制像素插值流程的關(guān)鍵代碼,其中插值像素的分布如圖3所示。其中,第3行獲取圖像分辨率;第4和第5行取圖像分辨率的1/4;第6至8行設(shè)置開(kāi)啟的線(xiàn)程數(shù),每個(gè)源像素對(duì)應(yīng)1個(gè)線(xiàn)程;第9行進(jìn)行光線(xiàn)投射生成源像素;第10行進(jìn)行列插值;第11至13行更新開(kāi)啟的線(xiàn)程數(shù),為圖3中的行插值做準(zhǔn)備;第14行進(jìn)行行插值。

算法1 像素插值流程關(guān)鍵代碼

由于圖3中行插值像素個(gè)數(shù)大約為列插值像素個(gè)數(shù)的2倍,因此在11至13行對(duì)線(xiàn)程個(gè)數(shù)進(jìn)行了重置,表1中行插值函數(shù)g_InsertPix2()比列插值函數(shù)g_InsertPix1()開(kāi)啟的線(xiàn)程數(shù)多1倍。光線(xiàn)投射函數(shù)g_CastRay()的具體執(zhí)行過(guò)程與文獻(xiàn)[8]中相同。函數(shù)g_InsertPix1()的偽代碼見(jiàn)算法2。

算法2 像素插值內(nèi)核線(xiàn)程

算法2中,前四行根據(jù)線(xiàn)程的ID號(hào)確定其對(duì)應(yīng)插值像素的坐標(biāo),當(dāng)插值像素位于圖像邊緣時(shí)直接將相鄰源像素的值賦予它(第7行),否則進(jìn)行線(xiàn)性列插值(第9行)。函數(shù)g_InsertPix2()的執(zhí)行代碼與算法2中相似,插值時(shí)使用行插值。

5 實(shí)驗(yàn)結(jié)果與分析

基于CUDA架構(gòu)實(shí)現(xiàn)本算法,編程開(kāi)發(fā)環(huán)境為集成了NVIDIA GPU Computing SDK 4.2的Microsoft Visual Studio 2005。硬件支持環(huán)境為:Intel(R) Core(TM) i5-2400 CPU 3.10 GHz、4 GB內(nèi)存、NVIDIA GeForce GT 530顯卡。由圖1可知,此顯卡并行計(jì)算能力相對(duì)較低,對(duì)并行光線(xiàn)投射算法的硬件限制較大,當(dāng)其并行能力不能支持實(shí)時(shí)光線(xiàn)投射時(shí),可以使用像素插值的方法進(jìn)行加速。

5.1執(zhí)行效率

使用體繪制中的DVR(直接體繪制)算法和MIDA算法[12]進(jìn)行了兩組實(shí)驗(yàn),生成圖像分辨率為1200×900,連續(xù)生成100幀圖像的時(shí)間統(tǒng)計(jì)如圖5所示。每組實(shí)驗(yàn)分別統(tǒng)計(jì)了三種情況下的生成時(shí)間:①全部像素使用光線(xiàn)投射生成;②源像素與插值像素?cái)?shù)量比例為1 ∶1;③源像素與插值像素?cái)?shù)量比例為1 ∶3。圖5的兩幅圖中,上中下三條曲線(xiàn)分別對(duì)應(yīng)第1、第2、第3種情況。

(a) DVR生成圖像時(shí)間(a) Implementation time of DVR

(b) MIDA生成圖像時(shí)間(b) Implementation time of MIDA圖5 算法執(zhí)行時(shí)間Fig.5 Time for algorithm implementation

通過(guò)圖5兩幅子圖中三條曲線(xiàn)的具體時(shí)間可以看出,像素插值能夠?qū)D像的生成時(shí)間從40 ms以上降到40 ms以下,即達(dá)到實(shí)時(shí)生成圖像。說(shuō)明,在由于硬件能力限制而不能實(shí)時(shí)生成圖像的情況下,像素插值能夠加速圖像生成,使其能夠?qū)崟r(shí)完成。同時(shí),將各子圖中的三條曲線(xiàn)進(jìn)行對(duì)比可以得出如下結(jié)論:生成圖像的分辨率不變時(shí),插值像素越多圖像的生成時(shí)間越短。因此,適當(dāng)提高插值像素在圖像中所占的比例能夠獲得更好的加速效果。

圖5(a)中三條曲線(xiàn)的平均每幀時(shí)間為51.84 ms,29.68 ms,18.96 ms,中下兩條曲線(xiàn)的平均時(shí)間分別是最上面曲線(xiàn)的57.25%,36.57%;上述數(shù)據(jù)值對(duì)應(yīng)到圖5(b)中分別是59.06 ms,33.79 ms,21.08 ms,57.21%,35.69%。對(duì)比可知,雖然MIDA算法比DVR算法用時(shí)要長(zhǎng),但是像素插值對(duì)兩個(gè)算法的加速效率相差不多,甚至MIDA算法的加速效率高些。說(shuō)明,像素插值對(duì)光線(xiàn)投射生成圖像的加速效率比較穩(wěn)定,可適用算法范圍較廣。

5.2繪制效果與誤差統(tǒng)計(jì)

記電磁環(huán)境數(shù)據(jù)場(chǎng)為EME,使用文獻(xiàn)[8]中的方法計(jì)算得到。實(shí)驗(yàn)中,使用4個(gè)體數(shù)據(jù)場(chǎng)(EME:200×200×100,Sphere:64×64×64,Engine:256×256×110,stagbeetle:277×277×164)生成分辨率為1200×900的圖像時(shí),4個(gè)體數(shù)據(jù)對(duì)應(yīng)的圖像中人眼均無(wú)法辨別出使用了像素插值的圖像。而將生成圖像分辨率調(diào)整為與體數(shù)據(jù)場(chǎng)規(guī)模的最大兩維相等后,生成圖像中部分區(qū)域如圖6所示。圖6中,每行對(duì)應(yīng)一個(gè)體數(shù)據(jù),從上至下依次為EME,Sphere,Engine,stagbeetle;3列從左到右依次為全部光線(xiàn)投射生成、圖2中第二種分布的像素插值生成、圖3所示分布的像素插值生成。

圖6 繪制效果對(duì)比Fig.6 Contrast of rendering results

仔細(xì)觀察對(duì)比圖6中每個(gè)體數(shù)據(jù)的不同繪制結(jié)果可知,EME和Sphere的繪制結(jié)果幾乎看不出差別,而Engine和stagbeetle的繪制結(jié)果則插值像素越多越模糊、效果越差。而將生成圖像分辨率改為1200×900后,Engine和stagbeetle的繪制結(jié)果也幾乎看不出差別,說(shuō)明小規(guī)模的數(shù)據(jù)場(chǎng)生成大分辨率的圖像時(shí),插值像素對(duì)繪制結(jié)果的影響減小。而當(dāng)數(shù)據(jù)場(chǎng)規(guī)模與圖像分辨率相當(dāng)時(shí),EME和Sphere這種計(jì)算獲得的數(shù)據(jù)場(chǎng)要比CT掃描獲得的數(shù)據(jù)場(chǎng)(Engine和stagbeetle)更適合使用像素插值方法進(jìn)行加速繪制。

從數(shù)據(jù)的角度對(duì)像素插值生成的圖像中的誤差進(jìn)行統(tǒng)計(jì)分析:保持?jǐn)?shù)據(jù)場(chǎng)規(guī)模不變,生成圖像分辨率為1200×900時(shí)的統(tǒng)計(jì)結(jié)果見(jiàn)表1;生成圖像分辨率與體數(shù)據(jù)場(chǎng)規(guī)模的最大兩個(gè)維度相等時(shí)的統(tǒng)計(jì)結(jié)果見(jiàn)表2。其中,所有數(shù)據(jù)均使用相同的傳遞函數(shù)繪制生成。表1和表2中數(shù)據(jù)均為10幀圖像數(shù)據(jù)的統(tǒng)計(jì)均值,“最大誤差”列中數(shù)據(jù)只保留了整數(shù)。兩個(gè)表的數(shù)據(jù)中“B”通道統(tǒng)計(jì)數(shù)值均為0是因?yàn)閭鬟f函數(shù)設(shè)置中未使用藍(lán)色通道。

表1 插值像素誤差統(tǒng)計(jì)1

表2 插值像素誤差統(tǒng)計(jì)2

對(duì)于某個(gè)像素點(diǎn),稱(chēng)其由插值生成的值與光線(xiàn)投射生成的值之間的差為誤差,最大誤差指圖像中誤差最大值。平均誤差計(jì)算方法為所有誤差的和除以存在誤差的像素總數(shù)。誤差像素比是存在誤差的像素總數(shù)除以圖像中的非零(4個(gè)通道不全為零)像素總數(shù)。每個(gè)體數(shù)據(jù)均對(duì)應(yīng)兩行數(shù)據(jù),上面一行為插值像素與源像素比例為1 ∶1的情況,下面一行為3 ∶1的情況。

分別對(duì)比表1和表2中每個(gè)數(shù)據(jù)對(duì)應(yīng)的兩行數(shù)據(jù)可知,插值像素個(gè)數(shù)較少時(shí),誤差情況相對(duì)較小。對(duì)比所有數(shù)據(jù)的“最大誤差”列,前兩個(gè)體數(shù)據(jù)明顯優(yōu)于后兩個(gè),而EME和Sphere均為數(shù)值計(jì)算得到的數(shù)據(jù),后兩者則是實(shí)物掃描數(shù)據(jù),說(shuō)明數(shù)值計(jì)算得到的數(shù)據(jù)場(chǎng)較適于使用像素插值的方法進(jìn)行加速?!捌骄`差”與“誤差像素比”兩列的數(shù)據(jù)同樣是EME的最好,說(shuō)明電磁環(huán)境數(shù)據(jù)場(chǎng)更適合使用像素插值的方法進(jìn)行繪制時(shí)的加速。

對(duì)比兩個(gè)表中數(shù)據(jù),印證了圖像分辨率對(duì)像素插值結(jié)果的影響:數(shù)據(jù)場(chǎng)規(guī)模一定時(shí),生成的圖像分辨率越大,像素插值的誤差越小。同時(shí),表2與圖6相對(duì)應(yīng),其中EME對(duì)應(yīng)的數(shù)據(jù)說(shuō)明當(dāng)使用更大規(guī)模電磁環(huán)境數(shù)據(jù)場(chǎng)生成高分辨率的圖像時(shí),仍然可以使用像素插值的方法加速體繪制。而其他掃描得到的實(shí)體數(shù)據(jù)則將不適用像素插值方法。

5.3像素恢復(fù)

表1、表2顯示繪制電磁環(huán)境時(shí)使用像素插值方法存在誤差,為保證圖像質(zhì)量恢復(fù)插值像素是有必要的。實(shí)驗(yàn)中,根據(jù)插值像素分布設(shè)置空閑判斷閾值ε:源像素與插值像素為1 ∶1時(shí)設(shè)置為使用像素插值時(shí)生成第一幀圖像的執(zhí)行時(shí)間;1 ∶3 時(shí)設(shè)置為生成第一幀圖像執(zhí)行時(shí)間的1.5倍。如此,基本保證閾值ε大約為不進(jìn)行像素插值的一半,當(dāng)已空閑1個(gè)ε時(shí)使用ε或1.33ε的時(shí)間進(jìn)行像素恢復(fù)。如此設(shè)置閾值ε在實(shí)驗(yàn)中未影響用戶(hù)的交互操作,是可行的。

上述實(shí)驗(yàn)和分析說(shuō)明,像素插值方法適用于繪制電磁環(huán)境數(shù)據(jù)場(chǎng),不僅繪制誤差小,同時(shí)還能夠在繪制效率受硬件性能制約時(shí)進(jìn)行加速繪制,從而得到更高的繪制效率。因此,本算法能夠應(yīng)用于文獻(xiàn)[3]和文獻(xiàn)[8]中,進(jìn)一步加速其中的電磁環(huán)境繪制效率。同時(shí),若接受一定的繪制效果損失,可以將本算法應(yīng)用于繪制其他體數(shù)據(jù),繼續(xù)加速文獻(xiàn)[5]中提到的基于GPU的體繪制算法。

6 結(jié)論

提出一種適用于電磁環(huán)境數(shù)據(jù)場(chǎng)繪制的像素插值算法,其可以在硬件性能限制繪制效率時(shí)對(duì)繪制進(jìn)行加速,獲得更高的繪制效率為其實(shí)時(shí)交互和應(yīng)用提供支持。實(shí)驗(yàn)結(jié)果表明:像素插值算法的加速效果明顯,且生成圖像的誤差明顯優(yōu)于其他體數(shù)據(jù)。算法的不足是,犧牲生成圖像的質(zhì)量換取繪制效率的提升,對(duì)其應(yīng)用具有一定的限制。提高插值像素的精度可以改善這一限制,是下一步的研究工作。

References)

[1]吳迎年, 張霖, 張利芳, 等. 電磁環(huán)境仿真與可視化研究綜述[J]. 系統(tǒng)仿真學(xué)報(bào), 2009, 21(20): 6332-6338.WU Yingnian, ZHANG Lin, ZHANG Lifang, et al. Survey on electromagnetic environment simulation and visualization[J]. Journal of System Simulation, 2009, 21(20): 6332-6338. (in Chinese)

[2]Arie K, Klaus M. Overview of volume rendering[M]//Hansen C D, Johnson C R. The Visualization Handbook, USA:Academic Press, 2005.

[3]楊超, 徐江斌, 吳玲達(dá). 硬件加速的虛擬電磁環(huán)境體可視化[J]. 北京郵電大學(xué)學(xué)報(bào), 2011, 34(1): 55-59.

YANG Chao, XU Jiangbin, WU Lingda. Hardware accelerated volume visualization in virtual electromagnetic environment[J]. Journal of Beijing University of Posts and Telecommunications, 2011, 34(1): 55-59. (in Chinese)

[4]馬千里, 李思昆, 白曉征, 等. CFD非結(jié)構(gòu)化網(wǎng)格格心格式數(shù)據(jù)高質(zhì)量體繪制方法[J]. 計(jì)算機(jī)學(xué)報(bào), 2011, 34(3): 508-516.

MA Qianli, LI Sikun, BAI Xiaozheng, et al. High-quality volume rendering of unstructured-grid cell-centered data in CFD[J]. Chinese Journal of Computers, 2011, 34(3): 508-516. (in Chinese)

[5]Beyer J, Hadwiger M, Pfister H. A survey of GPU-based large-scale volume visualization[C]// Proceedings of the Eurographics Conference on Visualization 2014, Swansea Wales, UK, 2014: 105-123.

[6]Rosen P. A visual approach to investigating shared and global memory behavior of CUDA kernels[C]// Proceedings of the Eurographics Conference on Visualization, Leipzig, Germany, 2013: 161-170.

[7]Zhang Y B, Dong Z, Ma K L. Real-time volume rendering in dynamic lighting environments using precomputed photon mapping[J]. IEEE Transactions on Visualization and Computer Graphics, 2013, 19(8): 1317-1330.

[8]馮曉萌, 吳玲達(dá), 董士偉. CUDA加速的動(dòng)態(tài)電磁環(huán)境數(shù)據(jù)場(chǎng)實(shí)時(shí)繪制[J]. 系統(tǒng)仿真學(xué)報(bào), 2014, 26(9): 2044-2049.

FENG Xiaomeng, WU Lingda, DONG Shiwei. CUDA accelerated real-time rendering for dynamic electromagnetic environment volume data [J]. Journal of System Simulation, 2014, 26(9): 2044-2049. (in Chinese)

[9]Stuart J A, Chen C K, Ma K L, et al. Multi-GPU volume rendering using MapReduce[C]//Proceedings of the 19th ACM International Symposium on High Performance Distributed Computing, 2010: 841-848.

[10]Arens S, Domik G. A survey of transfer functions suitable for volume rendering[C]//Proceedings of the 8th IEEE/EG International Conference on Volume Graphics, 2010: 77-83.

[11]陳鵬, 楊超, 吳玲達(dá). 硬件加速的三維雷達(dá)作用范圍表現(xiàn)[J]. 國(guó)防科技大學(xué)學(xué)報(bào), 2007, 29(6): 49-53.

CHEN Peng, YANG Chao, WU Lingda. Hardware accelerated 3D radar detection range visualization[J]. Journal of National University of Defense Technology, 2007, 29(6): 49-53. (in Chinese)

[12]Stefan B, Eduard M G. Instant volume visualization using maximum intensity difference accumulation [J]. Computer Graphics Forum, 2009, 28(3): 775-782.

Accelerated rendering for electromagnetic environment under single device restriction

FENG Xiaomeng1, WU Lingda1,2, YU Ronghuan1, YANG Chao1

(1. Science and Technology on Complex Electronic System Simulation Laboratory, Equipment Academy, Beijing 101416, China;2. Key Laboratory of Information System Engineering, National University of Defense Technology, Changsha 410073, China)

Electromagnetic environment with a high efficiency based on single device supports has wide range of applications. But the efficiency of parallel ray-casting for rendering electromagnetic environment is restricted by the device. Based on researching the restriction of device for parallel ray-casting, a pixel interpolation method focusing on the restriction was presented. The number of rays was reduced when the parallel ray-casting rendering under device restriction couldn’t be completed immediately, namely, a part of pixels in the rendering image were generated by ray-casting and the rest pixels through interpolation. Pixel interpolation got rendering efficiency at the cost of image quality, so when image update paused, the interpolated pixels were regenerated to recover image quality. The experiments show that pixel interpolation obviously improves rendering efficiency when implemented on a low device. Compared with the rendering images of some volume data and the errors in these images, the electromagnetic environment data has the best rendering result, which proves that pixels interpolation is useable especially for rendering electromagnetic environment on a low device.

electromagnetic environment; ray-casting; device restriction; pixel interpolation; compute unified device architecture

10.11887/j.cn.201604011http://journal.nudt.edu.cn

2015-04-28

國(guó)家自然科學(xué)基金資助項(xiàng)目(61202129)

馮曉萌(1986—),男,河北石家莊人,博士研究生,E-mail:130123feng@163.com;吳玲達(dá)(通信作者),女,研究員,博士,博士生導(dǎo)師,E-mail:wld@nudt.edu.cn

TP391.9

A

1001-2486(2016)04-069-07

猜你喜歡
插值光線(xiàn)繪制
春日暖陽(yáng)
Art on coffee cups
“你看不見(jiàn)我”
中外文摘(2019年8期)2019-04-30 06:47:36
基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
放學(xué)后
一種改進(jìn)FFT多譜線(xiàn)插值諧波分析方法
基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
淘氣的光線(xiàn)
流動(dòng)的光線(xiàn)
在轉(zhuǎn)變中繪制新藍(lán)圖
平阴县| 新平| 乌鲁木齐市| 达拉特旗| 桐庐县| 澄城县| 南昌市| 隆昌县| 连南| 卫辉市| 石河子市| 黄冈市| 德昌县| 贵阳市| 区。| 辽中县| 芜湖县| 扎鲁特旗| 建德市| 清流县| 肇源县| 泗阳县| 义乌市| 涿鹿县| 临湘市| 浙江省| 子长县| 荥经县| 辽阳市| 五华县| 荃湾区| 衡南县| 金塔县| 松滋市| 巴塘县| 新民市| 乐清市| 佳木斯市| 山东省| 清水河县| 库车县|