国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于異構(gòu)加速的動(dòng)目標(biāo)檢測(cè)算法的實(shí)現(xiàn)方法

2022-03-07 07:54陳瑩瑩胡善清李興明
信號(hào)處理 2022年2期
關(guān)鍵詞:實(shí)時(shí)性脈沖流水

陳瑩瑩 胡善清 李興明 王 策

(1.北京理工大學(xué)信息與電子學(xué)院雷達(dá)技術(shù)研究所,北京 100081;2.嵌入式實(shí)時(shí)信息處理技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室(北京理工大學(xué)),北京 100081;3.北京理工雷科電子信息技術(shù)有限公司,北京 100081)

1 引言

雷達(dá)具有全天候、作用距離大的優(yōu)勢(shì),在目標(biāo)探測(cè)領(lǐng)域應(yīng)用廣泛。對(duì)于探測(cè)雷達(dá)而言,主要需要完成對(duì)目標(biāo)的方位信息以及運(yùn)動(dòng)狀態(tài)的估計(jì),更具體一點(diǎn)即需要估計(jì)出目標(biāo)的具體模型,從而可以運(yùn)用于預(yù)警、避障、偵察等[1]。而隨著信息化、自動(dòng)化不斷普及,目標(biāo)場景也在不斷豐富,各類動(dòng)目標(biāo)大量出現(xiàn),動(dòng)目標(biāo)檢測(cè)的應(yīng)用場景也在不斷增加,如小型無人機(jī)、滑翔機(jī)等等,這對(duì)雷達(dá)動(dòng)目標(biāo)檢測(cè)的性能提出了更高的要求,同時(shí),雷達(dá)回波數(shù)據(jù)量的增大對(duì)實(shí)時(shí)性帶來了新的挑戰(zhàn)。動(dòng)目標(biāo)檢測(cè)(MTD)是現(xiàn)代雷達(dá)信號(hào)處理中的重要方法,基于MTD當(dāng)前有很多學(xué)者對(duì)其進(jìn)行了研究和改良,如文獻(xiàn)[2]提出的基于運(yùn)動(dòng)補(bǔ)償?shù)膭?dòng)目標(biāo)檢測(cè)處理方法,提高對(duì)遠(yuǎn)距離弱目標(biāo)的探測(cè)能力;文獻(xiàn)[3]針對(duì)距離徙動(dòng)和多普勒頻率徙動(dòng)提出了一種基于頻域?qū)崿F(xiàn)MAR-MTD(Modified Axis Rotation Moving Target Detection)的高速微弱目標(biāo)檢測(cè)算法;文獻(xiàn)[4]針對(duì)快速動(dòng)目標(biāo)的會(huì)在距離向上產(chǎn)生距離走動(dòng)、方位向上產(chǎn)生散焦現(xiàn)象的問題,提出了多普勒補(bǔ)償濾波器組和方位匹配濾波器組級(jí)聯(lián)的方法,以達(dá)到抑制雜波提高動(dòng)目標(biāo)檢測(cè)性能的目的等??梢钥吹?,雷達(dá)動(dòng)目標(biāo)檢測(cè)的應(yīng)用領(lǐng)域不斷擴(kuò)展,算法的復(fù)雜度不斷提高,盡可能的提高檢測(cè)的準(zhǔn)確性和實(shí)時(shí)性十分重要。

近年來,隨著集成電路工藝進(jìn)一步發(fā)展,GPU(Graphics Processing Unit,圖形處理器)的計(jì)算能力也在不斷提升,其強(qiáng)大的并行能力越來越多地被應(yīng)用在了高性能計(jì)算需求領(lǐng)域[5]。針對(duì)動(dòng)目標(biāo)檢測(cè)算法的特點(diǎn),可以將檢測(cè)流程模塊化、流水化,將其與GPU 并行計(jì)算的優(yōu)勢(shì)結(jié)合來大大增強(qiáng)實(shí)時(shí)性,因此,本文提出了利用CPU(Central Processing Unit,中央處理器)+GPU 異構(gòu)加速的方法提高動(dòng)目標(biāo)檢測(cè)的實(shí)時(shí)性的方法。本文為實(shí)現(xiàn)動(dòng)目標(biāo)的實(shí)時(shí)檢測(cè),首先查閱相關(guān)資料,找到動(dòng)目標(biāo)檢測(cè)的核心算法,設(shè)計(jì)動(dòng)目標(biāo)檢測(cè)流程,即對(duì)回波數(shù)據(jù)首先進(jìn)行脈沖壓縮提高信噪比,然后采用動(dòng)目標(biāo)檢測(cè)算法(MTD)形成距離-多普勒二維分布圖,最后采用恒虛警(CFAR)檢測(cè)算法進(jìn)行目標(biāo)的檢測(cè);然后進(jìn)行了算法異構(gòu)加速設(shè)計(jì),即并行流水設(shè)計(jì),采用算法模塊內(nèi)并行處理,算法模塊間流水處理的方式加速算法運(yùn)行,然后移植到CPU+GPU 異構(gòu)平臺(tái)上,最后仿真驗(yàn)證算法的準(zhǔn)確性和實(shí)時(shí)性。

本文通過構(gòu)造目標(biāo)回波來驗(yàn)證算法的準(zhǔn)確性,通過模塊單獨(dú)執(zhí)行和算法運(yùn)行的時(shí)間測(cè)試來驗(yàn)證實(shí)時(shí)性。實(shí)驗(yàn)結(jié)果表明,目標(biāo)檢測(cè)算法的結(jié)果與回波構(gòu)造一致,并行流水優(yōu)化后的目標(biāo)檢測(cè)算法平均約5.98 ms完成單幀計(jì)算,比異構(gòu)加速下提升了27.6%。

2 動(dòng)目標(biāo)檢測(cè)算法

本文的動(dòng)目標(biāo)檢測(cè)算法如下圖1所示。

2.1 脈沖壓縮

輸入的回波信號(hào)一般會(huì)含有噪聲干擾,為了更真實(shí)仿真實(shí)際的回波處理,對(duì)輸入的回波信號(hào)先進(jìn)行了脈沖壓縮,本文通過匹配濾波實(shí)現(xiàn)信號(hào)的脈沖壓縮。

在時(shí)域上,根據(jù)發(fā)射信號(hào)s(t)可描述匹配濾波器的沖擊響應(yīng)h(t)為:

匹配濾波器輸出的時(shí)域表達(dá)式為:

其中*代表卷積運(yùn)算,X(t)作為回波信號(hào),可以看作是發(fā)送信號(hào)s(t)的延時(shí)信號(hào),因此卷積計(jì)算結(jié)果會(huì)在延時(shí)處形成一個(gè)尖峰。

而在頻域上,匹配濾波是乘法運(yùn)算,比卷積運(yùn)算其運(yùn)算量減少。因此,在實(shí)際的實(shí)現(xiàn)上,通常是先對(duì)回波信號(hào)進(jìn)行FFT 變換,轉(zhuǎn)換到頻域上與本地參考信號(hào)相乘,最后使用逆FFT 運(yùn)算,本文也采用的是這一種實(shí)現(xiàn)方式。

設(shè)輸入信號(hào)的頻譜為X(w),本地待匹配信號(hào)的共軛頻域?yàn)镾(w),則有:

最后經(jīng)過IFFT可以得到匹配濾波的輸出:

本文采用的脈沖壓縮模塊處理算法的流程如下圖2所示。

2.2 動(dòng)目標(biāo)檢測(cè)(MTD)

動(dòng)目標(biāo)檢測(cè)(Moving Target Detection,MTD)是根據(jù)目標(biāo)的運(yùn)動(dòng)特性來實(shí)現(xiàn)目標(biāo)檢測(cè)的方法,是現(xiàn)代雷達(dá)信號(hào)處理中的重要方法,它能在完成多普勒濾波處理的同時(shí),實(shí)現(xiàn)相參積累,提高目標(biāo)回波的信噪比,增強(qiáng)了雷達(dá)探測(cè)運(yùn)動(dòng)目標(biāo)的能力[6-7]。

相參積累不是針對(duì)單個(gè)回波的一維處理,而是針對(duì)多個(gè)連續(xù)回波組成的二維處理,每個(gè)回波單獨(dú)作為二維數(shù)據(jù)的行數(shù)據(jù),然后對(duì)回波數(shù)據(jù)的每一個(gè)列向量做FFT處理,輸出的結(jié)果為“距離-多普勒”二維分布圖。假設(shè)每一個(gè)回波信號(hào)的一個(gè)周期內(nèi)點(diǎn)數(shù)為N,當(dāng)選擇M個(gè)周期來完成MTD 時(shí),則信號(hào)是一個(gè)行數(shù)為M,列數(shù)為N的二維矩陣,如下(5)所示:

將信號(hào)以矩陣的形式描述如下所示:

動(dòng)目標(biāo)檢測(cè)是對(duì)多個(gè)回波進(jìn)行的計(jì)算,主要完成相干積累,找到相位的偏移量,在算法中可以看成對(duì)式(6)所示的矩陣zM做列向量的傅里葉變換。

2.3 恒虛警檢測(cè)

為了在不間斷回波中,區(qū)分出回波中是否檢測(cè)到了真實(shí)的目標(biāo),本文采用的是恒虛警(Constant False-Alarm Rate)檢測(cè)。

恒虛警檢測(cè)的方法有很多種,可以將其分為CA-CFAR(平均值恒虛警檢測(cè))、GO-CFAR(最大值選擇恒虛警檢測(cè))、OS-CFAR(排序式恒虛警檢測(cè))等[8-9]。本次采用得是CA-CFAR 來實(shí)現(xiàn)目標(biāo)檢測(cè),其處理框圖如圖3所示。

如圖3所示,D為監(jiān)測(cè)點(diǎn),在本文中選取當(dāng)前回波的功率最高點(diǎn)為監(jiān)測(cè)點(diǎn),為了更準(zhǔn)確地確定檢測(cè)門限,恒虛警檢測(cè)時(shí)需要在監(jiān)測(cè)點(diǎn)前后加上保護(hù)單元,其中保護(hù)單元的個(gè)數(shù)由動(dòng)目標(biāo)檢測(cè)運(yùn)算結(jié)果中的峰值主瓣寬度決定。去掉檢測(cè)點(diǎn)和保護(hù)單元外的其他數(shù)據(jù)作為干擾點(diǎn),計(jì)算這些干擾點(diǎn)的平均值,監(jiān)測(cè)點(diǎn)的值應(yīng)遠(yuǎn)大于這些干擾點(diǎn)的值,因此在最后加上一個(gè)自適應(yīng)的門限值來篩選就可以完成CA-CFAR的過程。

CA-CFAR檢測(cè)的原理為:

其中:α為歸一化門限系數(shù),為平均虛警概率,N為參考單元數(shù)。

Z為總的雜波功率水平估計(jì)。

3 異構(gòu)加速的目標(biāo)檢測(cè)算法的實(shí)現(xiàn)

3.1 平臺(tái)架構(gòu)

本文的結(jié)果在服務(wù)器上進(jìn)行驗(yàn)證,服務(wù)器的配置如下表1所示。

表1 實(shí)驗(yàn)平臺(tái)及配置Tab.1 Experiment platform configuration instructions

本次實(shí)驗(yàn)平臺(tái)的服務(wù)器為CPU+GPU 架構(gòu),是當(dāng)前最為普遍的一種服務(wù)器架構(gòu),既可以CPU 滿足高性能的多線程運(yùn)算,又可以通過GPU 并行加速可以提高數(shù)據(jù)運(yùn)算的速度。因此選用該平臺(tái)來設(shè)計(jì)實(shí)現(xiàn)目標(biāo)檢測(cè)系統(tǒng),并基于該平臺(tái)結(jié)構(gòu)及特性設(shè)計(jì)優(yōu)化的目標(biāo)檢測(cè)算法。

3.2 異構(gòu)加速的目標(biāo)檢測(cè)算法流程設(shè)計(jì)

本文將目標(biāo)檢測(cè)算法分為三個(gè)算法模塊,充分利用CPU和GPU的資源,將整個(gè)流程拆分到CPU和GPU并行處理,程序流程如下圖4所示。

其中,CPU 端主要負(fù)責(zé)算法流程中參數(shù)初始化、數(shù)據(jù)傳輸和流水控制。初始化的參數(shù)包含輸入回波數(shù)據(jù)的參數(shù),如脈沖周期、動(dòng)目標(biāo)檢測(cè)維度、虛警概率、每幀數(shù)據(jù)含有的脈沖數(shù)等等。GPU 端主要配合CPU 實(shí)現(xiàn)動(dòng)目標(biāo)檢測(cè)算法,本文將動(dòng)目標(biāo)檢測(cè)算法分為三個(gè)模塊,脈沖壓縮、MTD和CFAR。

由于三個(gè)模塊存在執(zhí)行先后關(guān)系,為最大程度利用運(yùn)算資源,提高實(shí)時(shí)性,設(shè)計(jì)如圖5所示的流水處理模型。本次實(shí)驗(yàn)中,采用二級(jí)流水的方式,每一級(jí)流水對(duì)應(yīng)CPU端的一個(gè)線程和GPU端并行處理算法。CPU 線程控制算法的順序執(zhí)行,GPU 則完成算法高效運(yùn)行。如圖5所示,當(dāng)?shù)谝患?jí)流水完成M個(gè)脈沖處理后,觸發(fā)二級(jí)流水完成后續(xù)的算法。

同時(shí),在設(shè)計(jì)的流水算法模塊基礎(chǔ)上,根據(jù)每個(gè)模塊的原理,將其并行優(yōu)化后再移植到GPU 上。并行優(yōu)化提升主要應(yīng)用在模塊算法內(nèi)部,如在動(dòng)目標(biāo)檢測(cè)算法中,輸入的數(shù)據(jù)為多個(gè)脈沖組成的二維的數(shù)據(jù),主要執(zhí)行的算法為列向量的傅里葉變換,每一列的傅里葉變換是獨(dú)立的,而且是執(zhí)行的算法是一致的,可以通過開啟GPU 多核并行優(yōu)化處理實(shí)現(xiàn)加速,如下圖6 所示;在恒虛警檢測(cè)中,每個(gè)脈沖的自適應(yīng)門限計(jì)算互不影響,也能并行處理多個(gè)脈沖數(shù)據(jù)。

由于本文的設(shè)計(jì)采用了多線程的流水處理,為保證算法的正確運(yùn)行,在模塊之間數(shù)據(jù)傳遞的過程中加入了標(biāo)志來保證模塊數(shù)據(jù)的正確獲取,當(dāng)且僅當(dāng)該模塊的數(shù)據(jù)被取走或計(jì)算完畢后方可覆蓋。

3.3 高性能GPU加速優(yōu)化

在GPU 代碼的實(shí)現(xiàn)過程中,不僅要關(guān)注算法本身的可并行性,還需要從內(nèi)存占用、調(diào)試流程、數(shù)據(jù)拷貝等方面來綜合考慮,進(jìn)行優(yōu)化。

(1)減少數(shù)據(jù)拷貝的次數(shù)

在動(dòng)目標(biāo)檢測(cè)的算法中,不僅要有單個(gè)脈沖內(nèi)的一維計(jì)算,也有多個(gè)脈沖間的多維計(jì)算,當(dāng)涉及到多維計(jì)算,且模塊間數(shù)據(jù)具有相關(guān)性的應(yīng)用場景中,盡量減少拷貝的次數(shù)可以大大提高整個(gè)動(dòng)目標(biāo)檢測(cè)算法的實(shí)時(shí)性。本次設(shè)計(jì)使用數(shù)據(jù)塊拷貝代替單個(gè)脈沖拷貝,即當(dāng)脈沖壓縮模塊累計(jì)完成M個(gè)脈沖壓縮計(jì)算后一次性拷貝到GPU 端進(jìn)行MTD 模塊。這樣的操作不僅可以減少數(shù)據(jù)拷貝的耗時(shí),同時(shí)又滿足動(dòng)目標(biāo)檢測(cè)模塊數(shù)據(jù)輸入的要求,大大提高了目標(biāo)檢測(cè)的實(shí)時(shí)性。

(2)固定GPU存儲(chǔ)空間

在本文的設(shè)計(jì)中,由于每個(gè)內(nèi)部算法模塊的流程是固定的,同時(shí)具有一定的時(shí)間先后關(guān)系,因此需要占用的GPU 內(nèi)存是固定的,重復(fù)地執(zhí)行空間申請(qǐng)和釋放會(huì)占用大量的時(shí)間,因此在程序的設(shè)計(jì)時(shí),需要對(duì)算法模塊整個(gè)執(zhí)行流程的GPU 內(nèi)存空間消耗進(jìn)行設(shè)計(jì),并在算法執(zhí)行初始申請(qǐng)空間,算法執(zhí)行結(jié)束后再釋放。

(3)采用乒乓存儲(chǔ)

數(shù)據(jù)的輸入是源源不斷地,在本次設(shè)計(jì)中為了保證提高實(shí)時(shí)性在進(jìn)行GPU 運(yùn)算時(shí),采用了固定空間存儲(chǔ)的方式,因此數(shù)據(jù)地覆蓋是不可避免的,為了防止數(shù)據(jù)覆蓋導(dǎo)致的錯(cuò)誤,本文設(shè)計(jì)了標(biāo)志位。但是僅依靠標(biāo)志位,會(huì)出現(xiàn)拷貝等待的問題消耗時(shí)間,因此本文設(shè)計(jì)了乒乓存儲(chǔ)的方式,申請(qǐng)了兩段內(nèi)存,避免了拷貝等待,以脈沖壓縮為例,如下圖7所示。

動(dòng)目標(biāo)模塊的輸入數(shù)據(jù)是前一個(gè)模塊,即脈沖壓縮的結(jié)果,但是,動(dòng)目標(biāo)檢測(cè)模塊的輸入數(shù)據(jù)不是單個(gè)脈沖數(shù)據(jù)構(gòu)成的一維數(shù)據(jù),而是多個(gè)脈沖數(shù)據(jù)構(gòu)成的二維數(shù)據(jù),處理時(shí)需要對(duì)數(shù)據(jù)的結(jié)構(gòu)進(jìn)行整理,這就導(dǎo)致這兩個(gè)模塊間的數(shù)據(jù)拷貝必不可少,并且只有將數(shù)據(jù)拷貝到MTD模塊的內(nèi)存中,才能繼續(xù)進(jìn)行脈沖壓縮的匹配濾波計(jì)算。如圖7所示,若只申請(qǐng)一塊內(nèi)存,則兩次匹配濾波計(jì)算需要等待轉(zhuǎn)置拷貝,而申請(qǐng)兩塊內(nèi)存可以讓匹配濾波計(jì)算不間斷執(zhí)行,避免了拷貝等待的時(shí)間消耗。因此本次設(shè)計(jì)采用乒乓存儲(chǔ)技術(shù),申請(qǐng)兩段空間來節(jié)省這一段時(shí)間的消耗。

(4)代碼調(diào)試的優(yōu)化

1)程序應(yīng)減少讀寫內(nèi)存次數(shù),以便有效降低時(shí)間,特別是對(duì)外部內(nèi)存操作。GPU 更擅長于計(jì)算,不擅長讀寫內(nèi)存。因此固定參數(shù)盡可寫在代碼里,而不是從內(nèi)存中讀取[10]。

2)CUDA 程序預(yù)編譯時(shí),對(duì)于整數(shù)和浮點(diǎn)數(shù)的處理不同,如果需使用浮點(diǎn)數(shù),必須將數(shù)值寫成浮點(diǎn)數(shù)。在調(diào)試過程中,可以使用打印或者查看內(nèi)存的方式來驗(yàn)證結(jié)果的準(zhǔn)確性。

3.4 結(jié)果分析

為了驗(yàn)證并行流水算法能在保證結(jié)果準(zhǔn)確的基礎(chǔ)上對(duì)實(shí)現(xiàn)實(shí)時(shí)性的提升,本文構(gòu)造了仿真的測(cè)試數(shù)據(jù),測(cè)試數(shù)據(jù)的參數(shù)如下表2所示。

如表2 所示,構(gòu)造的測(cè)試數(shù)據(jù)是以200 μs 為脈沖周期的,每個(gè)脈沖的數(shù)據(jù)含有8192個(gè)采樣點(diǎn)的浮點(diǎn)數(shù)。其中,為最大程度接近實(shí)際的場景,設(shè)置信噪比為60 dB,每積累128個(gè)脈沖進(jìn)行一次動(dòng)目標(biāo)檢測(cè)算法,后續(xù)稱每128 個(gè)脈沖數(shù)據(jù)為一幀。后續(xù)的測(cè)試,均以上述的參數(shù)進(jìn)行數(shù)據(jù)構(gòu)造,由于測(cè)試環(huán)境的限制,數(shù)據(jù)的接收不是按照脈沖周期接收的,因此后續(xù)的測(cè)試以數(shù)據(jù)文件的格式輸入,測(cè)試算法的耗時(shí)。

表2 測(cè)試數(shù)據(jù)參數(shù)Tab.2 Test data parameters

本文的結(jié)果分析分為兩部分,第一部分為準(zhǔn)確性驗(yàn)證,通過構(gòu)造回波數(shù)據(jù)來驗(yàn)證目標(biāo)檢測(cè)算法的結(jié)果是否正確。為了保證準(zhǔn)確性驗(yàn)證結(jié)果的可靠性,本文采用構(gòu)造多種類型的回波進(jìn)行多次驗(yàn)證實(shí)驗(yàn),其中包含無目標(biāo)、單目標(biāo)、多目標(biāo)的三種回波類型,將檢測(cè)結(jié)果與構(gòu)造回波的目標(biāo)數(shù)做比對(duì),結(jié)果與仿真數(shù)據(jù)全部一致,因此本文認(rèn)為,該算法的目標(biāo)檢測(cè)準(zhǔn)確性可靠。

第二部分為實(shí)時(shí)性分析,通過測(cè)試算法耗時(shí)來測(cè)試。由于算法的初始化階段和空間分配階段的耗時(shí)不是每個(gè)目標(biāo)檢測(cè)模塊都是需要的,因此,在本次實(shí)驗(yàn)的測(cè)試中不予考慮。為了保證實(shí)時(shí)性驗(yàn)證的可靠性,本次實(shí)時(shí)性的測(cè)試采用多次實(shí)驗(yàn)取平均的方式來提高實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,對(duì)不同類型的回波輸入進(jìn)行多次分模塊耗時(shí)測(cè)試和算法整體耗時(shí)測(cè)試,其結(jié)果如下表3所示。其中,整體算法耗時(shí)測(cè)試分為流水測(cè)試和非流水測(cè)試,驗(yàn)證異構(gòu)加速的性能。

表3 分模塊耗時(shí)測(cè)試結(jié)果Tab.3 Time-consuming test results

理論上,在非流水加速下,每幀數(shù)據(jù)的耗時(shí)等于所有模塊耗時(shí)的總和,每幀的耗時(shí)可以通過式(9)來計(jì)算:

其中,M為每幀數(shù)據(jù)含有的脈沖數(shù),t1為動(dòng)目標(biāo)檢測(cè)的耗時(shí),t0為脈沖壓縮的耗時(shí),t2為恒虛警檢測(cè)的耗時(shí),下同。本次實(shí)驗(yàn)中,設(shè)置M為128,將表3的數(shù)據(jù)代入得到非流水模式下理論上的耗時(shí)為7932.12 μs。

理論上,在流水加速下,平均耗時(shí)受最大耗時(shí)模塊約束,當(dāng)測(cè)試幀數(shù)為x幀時(shí),每幀的耗時(shí)可以通過式(10)來計(jì)算:

將表3中的實(shí)測(cè)模塊耗時(shí)數(shù)據(jù)代入式(10)可以得到理論上隨著測(cè)試幀數(shù)增大,平均耗時(shí)的變化趨勢(shì)圖,如下圖8所示。隨著測(cè)試幀數(shù)的不斷增加,每幀的平均耗時(shí)不斷減少,不斷趨近于最大耗時(shí)模塊的值,即5541.12 μs。因此,理論上,流水加速下的目標(biāo)檢測(cè)算法相比于非流水加速下的耗時(shí),提高了30.14%。

到達(dá)理論值需要無限數(shù)據(jù)量,實(shí)際不可能實(shí)現(xiàn),由圖8 所示,當(dāng)數(shù)據(jù)量大于100 時(shí),算法平均耗時(shí)已經(jīng)得到了明顯的改善。因此,本文取每次100 個(gè)回波幀數(shù)據(jù)取平均的實(shí)驗(yàn)方式,多次進(jìn)行實(shí)驗(yàn)測(cè)試,得到如表3所得數(shù)據(jù)。

由表3 可以得到,總體的耗時(shí)小于分模塊的耗時(shí)總和,這證明了流水設(shè)計(jì)的有效性,雖然還是一定程度上會(huì)受到數(shù)據(jù)傳輸、數(shù)據(jù)拷貝的影響,但是異構(gòu)加速下的動(dòng)目標(biāo)檢測(cè)的耗時(shí)約為5.98 ms,比非流水下提升了27.6%。

4 結(jié)論

由于動(dòng)目標(biāo)本身特征多樣、處于運(yùn)動(dòng)狀態(tài)的特性,導(dǎo)致回波的數(shù)量大并且檢測(cè)算法的運(yùn)算量較大的問題,因此對(duì)動(dòng)目標(biāo)進(jìn)行實(shí)時(shí)檢測(cè)具有一定的挑戰(zhàn)性。本文利用CPU+GPU 的異構(gòu)加速的方式來提高動(dòng)目標(biāo)檢測(cè)的實(shí)時(shí)性,采用CPU多線程主導(dǎo)、GPU多核并行運(yùn)算相結(jié)合的流水算法處理,最大化利用運(yùn)算資源。本文設(shè)計(jì)將動(dòng)目標(biāo)檢測(cè)算法細(xì)分為三個(gè)模塊,脈沖壓縮模塊、MTD和CA-CFAR,使用模塊內(nèi)并行加速,模塊間流水執(zhí)行的方式,移植到CPU+GPU 架構(gòu)的服務(wù)器上,充分利用了計(jì)算機(jī)的運(yùn)算資源和存儲(chǔ)資源,實(shí)現(xiàn)了算法的實(shí)時(shí)處理,單幀的計(jì)算時(shí)間約為5.98 ms,比非流水加速下提高了27.6%。

GPU 和CPU 異構(gòu)協(xié)同并行處理,可以更高效利用計(jì)算機(jī)的資源,設(shè)計(jì)時(shí),需考慮不同算法模塊間的數(shù)據(jù)拷貝,盡可能減少拷貝的耗時(shí),同時(shí)還需根據(jù)每個(gè)功能模塊的耗時(shí)來進(jìn)行流水設(shè)計(jì),否則在某些時(shí)刻中會(huì)出現(xiàn)空閑狀態(tài)運(yùn)算,導(dǎo)致效率得不到有效的提升。

后續(xù),將對(duì)動(dòng)目標(biāo)檢測(cè)算法增加更多的模塊,如運(yùn)動(dòng)補(bǔ)償、目標(biāo)跟蹤等等,通過單模塊的耗時(shí)分析,通過將新的模塊加入原有流水或者新增多級(jí)流水的方式,在保證動(dòng)目標(biāo)檢測(cè)正確性和實(shí)時(shí)性的基礎(chǔ)上,增加更為復(fù)雜的功能。

猜你喜歡
實(shí)時(shí)性脈沖流水
他克莫司聯(lián)合超脈沖CO2點(diǎn)陣激光治療慢性濕疹的療效觀察
脈沖工況氧氣緩沖罐裂紋修復(fù)實(shí)踐
流水
流水有心
航空電子AFDX與AVB傳輸實(shí)時(shí)性抗干擾對(duì)比
超音頻復(fù)合脈沖GMAW電源設(shè)計(jì)
計(jì)算機(jī)控制系統(tǒng)實(shí)時(shí)性的提高策略
可編程控制器的實(shí)時(shí)處理器的研究
前身寄予流水,幾世修到蓮花?
落紅只逐東流水
天等县| 南昌县| 潼关县| 台东市| 日喀则市| 肥城市| 林周县| 阿拉善右旗| 高雄市| 夏津县| 楚雄市| 灯塔市| 北安市| 新昌县| 岳阳市| 革吉县| 都匀市| 华容县| 宜阳县| 庐江县| 鄂托克前旗| 句容市| 盘锦市| 白朗县| 惠安县| 隆林| 南靖县| 和硕县| 建湖县| 拉孜县| 北辰区| 浦城县| 砚山县| 怀宁县| 江津市| 镇赉县| 华宁县| 虎林市| 睢宁县| 江山市| 延吉市|