俞平原,金數(shù)波
(中國工程物理研究院 電子工程研究所,四川 綿陽 621900)
?
降低OFDM系統(tǒng)PAPR的TR方法及其FPGA實(shí)現(xiàn)
俞平原,金數(shù)波
(中國工程物理研究院 電子工程研究所,四川 綿陽 621900)
針對(duì)正交頻分復(fù)用(OFDM)系統(tǒng)的高峰均功率比問題,介紹了一種改進(jìn)的載波保留(TR)方法,該算法應(yīng)用時(shí)域核函數(shù)構(gòu)造時(shí)域核函數(shù)矩陣并進(jìn)行縮放參數(shù)優(yōu)化,迭代過程復(fù)雜度低且性能良好。設(shè)計(jì)了一種簡(jiǎn)化的OFDM發(fā)射機(jī)方案以驗(yàn)證該算法在實(shí)際系統(tǒng)中的有效性,給出了在FPGA上實(shí)現(xiàn)該方案的整體架構(gòu)及關(guān)鍵模塊。硬件測(cè)試結(jié)果表明該OFDM發(fā)射機(jī)的峰均比得到了有效抑制,驗(yàn)證了該TR算法的正確性,證明其有較好的應(yīng)用前景。
正交頻分復(fù)用;峰均功率比;TKM-TR;FPGA
正交頻分復(fù)用(Orthogonal Frequency Division Multiplexing,OFDM)技術(shù)因其頻譜效率高、抗多徑能力強(qiáng)以及實(shí)現(xiàn)簡(jiǎn)單等優(yōu)點(diǎn),受到人們的廣泛關(guān)注,但其仍有一些關(guān)鍵問題亟待解決。其中,高峰均功率比(Peak-to-Average Power Ratio,PAPR)問題是OFDM的一個(gè)主要缺陷[1]。針對(duì)該問題,已有許多算法仿真研究[2]。本文介紹了一種高性能、低復(fù)雜度的改進(jìn)載波保留(Tone Reservation,TR)方法[3],并設(shè)計(jì)了一種簡(jiǎn)化的OFDM發(fā)射機(jī)以驗(yàn)證該算法在實(shí)際工程中的有效性。具體介紹了該發(fā)射機(jī)各模塊特別是其中TR算法模塊在FPGA中的實(shí)現(xiàn)過程,并給出了該系統(tǒng)的測(cè)試方案及測(cè)試結(jié)果。
1.1 OFDM及載波保留技術(shù)簡(jiǎn)介
對(duì)于N個(gè)子載波的離散時(shí)間的OFDM信號(hào)xn表示為
(1)
那么OFDM信號(hào)的峰均功率比為
(2)
載波保留(Tone Reservation,TR)方法保留Nr個(gè)子載波作為峰值抑制子載波(Peak Reduction Tones,PRT)來生成峰值抵消信號(hào),而剩下的N-Nr個(gè)子載波用來傳輸信號(hào)。
那么,在存在Nr個(gè)保留的子載波的情況下,時(shí)域信號(hào)為
(3)
(4)
1.2 TKM-TR算法介紹
TKM-TR方法是一種高性能、低復(fù)雜度的次優(yōu)迭代算法。在每次迭代中,利用時(shí)域核函數(shù)循環(huán)右移構(gòu)造時(shí)域核函數(shù)矩陣,并設(shè)置優(yōu)化問題為該矩陣縮放逼近切削信號(hào)的形式,然后求解得到峰值抑制信號(hào)。
時(shí)域核函數(shù)為
(5)
(6)
(7)
(8)
(9)
解此優(yōu)化問題,得到TKM-TR算法得到最優(yōu)縮放向量β為
(10)
因此,時(shí)域峰值抵消信號(hào)為c=-MPβ,那么,經(jīng)過峰值抵消后的OFDM信號(hào)可由式(3)得到。
TKM-TR算法的流程如圖1所示。
圖1 TKM-TR算法流程圖
2.1 系統(tǒng)方案設(shè)計(jì)
考慮到實(shí)現(xiàn)難度及測(cè)試主體需求,本設(shè)計(jì)實(shí)現(xiàn)簡(jiǎn)化的OFDM發(fā)射機(jī),包括映射、IFFT、PAPR抑制及DAC模塊,通過MATLAB仿真表明,此簡(jiǎn)化的OFDM發(fā)射機(jī)可以驗(yàn)證PAPR抑制算法的能力。
系統(tǒng)總體架構(gòu)如圖2所示。根據(jù)實(shí)現(xiàn)功能的不同,發(fā)射機(jī)分為若干模塊,其中ROM模塊存儲(chǔ)0、1數(shù)據(jù),根據(jù)時(shí)鐘及控制信號(hào)輸出;M-QAM映射模塊將0、1數(shù)據(jù)映射為QAM符號(hào);TR映射模塊將頻域符號(hào)映射到數(shù)據(jù)子載波,并實(shí)現(xiàn)L倍過采樣;IFFT處理模塊和PAPR抑制模塊通過一定的時(shí)序?qū)?shù)據(jù)流進(jìn)行基帶處理,然后經(jīng)過DAC后得到模擬信號(hào)。控制模塊(Controls Generator)和時(shí)鐘生成模塊(Clock Generator)產(chǎn)生處理模塊需要的時(shí)鐘和控制信號(hào)。
圖2 OFDM發(fā)射機(jī)總體架構(gòu)
2.2 系統(tǒng)參數(shù)設(shè)置
本設(shè)計(jì)設(shè)定子載波數(shù)為256個(gè),總帶寬20 MHz。為得到準(zhǔn)確的PAPR信息,本文采用4倍過采樣,所以需要1 024點(diǎn)IFFT處理模塊,則子載波間隔為19.5 kHz,即OFDM符號(hào)周期為51.2 μs。過采樣前數(shù)據(jù)為5 MHz,由于采用16QAM映射,4個(gè)輸入比特對(duì)應(yīng)一組調(diào)制后的I/Q兩路數(shù)據(jù),則輸入數(shù)據(jù)需5 MHz×4=20 MHz的時(shí)鐘。實(shí)現(xiàn)的PAPR抑制算法保留32個(gè)(12.5%)子載波,最終,未考慮編碼OFDM基帶處理后輸出的最大有效數(shù)據(jù)率為
所以,本文設(shè)計(jì)的OFDM發(fā)射機(jī)主要指標(biāo)總結(jié)如表1所示。
表1 OFDM發(fā)射機(jī)參數(shù)
2.3 數(shù)據(jù)格式
從圖3可以看出,在總量化位寬為15位時(shí),算法性能與浮點(diǎn)性能相比幾乎無失真,10位時(shí)有約0.1~0.2 dB性能下降,8位時(shí)有0.2~0.3 dB性能下降。本文實(shí)現(xiàn)的TKM-TR算法為低復(fù)雜度的算法,同時(shí)考慮到采用的FPGA芯片為Xilinx的XC7VX690T,提供的硬件資源相對(duì)所實(shí)現(xiàn)的OFDM系統(tǒng)十分充裕,DAC為TI公司的DAC5681,支持最高16位1 Gsample/s速率LVDS輸入,同時(shí)本文側(cè)重于算法功能的正確性驗(yàn)證,所以本文設(shè)定硬件平臺(tái)上系統(tǒng)的所有信號(hào)統(tǒng)一為15 bit有符號(hào)二進(jìn)制。
圖3 TKM-TR算法浮點(diǎn)及不同量化位寬性能比較(從左到右、從上到下依次為浮點(diǎn)、15位、10位和8位)
本節(jié)根據(jù)第二節(jié)的方案設(shè)計(jì),使用Xilinx的Vivado 2014.2集成開發(fā)軟件實(shí)現(xiàn)各主要功能模塊的FPGA設(shè)計(jì)及系統(tǒng)集成。
3.1 16QAM模塊
3.2 TR映射模塊
TR映射模塊的功能是將輸入的16QAM數(shù)據(jù)映射到OFDM數(shù)據(jù)子載波上。對(duì)頻域OFDM信號(hào)利用中間補(bǔ)0的方式進(jìn)行4倍過采樣,此操作也在TR映射模塊中實(shí)現(xiàn)。實(shí)現(xiàn)TR映射模塊的主要思路是:將數(shù)據(jù)子載波位置(過采樣后)信息保存在ROM表中,輸入數(shù)據(jù)流采用5 MHz時(shí)鐘,讀取子載波位置后作為數(shù)據(jù)地址存入雙口RAM中,到第128個(gè)輸入數(shù)據(jù)時(shí),使用20 MHz時(shí)鐘開始讀取RAM數(shù)據(jù)輸出,得到TR映射后的數(shù)據(jù)流。如此操作可避免雙口RAM中輸入、輸出數(shù)據(jù)地址沖突,實(shí)現(xiàn)輸入輸出流水線操作,提高處理效率。
3.3 IFFT模塊
IFFT模塊采用Xilinx LogiCORE IP Fast Fourier Transform v9.0實(shí)現(xiàn),根據(jù)本文的要求,配置該IP核變換長(zhǎng)度1 024點(diǎn),采用“Pipelined,Streaming I/O”結(jié)構(gòu)對(duì)數(shù)據(jù)流進(jìn)行流水線輸入輸出處理,數(shù)據(jù)結(jié)構(gòu)為定點(diǎn)縮放模式,縮放參數(shù)為“1010101011”,自然序輸出??紤]到IFFT處理可能的數(shù)據(jù)溢出和按比例縮小后的精度損失,經(jīng)過MATLAB與Modelsim仿真驗(yàn)證后,確定IFFT模塊采用24位輸入,輸入數(shù)據(jù)左移4位后高位擴(kuò)展輸入IFFT模塊,IFFT輸出只取后15位。
3.4 TKM-TR算法模塊
按照算法的功能,TKM-TR算法模塊的實(shí)現(xiàn)可分為兩個(gè)部分:Kernel_Gen和PAPR_Main模塊,算法框圖如圖4所示。
圖4 TKM-TR算法框圖
Kernel_Gen模塊的主要功能是生成原始的時(shí)域核函數(shù),有兩種實(shí)現(xiàn)方式。由于TKM-TR算法中PRT集位置的確定和時(shí)域核函數(shù)可以在初始階段生成,所以可以在MATLAB中直接生成時(shí)域核函數(shù),并導(dǎo)入到FPGA的LUT中,該方式的優(yōu)點(diǎn)是結(jié)構(gòu)簡(jiǎn)單、資源消耗少,但是缺點(diǎn)是在FPGA中其參數(shù)修改不便。另一種方式是在FPGA中嚴(yán)格按照式(5)、(6)進(jìn)行實(shí)現(xiàn),其缺點(diǎn)是實(shí)現(xiàn)較上一種方式復(fù)雜,但是其可重定制性好??紤]到本文使用的FPGA有充足的資源,選擇使用第二種方式。本文實(shí)現(xiàn)的Kernel_Gen模塊主要包括Parameter Buffer、PRT set Mapping、IFFT和Output Buffer四個(gè)子模塊,其中Parameter Buffer用來存儲(chǔ)PRT集,PRT set Mapping和TR映射模塊功能類似,實(shí)現(xiàn)頻域核函數(shù)的映射。為提高運(yùn)算速度,本設(shè)計(jì)將IFFT變換后生成的時(shí)域核函數(shù)并行存儲(chǔ)到M個(gè)相同的RAM中,在PAPR_Main模塊可以并行讀取時(shí)域核函數(shù)來構(gòu)建時(shí)域核函數(shù)矩陣,并實(shí)現(xiàn)后續(xù)流程的并行計(jì)算。其中M為集合S的最大長(zhǎng)度,MATLAB仿真中不限制集合S的最大長(zhǎng)度,而在FPGA實(shí)現(xiàn)時(shí)需有一個(gè)確定的長(zhǎng)度,通過MATLAB仿真,本文確定將M設(shè)置為12,可以幾乎不損失其性能。
PAPR_Main為PAPR抑制算法主模塊,包括Input Buffer、Search Threshold、Clipping and SearchS、Generatingβ(opt)、Circular Shifting和GeneratingMp等模塊。
ClippingandSearchS模塊根據(jù)得到的切削閾值A(chǔ),與輸入的OFDM信號(hào)比較,得到超過閾值的峰值位置集S。利用一個(gè)乒乓RAM緩存搜尋到一幀OFDM信號(hào)的集合S,以便能以同樣的處理時(shí)鐘連續(xù)輸入輸出,保持整個(gè)鏈路流水線運(yùn)行。同時(shí),該模塊針對(duì)集合S的位置按式(7)得到切削噪聲fn。其中使用到采樣點(diǎn)的相位提取和相位恢復(fù)功能,同樣使用CORDICIP核實(shí)現(xiàn)。
3.5 上變頻及DA模塊
該模塊將OFDM基帶信號(hào)實(shí)部和虛部分量同時(shí)進(jìn)行數(shù)字上變頻后疊加,得到70 MHz中頻信號(hào),然后將信號(hào)送入DAC模塊中進(jìn)行數(shù)模變換,得到的中頻70 MHz的模擬OFDM信號(hào),其中DAC的采樣速率設(shè)置為300 MHz。
3.6 系統(tǒng)集成
將以上模塊進(jìn)行系統(tǒng)集成,得到本文設(shè)計(jì)的簡(jiǎn)化OFDM發(fā)射機(jī),在一片XC7VX690T芯片上實(shí)現(xiàn)該電路,布局布線后LUT資源占用約5%,BRAM資源占用約30%,DSP48占用約8%,系統(tǒng)功耗估計(jì)為1.044 W。
測(cè)試分為兩部分:一部分是信號(hào)通過DAC后輸出到示波器中,通過示波器實(shí)時(shí)顯示信號(hào)波形,定性判斷OFDM信號(hào)的峰值特征;另一部分是將數(shù)據(jù)通過Vivado邏輯分析儀采出,輸出到MATLAB進(jìn)行數(shù)據(jù)處理,得到其CCDF曲線等信息。
將集成后的系統(tǒng)下載到FPGA中,將經(jīng)過上變頻及DAC進(jìn)行數(shù)模變換后的原OFDM信號(hào)和PAPR抑制后的信號(hào)輸出到示波器中直接觀測(cè)信號(hào)波形,得到原時(shí)域OFDM信號(hào)波形如圖5所示,經(jīng)過PAPR抑制后的OFDM信號(hào)如圖6所示。對(duì)兩圖進(jìn)行對(duì)比,圖5中,示波器中顯示200 μs原時(shí)域OFDM信號(hào)波形,包含約19.5個(gè)OFDM測(cè)試符號(hào),從示波器的測(cè)量結(jié)果得到,該段信號(hào)最大幅度為246 mV,最小為-240 mV。對(duì)于圖6,經(jīng)過PAPR抑制后時(shí)域OFDM信號(hào)波形,該段信號(hào)最大幅度為180 mV,最小為-180 mV??梢钥闯鲈璒FDM信號(hào)的大的波峰和波谷已經(jīng)得到抑制。
圖5 原時(shí)域OFDM信號(hào)波形(截圖)
圖6 經(jīng)過PAPR抑制后時(shí)域OFDM信號(hào)波形(截圖)
使用Vivado邏輯分析儀采集100個(gè)原OFDM符號(hào)和經(jīng)過TKM-TR抑制后的OFDM符號(hào),輸入到MATLAB讀取并進(jìn)行數(shù)據(jù)處理,得到其統(tǒng)計(jì)分析結(jié)果CCDF曲線,同時(shí)使用MATLAB進(jìn)行仿真,與板上測(cè)試數(shù)據(jù)對(duì)比,如圖7所示。經(jīng)過PAPR抑制后,MATLAB仿真結(jié)果的PAPR比硬件測(cè)試數(shù)據(jù)有細(xì)微(約0.05 dB)優(yōu)勢(shì),原因是FPGA中采用定點(diǎn)運(yùn)算,相對(duì)于MATLAB的浮點(diǎn)運(yùn)算,其精度有一些損失。
圖7 MATLAB仿真與Vivado邏輯分析儀采集數(shù)據(jù)CCDF曲線對(duì)比
該結(jié)果定量地驗(yàn)證了TKM-TR算法,F(xiàn)PGA硬件測(cè)試數(shù)據(jù)和MATLAB仿真結(jié)果吻合良好,證明了TKM-TR算法和硬件設(shè)計(jì)正確,測(cè)試方式有效。
針對(duì)OFDM系統(tǒng)峰均比問題,本文對(duì)TKM-TR算法進(jìn)行硬件實(shí)現(xiàn),在FPGA上實(shí)現(xiàn)了簡(jiǎn)化的OFDM發(fā)射機(jī),包括OFDM基帶處理、TKM-TR算法、上變頻及DA變換等功能。同時(shí)設(shè)計(jì)了該系統(tǒng)的測(cè)試方案,通過定性的時(shí)域信號(hào)觀測(cè)和定量的統(tǒng)計(jì)數(shù)據(jù)分析,驗(yàn)證了該設(shè)計(jì)的正確性和有效性,為TKM-TR算法在實(shí)際系統(tǒng)中的應(yīng)用提供了有力證據(jù)。
[1]VAN NEE R, PRASAD R. OFDM for wireless multimedia communications[M]. MA: Artech House. Inc., 2000.
[2]RAHMATALLAH Y, MOHAN S. Peak-to-average power ratio reduction in OFDM systems: a survey and taxonomy[J]. IEEE communications surveys & tutorials, 2013, 15(4): 1567-1592.
[3]YU P, JIN S. A low complexity tone reservation scheme based on time-domain Kernel matrix for PAPR reduction in OFDM systems[J]. IEEE transactions on broadcasting, 2015, 64(4): 710-716.
[4]TELLAMBURA C. Computation of the continuous-time PAR of an OFDM signal with BPSK subcarriers[J]. IEEE communications letters, 2001, 5(5): 185-187.
俞平原(1991— ),碩士生,主研OFDM系統(tǒng)及其關(guān)鍵技術(shù)等;
金數(shù)波(1968— ),研究員,主研飛行器測(cè)控系統(tǒng)、碼分多址、數(shù)字化接收機(jī)等。
責(zé)任編輯:薛 京
Tone reservation technique for OFDM PAPR reduction and its implementation with FPGA
YU Pingyuan,JIN Shubo
(InstituteofElectronicEngineering,ChinaAcademyofEngineeringPhysics,SichuanMianyang621900,China)
An improved tone reservation (TR) method for the high peak-to-average power ratio (PAPR) problem of orthogonal frequency division multiplexing (OFDM) system is studied. The algorithm exploits the time-domain kernel to construct time-domain kernel matrix, which is scaled by a scaling vector generated through an optimization problem, then the peak reduction signal is obtained with low complexity and high performance in the iterations. A simplified OFDM transmitter is designed to validate the effectiveness of the algorithm in the practical systems, then the structure and the key modules of the transmitter on FPGA is illuminated. The hardware test results show that the PAPR of the OFDM transmitter is reduced effectively, so the validity of the algorithm is verified, and it has good application value.
OFDM; PAPR; TKM-TR; FPGA
俞平原,金數(shù)波. 降低OFDM系統(tǒng)PAPR的TR方法及其FPGA實(shí)現(xiàn)[J]. 電視技術(shù),2016,40(11):85-90. YU P Y,JIN S B.Tone reservation technique for OFDM PAPR reduction and its implementation with FPGA [J]. Video engineering,2016,40(11):85-90.
TN911.72
A
10.16280/j.videoe.2016.11.018
2016-04-27