国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于4DSP+FPGA架構(gòu)數(shù)據(jù)處理板設(shè)計

2016-09-12 10:50董選明
電子技術(shù)應(yīng)用 2016年7期
關(guān)鍵詞:電平以太網(wǎng)高性能

董選明

(中國電子科技集團公司第三十八研究所,安徽 合肥 230088)

?

基于4DSP+FPGA架構(gòu)數(shù)據(jù)處理板設(shè)計

董選明

(中國電子科技集團公司第三十八研究所,安徽 合肥 230088)

為了滿足超高性能數(shù)據(jù)處理以及低功耗、簡單可編程性的應(yīng)用,設(shè)計了一款基于TI TMS320C6678芯片和Xilinx公司XC5VSX95T芯片的4DSP+FPGA架構(gòu)的數(shù)據(jù)處理板,同時設(shè)計了高帶寬的數(shù)據(jù)輸入輸出接口以及相關(guān)的時鐘、電源和復(fù)位電路,并通過具體的硬件電路實現(xiàn)。該數(shù)據(jù)處理板可廣泛應(yīng)用于航空設(shè)備、車載設(shè)備、惡劣條件下工作的特種設(shè)備,將有效提高設(shè)備的數(shù)據(jù)處理性能。

數(shù)字信號處理器;現(xiàn)場可編程門陣列;串行高速輸入輸出接口;復(fù)雜可編程邏輯器件

中文引用格式:董選明.基于4DSP+FPGA架構(gòu)數(shù)據(jù)處理板設(shè)計[J].電子技術(shù)應(yīng)用,2016,42(7):29-33,37.

英文引用格式:Dong Xuanming.A digital processing board design based on the architecture of 4DSP and FPGA[J].Application of Electronic Technique,2016,42(7):29-33,37.

0 引言

隨著數(shù)字信號處理器(Digital Signal Processor,DSP)和現(xiàn)場可編程門陣列器件(Field-Programmable Gate Array,F(xiàn)PGA)的發(fā)展,DSP+FPGA架構(gòu)在數(shù)據(jù)及信號處理系統(tǒng)中的應(yīng)用愈來愈廣泛。傳統(tǒng)的DSP芯片一般采用馮-諾依曼(Von Neumann)結(jié)構(gòu)或某種類型擴展,此種結(jié)構(gòu)本質(zhì)上是串行的,當(dāng)遇到需要處理的數(shù)據(jù)量大且處理速度高,但對運算結(jié)構(gòu)相對較簡單的底層信號處理算法來說顯不出優(yōu)點,適合采用FPGA硬件實現(xiàn)。因此,采用DSP+FPGA架構(gòu)的系統(tǒng)可以將二者優(yōu)點結(jié)合起來,兼顧速度和靈活性,既滿足底層信號處理要求,又滿足高層信號處理要求。

德州儀器(TI)推出 TMS320C66x系列最新數(shù)字信號處理器TMS320C6678與 TMS320TCI6609,是目前具有最高定/浮點運算能力的一代數(shù)字信號處理器,為開發(fā)人員帶來業(yè)界性能最高、功耗最低的DSP。TI TMS320C6678多核DSP非常適合需要超高性能、低功耗以及簡單可編程性場合的應(yīng)用。TI不但為 HPC(High Performance Computing)提供免費優(yōu)化庫,無需花費時間優(yōu)化代碼,即可便捷地實現(xiàn)最高性能,而且還支持C語言與OpenMP等標(biāo)準編程語言,因此開發(fā)人員可便捷地移植應(yīng)用,啟動 C66x多核 DSP的開發(fā)[1],充分發(fā)揮低功耗與高性能優(yōu)勢。為了滿足超高數(shù)據(jù)處理性能、低功耗以及簡單可編程性場合的應(yīng)用,設(shè)計了一款基于 TI8核高性能 DSP芯片TMS320C6678和Xilinx公司FPGA芯片XC5VSX95T的數(shù)據(jù)處理電路模塊,在6 U尺寸的模塊上設(shè)計了4片高性能 DSP,定點運算處理能力可達 1 280 GMAC,浮點運算處理能力可達640 GFLOP,并設(shè)計了大容量DDR3內(nèi)存(每片DSP內(nèi)存為1 GB,共4 GB)和2 GB的固態(tài)存儲,使得其可實現(xiàn)高性能、高數(shù)據(jù)吞吐量的定點/浮點運算。

模塊設(shè)計了大吞吐量的串行RapidIO(Serial Rapid IO,SRIO)和千兆以太網(wǎng),對外與其他模塊進行數(shù)據(jù)通信,數(shù)據(jù)帶寬達60 Gb/s,使得大數(shù)據(jù)量的輸入、大數(shù)據(jù)量處理和輸出成為現(xiàn)實。

1 電路總體設(shè)計

數(shù)據(jù)處理模塊的電路總體設(shè)計基于 4×DSP+FPGA架構(gòu),電路總體設(shè)計框圖如圖1所示。

圖1 數(shù)據(jù)處理模塊電路總體框圖

從功能上看,數(shù)據(jù)處理模塊可分為DSP小系統(tǒng)、FPGA模塊、RapidIO數(shù)據(jù)交換模塊[2]、以太網(wǎng)模塊、AD轉(zhuǎn)換模塊、各電平轉(zhuǎn)換模塊及其他電源、時鐘和控制邏輯等輔助電路,加上 DSP、FPGA等必要的驅(qū)動程序和板內(nèi)的控制邏輯,形成一個完整的、一體化的數(shù)字系統(tǒng)硬件平臺。

1.1DSP小系統(tǒng)

DSP小系統(tǒng)主要包含:DSP芯片組、DDR3內(nèi)存、Flash數(shù)據(jù)存儲、RS232接口、SRIO接口、SPI(Setial Peripheral Interface)接口。

如圖1所示,第一個DSP小系統(tǒng)作為主系統(tǒng),其他3個DSP系統(tǒng)作為從系統(tǒng)。4片DSP之間的通訊如下:在啟動過程中,從 DSP給主 DSP送 1個 GPIO(General Purpose Input/Output)信號,通過電平方式表示已經(jīng)啟動起來。系統(tǒng)啟動后,從DSP的信息通過SRIO發(fā)送給主DSP。J30J-31為調(diào)試接口,對外提供DSP的JTAG(Joint Test Action Group)口(板內(nèi)成菊花鏈[3])、串口、4個控制LED燈的GPIO口以及 CPLD、FPGA的JTAG加載口。4 個 DSP的 JTAG形成菊花鏈[4],連到調(diào)試接口 J30J-31上。同時,4個DSP的串口都連到調(diào)試接口上方便調(diào)試,該模塊設(shè)計只用主DSP的串口。兩個DSP之間,用超鏈接(Hyperlink)進行通訊[1]。

1.1.1DSP

電路設(shè)計采用 4片 TI公司的 TMS320C6678芯片,配合外圍時鐘、復(fù)位、DDR3、Flash等,為整個模塊提供數(shù)字處理平臺。TMS320C6678芯片為高性能八核數(shù)字信號處理器,外頻采用 100 MHz,內(nèi)核主頻為 1 GHz,采用擴展溫度型號,工作溫度-40℃~+100℃。該芯片內(nèi)部集成8個C66x CorePac DSPs的核,每個核工作在 1 GHz。在 C66x器件上,通過擴展 SIMD(Single Instruction Multiple Data)指令的寬度,提高了向量處理能力,可以處理128 bit的向量指令[1]。例如,QMPY32指令可以執(zhí)行兩個 32 bit數(shù)據(jù)向量的元素對元素相乘。

C66xDSP對浮點操作也支持SIMD。增強的向量處理能力加上原有的指令并行等級,DSP程序員通過應(yīng)用 TI的 C/C++優(yōu)化編譯器可以開發(fā)出更高級的并行代碼。每個核具有獨立的32 K數(shù)據(jù)一級 cache和 32 K指令一級cache,共享 512 K二級 cache。C66xDSP存儲單元接口支持DDR3 EMIF64內(nèi)存,控制單元片內(nèi)共享4 096 K SRAM存儲空間,支持高速串行接口,包括 1路 SRIO接口、兩路 PCIe接口、兩路 SGMII(Serial Gigabit Media Independent Interface)以太網(wǎng)接口等。C66xDSP支持其他低速接口如UART(Universal Asynchronous Receiver/Transmitter)串口,24位尋址寬度的MIF16并行總線、SPI、I2C、GPIOs等。

1.1.2DDR3內(nèi)存

每片 DSP設(shè)計采用 4片 MT41J128M16HA并聯(lián),提供64 bit數(shù)據(jù)位寬,共1 GB容量。MT41J128M16HA是Micro公司生產(chǎn)的 DDR3 SDRAM,規(guī)格為 16 Meg×16× 8 Banks,單片16位寬度,256 MB容量。

1.1.3Flash數(shù)據(jù)存儲

Flash數(shù)據(jù)存儲采用 Spansion公司 S29GL01G Flash芯片,16位寬度128 MB字節(jié)空間。一部分空間放置BOOT,主要用作存放操作系統(tǒng)的代碼以及用戶代碼、用戶配置和用戶數(shù)據(jù)。通過CPLD控制存儲系統(tǒng)的啟動程序、系統(tǒng)程序和用戶程序。DSP只能提供 24位地址線,F(xiàn)lash所需的高兩位地址線通過CPLD來擴展。CPLD采用Lattice公司的LCMXO2280C芯片,在DSP和其他芯片通訊間實現(xiàn)電平轉(zhuǎn)換功能。

1.1.4RS232接口

采用2片MAX3232作為RS232接口電平轉(zhuǎn)換芯片,共提供4路RS232接口。DSP和鏈接器之間連接MAX3232芯片,完成TTL/CMOS電平的UART信號轉(zhuǎn)換成標(biāo)準的RS232信號輸出和標(biāo)準的 RS232信號轉(zhuǎn)換成TTL/COMS電平輸入。

1.1.5SRIO和SPI接口

SRIO接口通過 80HCPS1848芯片進行數(shù)據(jù)交換,實現(xiàn)與FPGA、3個從DSP及客戶板通訊。SPI接口實現(xiàn)對AD9516的配置,給ADC提供可變的參考時鐘。

1.2FPGA模塊

FPGA模塊主要用做高速 ADC的算法處理,包含DDR2、SRIO、高速 ADC、RS422接口、JTAG/IO等接口部分。FPGA模塊如圖2所示。

圖2 FPGA模塊

1.2.1FPGA

FPGA模塊設(shè)計采用Xilinx公司FPGA芯片XC5VSX95T。XC5VSX95T是 Xilinx公司的 Virtex-5 SXT系列FPGA器件,帶有高級串行連接的信號處理邏輯,相對其他系列擁有更豐富的DSP資源。芯片XC5VSX95T有邏輯模塊 160×54,最大 RAM模塊 1 120 Kb,DSP48E 640個,CMT時鐘管理 6個 RocketIO,GTP 16個,總 IObank 20個,最大使用 IO數(shù) 680個[5]。本電路采用 1.2~3.3 V I/O操作電壓,14 720 slices,19個 bank,640個用戶 IO,1PCIe,4 MAC,16個GTP,配合外圍時鐘、復(fù)位、FPGA啟動加載電路等,為整個模塊提供邏輯算法。

1.2.2數(shù)據(jù)緩存電路

數(shù)據(jù)緩存電路由2片Micron公司的MT47H128M16-SDRAM芯片構(gòu)成,單片容量 2 Gb(16 M×16 bit×8 bank),共512 MB DDR2。該內(nèi)存芯片14 bit行地址,10 bit列地址,1.8 V供電,最高頻率 800 MHz,支持突發(fā)讀寫或者突發(fā)讀單寫,支持自刷新,64 ms內(nèi)刷新 8 192次[6],掛在FPGA上為系統(tǒng)提供數(shù)據(jù)緩存、協(xié)助系統(tǒng)完成多路控制等功能。

1.2.3RS422接口

采用2片MAX3076完成RS422電平轉(zhuǎn)換,提供2路RS422通信接口,支持單通道全雙工,16 Mb/s,3.3 V工作電壓,帶15 kV ESD(Electro-Static Discharge)保護。

1.2.4JTAG接口

JATG信號直接由 FPGA引出到連接器 J30J-31,作為調(diào)試及客戶指示燈接口。

1.3RapidIO模塊

RapidIO模塊為4個DSP及FPGA提供數(shù)據(jù)交換,同時,對外提供6個x4端口,使整個系統(tǒng)能夠通過SRIO數(shù)據(jù)交換實現(xiàn)通訊。RapidIO模塊電平轉(zhuǎn)換功能如圖 3所示。

選用IDT公司的RapidIO數(shù)據(jù)交換芯片80HCPS18-48CRMI完成數(shù)據(jù)電平轉(zhuǎn)換。該芯片是一款高性能RapidIO交換芯片,符合串行 RapidIO2.1協(xié)議要求[2],擁有 48路 SRIO端口,可配置為 12×4、18×2、18×1的端口工作方式,傳輸速率可為 1.25 Gbaud、2.5 Gbaud、3.125 Gbaud、5.0 Gbaud或 6.25 Gbaud;芯片內(nèi)部交換帶寬達到240 Gb/s,提供無阻塞的全雙工交換能力,可配置為短潛伏期(latency)的直通轉(zhuǎn)發(fā)(Cut-Through)或存儲轉(zhuǎn)發(fā)(Store-and-Forward)數(shù)據(jù)流,最大可支持40個同時多點傳送(multicast)和發(fā)送傳遞信號(broadcast),同時具有全局路由或本地端口路由。該芯片內(nèi)核電壓 1.0 V,IO電壓 3.3 V,串/并化器電壓 1.2 V[7]。

圖3 RapidIO模塊電平轉(zhuǎn)換功能框圖

1.4以太網(wǎng)模塊

圖1中每個DSP均可通過以太網(wǎng)同計算機通信,完成輸入輸出測試功能。以太網(wǎng)模塊如圖4所示。

圖4 以太網(wǎng)實現(xiàn)框圖

電路設(shè)計用MAVELL公司的PHY芯片88e1145。該芯片是一款4端口千兆以太網(wǎng)收發(fā)器[8],支持GMII、TBI、RGMII、RTBI以及SGMII接口,有4個RGMII時鐘模式,1.25 GHz串/并化器應(yīng)用于1000BASE-X光纖接口。每個收發(fā)器支持CAT5雙絞線100BASE-TX、1000BASE-T全雙工或半雙工以太網(wǎng)、CAT3/4/5電纜10BASE-T全雙工或半雙工以太網(wǎng),支持IEEE 100BASE-FX光纖網(wǎng)絡(luò)。同時,每個端口支持 PECL(The PHP Extension Community Library)接口應(yīng)用于 100BASE-FX,F(xiàn)EFI(Far-End Fault Indication)遠距離錯誤指示,集成數(shù)字自適應(yīng)均衡器、回聲消除器和串?dāng)_消除器,自動 MDI/MDIX切換,用戶配置port-by-port獨立MAC接口,支持IEEE 802.3U自動協(xié)商,軟件可編程LED模式,兩線串行接口和MDC/ MDIO,CRC校驗和包計數(shù)器,包生成器,自動校正 MAC接口輸出。

1.5電源方案實現(xiàn)

根據(jù)數(shù)據(jù)處理板內(nèi)電壓種類和各芯片上電順序需求分析以及提供的電源情況,電源設(shè)計方案如圖5所示。

板上功耗最大的為 80HCPS1848芯片,其所需的電源有1 V、1.2 V、3.3 V。1 V由LTM4620和TPS74801DRCT提供,1.2 V由LTM4620提供,3.3 V由3.5 V經(jīng)LTM4620提供。LTM4620輸入電壓范圍為4.5 V~16 V,輸出范圍0.6 V~5.3 V,可實現(xiàn)單端 26 A、雙端 13 A電流輸出。TPS74801DRCT輸出電壓可調(diào),電流1.5 A。

DSP所需電源有 1 V、1.5 V、1.8 V。1 V直接由UCD9222+UCD7242提供。1.5 V和 1.8 V由 5 V經(jīng)LTM4620提供。 DSP有上電時序要求,UCD9222+ UCD7242通過軟件控制4片DSP的上電時序,每個延時2 ms啟動,內(nèi)核電壓上電完成后,再上 1.8 V和 1.5 V,1.8 V和1.5 V通過LTM4620芯片的track腳的容值不同來調(diào)整,同時,也將RUN腳拉到CPLD,由前級power good來推動后級的使能。

圖5 電源樹

對電源要求較高的ADC、PLL供電,均用LDR(Low Dropout Regulator)提供。

1.6時鐘方案實現(xiàn)

圖6為時鐘方案圖,DSP所需的時鐘有 100 MHz、156.25 MHz。 156.25 MHz時 鐘 由 125M 晶 振 通 過MAX3638提供,而3個100 MHz時鐘則由外部100 MHz晶振通過CY2DL1504ZXIT提供。CPLD、PHY、FPGA配置所需25 MHz時鐘,由外部晶振經(jīng)過驅(qū)動器CY23EP05提供。RapidIO數(shù)據(jù)交換芯片所需的 156.25 MHz時鐘由 25 MHz外部時鐘通過 CDCM61004得到。FPGA芯片所需的時鐘有23.04 MHz、100 MHz和 125 MHz,23.04 MHz由外部時鐘提供,100 MHz和 125 MHz時鐘由25 MHz外部時鐘通過ICS844N255AkILft提供。

1.7復(fù)位電路

為了使電路可靠工作,復(fù)位電路特別重要,本電路板設(shè)計了上電復(fù)位、看門狗復(fù)位和芯片單獨復(fù)位3種復(fù)位模式,圖7為復(fù)位電路框圖。上電復(fù)位是整板硬復(fù)位,使用專用復(fù)位芯片 MAX811、控制邏輯配合實現(xiàn);第二種看門狗復(fù)位,由DSP給CPLD喂狗[9],CPLD內(nèi)部做計時器,一旦異常,產(chǎn)生復(fù)位脈沖,給板內(nèi)所有器件復(fù)位(包括DSP)。這種復(fù)位方式可通過脈寬控制進行調(diào)整:由DSP給CPLD喂狗,CPLD計時,一旦異常,由CPLD給復(fù)位芯片送出復(fù)位脈沖,復(fù)位芯片產(chǎn)生復(fù)位信號送給CPLD,CPLD將復(fù)位信號分發(fā)給整板,對所有器件進行復(fù)位;第三種通過DSP 給CPLD寫寄存器,由CPLD獨立復(fù)位各個芯片。

MAX811芯片內(nèi)部自帶上電復(fù)位時間控制,芯片產(chǎn)生的復(fù)位信號送入控制邏輯CPLD,由CPLD控制復(fù)位板上所有芯片,其最小 140 ms的復(fù)位時間可保證可靠地復(fù)位整個系統(tǒng)。手動復(fù)位由板上提供的按鈕以及MAX811內(nèi)建的施密特整形電路及延時輸出電路,外加CPLD共同實現(xiàn)??撮T狗復(fù)位,由CPLD內(nèi)建看門狗控制邏輯,配合MAX811共同完成看門狗功能。芯片單獨復(fù)位則是通過板內(nèi)控制單元(CPU)通過寫CPLD提供的復(fù)位控制寄存器的方式,實現(xiàn)各芯片單獨復(fù)位。

2 結(jié)束語

基于4×DSP(8核DSP TMS320C6678)+FPGA架構(gòu)設(shè)計的數(shù)據(jù)處理模塊具有高速信號處理能力和高帶寬的數(shù)據(jù)輸入輸出接口,處于國內(nèi)領(lǐng)先地位,可用于高性能數(shù)據(jù)處理、信號處理、圖像處理等場合。在設(shè)計中采用了寬溫、低功耗的 DSP,使其具有高可靠性、低功耗、高密度、耐振動性以及寬溫度工作范圍的特性,可廣泛用于航空設(shè)備、車載設(shè)備、惡劣條件下工作的特種設(shè)備,大大提高設(shè)備的穩(wěn)定性和數(shù)據(jù)處理性能。

圖6 時鐘方案圖

圖7 復(fù)位電路框圖

[1]Texas Instruments Data Manual.TMS320C6678 multicore fixed and floating-point digital signal processor[EB/OL]. [2015-12-15].http://www.ti.com.

[2]RapidIOTM.Interconnect Specification[EB/OL].[2015-12-18]. http://www.rapidio.org.

[3]美國國家標(biāo)準學(xué)會(ANSI).ANSI_VITA 46.0-2007_American National Standard for VPX Baseline Standard[EB/OL]. [2015-12-18].http://www.vita.com.

[4]JTAG.國際標(biāo)準測試協(xié)議[EB/OL].[2015-12-20].http:// www.jtag.com.

[5]Xilinx.Virtex-5 Family Overview[EB/OL].[2015-12-13]. http://www.xilinx.com.

[6]MachXO.Family Handbook(Lattice semiconductor corporation [EB/OL].[2015-11-19].http://www.datasheetarchive.com.

[7]Idt.80HCPS1848 Product Specification[EB/OL].[2015-12-19].http://www.idt.com.

[8]Marvell.Alaska?Quad Gigabit Ethernet Transceiver 88E1141/88E1145[EB/OL].[2015-12-13].http://www. marvell.com.

[9]張雪芹,楊立軍,胡炫.TMS320F2812系統(tǒng)中的軟件復(fù)位方法[J].單片機與嵌入式系統(tǒng)應(yīng)用,2009(2):70-71.

A digital processing board design based on the architecture of 4DSP and FPGA

Dong Xuanming
(Institute of China Electronics Technology Group Co.,LTD.38,Hefei 230088,China)

In order to satisfy the application of high performance data processing,low power consumption and simple programmability,a 4Digital Signal Processor(4DSP)+Field-Programmable Gate Array(FPGA)architecture digital processing board was designed based on the chip TI TMS320C6678 and XilinxXC5VSX95T,with high bandwidth data input/output interface.This digital processing board implemented by specific hardware circuit will be widely used in aviation equipment,vehicle equipment and other special equipment worked in hard condition,which will effectively improve the data processing performance of the equipment.

DSP;FPGA;SRIO;CPLD

TN4

A

10.16157/j.issn.0258-7998.2016.07.007

2016-01-23)

董選明(1967-),男,本科,高級工程師,主要研究方向:數(shù)字模塊和嵌入式計算機。

猜你喜歡
電平以太網(wǎng)高性能
基于1500以太網(wǎng)養(yǎng)豬場的智能飼喂控制系統(tǒng)的設(shè)計與實現(xiàn)
談實時以太網(wǎng)EtherCAT技術(shù)在變電站自動化中的應(yīng)用
一款高性能BGO探測器的研發(fā)
高性能砼在橋梁中的應(yīng)用
NPC五電平Z源逆變器的設(shè)計研究
一種90W高功率以太網(wǎng)供電系統(tǒng)的設(shè)計
淺談EPON與工業(yè)以太網(wǎng)在貴遵高速公路中的應(yīng)用
基于三電平光伏并網(wǎng)逆變器控制系統(tǒng)的研究與實踐
基于NPC三電平變換器的STATCOM研究
SATA推出全新高性能噴槍SATAjet 5000 B
康平县| 枝江市| 三河市| 崇文区| 西宁市| 成武县| 阿荣旗| 略阳县| 恩施市| 社会| 通许县| 阳城县| 怀集县| 班玛县| 浑源县| 建阳市| 平原县| 永泰县| 铜陵市| 普兰店市| 肥东县| 云梦县| 灌云县| 达拉特旗| 东光县| 清苑县| 秦安县| 石楼县| 灌阳县| 德化县| 永靖县| 洪江市| 晋中市| 汝南县| 同德县| 亳州市| 沙坪坝区| 湖州市| 密山市| 绥芬河市| 凌云县|