梅 盈,劉東浩,王 鋒,3,鄧 輝,戴 偉,3,季凱帆
(1.昆明理工大學(xué)云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500;2.中國(guó)科學(xué)院國(guó)家天文臺(tái),北京 100012;3.中國(guó)科學(xué)院云南天文臺(tái),云南 昆明 650011)
中國(guó)頻譜射電日像儀FITS-IDI文件格式研究
梅 盈1,劉東浩2,王 鋒1,3,鄧 輝1,戴 偉1,3,季凱帆1
(1.昆明理工大學(xué)云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500;2.中國(guó)科學(xué)院國(guó)家天文臺(tái),北京 100012;3.中國(guó)科學(xué)院云南天文臺(tái),云南 昆明 650011)
我國(guó)新一代中國(guó)頻譜射電日像儀(Chinese Spectral Radio Heliograph,CSRH)原始觀測(cè)數(shù)據(jù)采用自定義格式,在進(jìn)行后續(xù)處理與共享使用時(shí)必須轉(zhuǎn)換相應(yīng)的格式。在分析FITS-IDI(FITS Interferometry Data Interchange)格式的基礎(chǔ)上,結(jié)合CSRH的實(shí)際觀測(cè)模式與數(shù)據(jù)產(chǎn)出方式,定義與設(shè)計(jì)了符合項(xiàng)目情況的FITS-IDI格式及字段,并對(duì)FITS-IDI文件中若干字段的值如何獲取、計(jì)算進(jìn)行了深入討論。根據(jù)定義生成的FITS-IDI文件已成功導(dǎo)入CASA軟件,并可以進(jìn)行后續(xù)處理。經(jīng)過(guò)對(duì)CASA測(cè)量集文件的核實(shí),證明了數(shù)據(jù)生成的正確性。本研究有效地推進(jìn)了CSRH的建設(shè)工作,也對(duì)其他射電干涉陣數(shù)據(jù)存儲(chǔ)有一定的參考價(jià)值。
中國(guó)頻譜射電日像儀;FITS-IDI;數(shù)據(jù)存儲(chǔ)
CN53-1189/P ISSN1672-7673
中國(guó)頻譜射電日像儀是同時(shí)以高時(shí)間、高空間和高頻率分辨率對(duì)太陽(yáng)進(jìn)行射電頻譜成像的設(shè)備,將在厘米—分米波段首次對(duì)日冕進(jìn)行層析觀測(cè),探測(cè)日冕大氣,研究太陽(yáng)活動(dòng)的動(dòng)力學(xué)性質(zhì)。中國(guó)太陽(yáng)射電日像儀分為低頻陣(CSRH-I)與高頻陣(CSRH-II)兩部分。CSRH-I數(shù)據(jù)接收機(jī)每3 ms產(chǎn)生一個(gè)0.1 MBytes格式自定義的裸數(shù)據(jù)文件。為便于數(shù)據(jù)歸檔以及共享交流,將原始數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)格式是必要的。在前期,項(xiàng)目組嘗試UVFITS格式[1],但該格式并非FITS標(biāo)準(zhǔn)格式,很多軟件無(wú)法打開(kāi)。本文在前期工作的基礎(chǔ)上[1-2],進(jìn)一步討論了利用FITS-IDI文件的可行性。FITS-IDI文件可將射電干涉測(cè)量數(shù)據(jù)及其校準(zhǔn)數(shù)據(jù)存儲(chǔ)為一系列FITS二進(jìn)制表。FITS-IDI格式符合FITS文件標(biāo)準(zhǔn)[3-4],一般用于VLBI的數(shù)據(jù)存儲(chǔ),如我國(guó)上海天文臺(tái)VLBI觀測(cè)中采用了FITS-IDI格式。但針對(duì)射電干涉陣的數(shù)據(jù)如何用FITS-IDI格式存儲(chǔ),國(guó)內(nèi)外的資料均較少,特別是生成的文件導(dǎo)入CASA(http://casa.nrao.edu)后如何確保數(shù)據(jù)的正確性具有一定的難度。雖然國(guó)家天文臺(tái)在FITS-IDI文檔[4]中進(jìn)行了一些說(shuō)明,但缺少具體的例子,部分?jǐn)?shù)據(jù)的定義與計(jì)算沒(méi)有具體的說(shuō)明,給中國(guó)太陽(yáng)射電日像儀數(shù)據(jù)存儲(chǔ)工作帶來(lái)了較大的困難。
為了保障中國(guó)太陽(yáng)射電日像儀的建設(shè)與今后的數(shù)據(jù)共享,本文在詳細(xì)分析FITS-IDI文件格式的基礎(chǔ)上,重點(diǎn)討論了針對(duì)中國(guó)太陽(yáng)射電日像儀的實(shí)際情況設(shè)計(jì)的字段,并詳細(xì)介紹了FITS-IDI文件中部分關(guān)鍵數(shù)據(jù)的獲取和計(jì)算方法。本文最終合成的FITS-IDI文件可完整地導(dǎo)入CASA軟件,供中國(guó)太陽(yáng)射電日像儀后續(xù)數(shù)據(jù)處理工作參考,并對(duì)其他射電干涉陣進(jìn)行FITS-IDI格式存儲(chǔ)有較好的參考價(jià)值。
太陽(yáng)射電日像儀,采用的數(shù)字接收機(jī)輸出格式為自定義格式,通過(guò)逐幀的方式向外進(jìn)行數(shù)據(jù)發(fā)送,每一幀包括系統(tǒng)參數(shù)和相關(guān)處理結(jié)果。以CSRH-I低頻陣為例,每3 ms生成一幀數(shù)據(jù),每幀數(shù)據(jù)由幀頭和數(shù)據(jù)組成,總數(shù)據(jù)量為0.1 Mbytes。一次完整的觀測(cè)包括8幀,分別是(左旋、右旋)×(0.4~0.8 GHz,0.8~1.2 GHz,1.2~1.6 GHz,1.6~2.0 GHz),每幀里面包括1個(gè)波段,16個(gè)通道。
為滿(mǎn)足FITS-IDI的存盤(pán)要求,考慮到上述格式,可以將一次觀測(cè)數(shù)據(jù)認(rèn)為是4個(gè)波段(Band)×2個(gè)極化(Polarization)×16個(gè)通道(Channel,每個(gè)通道25 MHz)。但在FITS-IDI存儲(chǔ)中,如果將4個(gè)波段的全部數(shù)據(jù)一次存儲(chǔ)到一個(gè)UV_DATA表中是不現(xiàn)實(shí)的,這是因?yàn)?個(gè)波段、不同極化的數(shù)據(jù)來(lái)自于不同的時(shí)間,簡(jiǎn)單的合并會(huì)導(dǎo)致各個(gè)采樣時(shí)間的錯(cuò)亂。為保證數(shù)據(jù)的準(zhǔn)確性,在FITS-IDI文件生成時(shí),一次保存一個(gè)波段、一個(gè)極化和16個(gè)通道的數(shù)據(jù)是最合理的,也利于后續(xù)導(dǎo)入CASA中進(jìn)行處理。
表1 主HDU表中的強(qiáng)制關(guān)鍵字Table 1 Mandatory keywords in the primary HDU
參考AIPS對(duì)干涉儀觀測(cè)數(shù)據(jù)的保存格式[5],F(xiàn)ITS-IDI文件包含兩部分:主HDU(Header Data Unit)和二進(jìn)制表(binary tables)。其中主HDU不存儲(chǔ)任何數(shù)據(jù)信息,主要數(shù)據(jù)存儲(chǔ)在二進(jìn)制表中。首先指明FITS-IDI文件主HDU和二進(jìn)制表頭中必須包含的關(guān)鍵字,如表1和表2。
表2 FITS-IDI文件表頭中的強(qiáng)制關(guān)鍵字Table 2 Mandatory keywords in a FITS-IDI table header
2.1 主HDU
與標(biāo)準(zhǔn)FITS的HDU一樣,F(xiàn)ITS-IDI文件的主HDU不存儲(chǔ)數(shù)據(jù)信息。CSRH的主HDU包含表1和表2中所有關(guān)鍵字。由于主HDU中不存儲(chǔ)任何數(shù)據(jù),NAXIS=0,PCOUNT=GCOUNT=0。在FITSIDI文件主HDU的強(qiáng)制關(guān)鍵字中,必須將EXTEND、GROUPS的值置為T(mén)。
2.2 二進(jìn)制表
要確保太陽(yáng)射電日像儀的數(shù)據(jù)保存后可以導(dǎo)入CASA或其他常用射電軟件中,所生成的FITS-IDI文件就需要保存幾個(gè)重要的二進(jìn)制表。CSRH是一個(gè)干涉陣,不像單天線(xiàn)射電望遠(yuǎn)鏡一樣需要進(jìn)行掃描,觀測(cè)時(shí)可以直接成像[6],因此,CSRH必須的5個(gè)二進(jìn)制表如表3。對(duì)CASA源程序的分析表明,這5個(gè)表的數(shù)據(jù)可以正常導(dǎo)入CASA。
上述每個(gè)表中包含頭和數(shù)據(jù),頭表及數(shù)據(jù)表中包含一系列關(guān)鍵字。在這些關(guān)鍵字中,除了標(biāo)準(zhǔn)的FITS關(guān)鍵字以外,其他均采用自定義參數(shù)的方式描述定義。在下述各表中說(shuō)明在太陽(yáng)射電日像儀中需要定義的字段及其相應(yīng)的計(jì)算方法。
2.2.1 天線(xiàn)(ANTENNA)表
太陽(yáng)射電日像儀低頻陣(CSRH-I)中,設(shè)有40根天線(xiàn),編號(hào)為0-39,天線(xiàn)名為IA0-IA13、IB1-IB13、IC1-IC13。天線(xiàn)的相關(guān)信息存放在FITS-IDI文件的ANTENNA表中。在天線(xiàn)表表頭中,除了表1和表2中的關(guān)鍵字外,另需加上表4中的兩個(gè)關(guān)鍵字,其中EXTNAME=‘ANTENNA’,TABREV=1。由于天線(xiàn)位置固定,天線(xiàn)的信息與時(shí)間變化無(wú)關(guān),設(shè)置字段TIME=TIME_INTERVAL=0。天線(xiàn)表的字段中存儲(chǔ)天線(xiàn)的名稱(chēng)、編號(hào)及其相應(yīng)的極化信息即可,具體信息如表5。
表3 CSRH FITS-IDI文件必須的二進(jìn)制表Table 3 Binary tables required in a CSRH FITS-IDI file
表4 CSRH天線(xiàn)表頭中需填入的信息Table 4 Mandatory keywords in a CSRH ANTENNA table header
表5 CSRH天線(xiàn)表的字段及其值Table 5 Mandatory columns and their set values in a CSRH ANTENNA table
2.2.2 ARRAY_GEOMETRY表
太陽(yáng)射電日像儀的每一根天線(xiàn)都有其相應(yīng)的坐標(biāo)值,應(yīng)對(duì)其具體位置進(jìn)行存儲(chǔ)。在ARRAY_GEOMETRY表中存放了天線(xiàn)坐標(biāo)信息及時(shí)間系統(tǒng)信息,其表頭中除包含表1和表2的信息外,需加上表6中的關(guān)鍵字。在ARRAY_GEOMETRY表頭中,EXTNAME=“ARRAY_GEOMETRY”,TABREV=1,其中尤為關(guān)鍵的是ARRAYX、ARRAYY、ARRAYZ值的設(shè)置。太陽(yáng)射電日像儀天線(xiàn)的位置坐標(biāo)是通過(guò)全球定位系統(tǒng)與激光測(cè)距方法獲得的WGS84坐標(biāo)系下的相對(duì)位置,在FITS-IDI文件中應(yīng)當(dāng)轉(zhuǎn)換到ITRF坐標(biāo)。
表6 CSRH ARRAY_GEOMETRY表頭中的強(qiáng)制關(guān)鍵字及其值Table 6 Mandatory keywords and their set values in a CSRH ARRAY_GEOMETRY table header
太陽(yáng)射電日像儀天線(xiàn)坐標(biāo)的具體信息(經(jīng)過(guò)坐標(biāo)轉(zhuǎn)換后的值)存放在ARRAY_GEOMETRY表中的STABXYZ字段。需要注意的是,F(xiàn)ITS-IDI中存儲(chǔ)的是天線(xiàn)位置的偏移,在太陽(yáng)射電日像儀中,存儲(chǔ)為相對(duì)于0號(hào)天線(xiàn)的偏移值。ARRAY_GEOMETRY表中的字段及部分值如表7。
表7 CSRH ARRAY_GEOMETRY表中的字段Table 7 Mandatory columns in a CSRH ARRAY_GEOMETRY table
2.2.3 頻率(FREQUENCY)表
頻率表用來(lái)存放頻率設(shè)置的相關(guān)信息,在一個(gè)完整的FITS-IDI文件中頻率表最多設(shè)置一個(gè)。如果在UV_DATA表中設(shè)置了“FREQID”這個(gè)隨機(jī)參數(shù),則FITS-IDI文件中必須有頻率表。頻率表表頭中的關(guān)鍵字包含表1、表2的內(nèi)容即可,其中EXTNAME=‘FREQUENCY’,TABREV=1。
如前所述,一次完整采樣過(guò)程會(huì)保存為8個(gè)FITS-IDI文件。因此在寫(xiě)入數(shù)據(jù)時(shí),固定FREQID為1,而通過(guò)改變頭中的REF_FREQ數(shù)據(jù)來(lái)標(biāo)記頻率信息。在CSRH中,將FREQUENCY表的字段定義如表8。
2.2.4 源(SOURCE)表
源表主要用于存儲(chǔ)觀測(cè)目標(biāo)的相關(guān)信息,如名稱(chēng)、赤經(jīng)、赤緯、參考系、流量等?,F(xiàn)階段太陽(yáng)射電日像儀觀測(cè)目標(biāo)為太陽(yáng),即SOURCE=“sun”。源表頭中的關(guān)鍵字同表1、表2列出的關(guān)鍵字一致,其中EXTNAME=“SOURCE”。源表中的字段定義如表9,暫時(shí)無(wú)需存儲(chǔ)的信息設(shè)置為0。
表8 CSRH頻率表中的字段及其值Table 8 Mandatory columns and their set values in a CSRH FREQUENCY table
表9 CSRH源表中定義的字段及其值Table 9 Mandatory columns and their set values in a CSRH SOURCE table
2.2.5 UV_DATA表
FITS-IDI文件的主要內(nèi)容是可見(jiàn)度數(shù)據(jù),也就是觀測(cè)產(chǎn)出的裸數(shù)據(jù)文件的主要內(nèi)容。如前所述,CSRH中每3 ms生成一個(gè)數(shù)據(jù)幀,并在裸數(shù)據(jù)中存有該幀數(shù)據(jù)獲得的精確時(shí)間。為不丟失時(shí)間的精確性,將每一幀數(shù)據(jù)存放于一個(gè)UV_DATA表中,精確時(shí)間存放在TIME字段。CSRH的UV_DATA表頭中存儲(chǔ)的信息除表1和表2之外,還包含了表10的關(guān)鍵字。
表10 CSRH UV_DATA表頭中的關(guān)鍵字Table 10 Mandatory keywords in a CSRH UV_DATA table header
分析CSRH的裸數(shù)據(jù)文件,其天線(xiàn)的相關(guān)信息是觀測(cè)到的主要數(shù)據(jù),這些數(shù)據(jù)以復(fù)數(shù)的形式存放。因此,應(yīng)存放相應(yīng)的數(shù)據(jù)信息,如數(shù)據(jù)的類(lèi)型、極化信息、頻率等。在UV_DATA表頭中,設(shè)置了6個(gè)常規(guī)軸,詳細(xì)存儲(chǔ)信息如表11,UV_DATA中的字段定義如表12。
表11 CSRH UV_DATA表頭的常規(guī)軸及其值Table 11 Keywords and their values for commonly used data-frame axes in a CSRH UV_DATA table header
表12 CSRH UV_DATA表內(nèi)容中的定義的字段Table 12 Definitions of keywords in a CSRH UV_DATA table
3.1 UV_DATA表中的UU、VV、WW的計(jì)算
3.1.1 基線(xiàn)及基線(xiàn)矢量的計(jì)算
太陽(yáng)射電日像儀中定義:
3.1.2 UVW的值
UVW的計(jì)算需要根據(jù)觀測(cè)目標(biāo)的時(shí)角和赤緯,并結(jié)合各天線(xiàn)的IRTF坐標(biāo)進(jìn)行計(jì)算。
由計(jì)算公式看出,UVW的值根據(jù)基線(xiàn)矢量、時(shí)角(H)和赤緯(d)計(jì)算得來(lái),因此,在UV_DATA中共需存儲(chǔ)780組數(shù)據(jù)。
3.2 UV_DATA表中的可見(jiàn)度數(shù)據(jù)FLUX
CSRH每3 ms接收的一幀數(shù)據(jù)中,包含的主要信息如下:
(1)幀接收的精確日期和時(shí)間(時(shí)間精確到納秒)
(2)極化信息(同一幀數(shù)據(jù)在同一個(gè)極化方向)
(3)頻段信息(同一幀數(shù)據(jù)在同一個(gè)頻率段)
(4)天線(xiàn)間的互相關(guān)值(包含16通道)
(5)天線(xiàn)的自相關(guān)值(天線(xiàn)0-39在16個(gè)通道的自相關(guān))
為把當(dāng)前接收的信息精確存儲(chǔ)到FITS-IDI文件中,將讀出的精確時(shí)間寫(xiě)到UV_DATA表的TIME字段(而不是存儲(chǔ)接收時(shí)間的中間時(shí)刻),日期寫(xiě)到DATA字段。與上文分析的UV_DATA表的行數(shù)(780)相符合,F(xiàn)LUX列中存儲(chǔ)天線(xiàn)的互相關(guān)值。由于裸數(shù)據(jù)中相關(guān)值以復(fù)數(shù)表示,在FLUX中的每一行需存儲(chǔ)兩個(gè)相關(guān)天線(xiàn)在16個(gè)通道的互相關(guān)值(16個(gè)復(fù)數(shù)的實(shí)部和虛部,為32E)。
經(jīng)過(guò)上述分析與計(jì)算,最后生成的FITS-IDI文件的格式如圖1,其中每個(gè)表的列數(shù)為字段個(gè)數(shù),行數(shù)上文已具體分析,每個(gè)表均以文件接收精確時(shí)間命名。為進(jìn)一步確認(rèn)生成的數(shù)據(jù)文件是否符合標(biāo)準(zhǔn),項(xiàng)目中使用CASA對(duì)生成的FITS-IDI文件進(jìn)行導(dǎo)入,并轉(zhuǎn)換為MS格式。若成功生成MS文件,則可以驗(yàn)證生成的FITS-IDI文件格式正確。具體驗(yàn)證過(guò)程如下:
importfitsidi(fitsidifile=‘example.fits’,vis=‘example.ms’),其中fitsidifile為導(dǎo)入的FITS-IDI文件,vis為生成的MS文件。
經(jīng)驗(yàn)證,生成的FITS-IDI文件可以成功導(dǎo)入CASA并轉(zhuǎn)換為MS文件,驗(yàn)證了所生成的文件格式的正確性。
圖1 CSRH最終生成的FITS-IDI文件(fv打開(kāi))Fig.1 An fv display of a FITS-IDI header(listing binary tables)generated by the CSRH
雖然FITS-IDI是一個(gè)較為成熟的FITS文件格式,但在底層將原始觀測(cè)文件寫(xiě)入FITS-IDI文件并不是一件容易的工作。本文是太陽(yáng)射電日像儀數(shù)據(jù)預(yù)處理系統(tǒng)中的重要工作,詳細(xì)分析了FITS-IDI文件中各個(gè)關(guān)鍵表表頭關(guān)鍵字和表中字段的值。最終生成的FITS-IDI文件可以正常導(dǎo)入CASA軟件進(jìn)行后續(xù)處理,證明了本文研究的正確性。本文除了可以滿(mǎn)足太陽(yáng)射電日像儀項(xiàng)目應(yīng)用以外,也可以為其他射電望遠(yuǎn)鏡合成FITS文件提供參考。
[1] 高姣姣,王鋒,戴偉,等.面向射電日像儀的隨機(jī)組結(jié)構(gòu)剖析與文件設(shè)計(jì)[J].天文研究與技術(shù)——國(guó)家天文臺(tái)臺(tái)刊,2013,10(4):365-371.
Gao Jiaojiao,Wang Feng,Dai Wei,et al.An analysis of the random-group data format and a design of the data file structure for a solar radio heliograph[J].Astronomical Research&Technology——Publications of National Astronomical Observatories of China,2013,10(4):365-371.
[2] Yan Y,Zhang J,Wang W,et al.The Chinese spectral radioheliograph—CSRH[J].Earth,Moon,and Planets,2009,104(1-4):97-100.
[3] Hanisch R J,F(xiàn)arris A,Greisen E W,et al.Definition of the flexible image transport system (FITS)[J].Astronomy and Astrophysics,2001,376:359-380.
[4] Greisen E W,Harten R H.An extension of FITS for groups of small arrays of data[J].Astronomy and Astrophysics Supplement Series,1981,44:371-374.
[5] Greisen E W.The FITS Interferometry Data Interchange Convention—Revised[EB/OL].2011. www.aoc.nrao.edu/~egreisen/AIPSMEM114.PS.
[6] Thompson A R,Moran J M,Swenson Jr G W.Interferometry and synthesis in radio astronomy [M].2nd ed.Germany:Wiley-VCH Verlag GmbH&Co.KGaA,1994.
A Study of the FITS-IDI Format for the Chinese Spectral Radio Heliograph
Mei Ying1,Liu Donghao2,Wang Feng1,3,Deng Hui1,Dai Wei1,3,Ji Kaifan1
(1.Key Laboratory of Applications of Computer Technologies of the Yunnan Province,University of Science and Technology of Kunming,Kunming 650500,China,Email:meiying@cnlab.net;2.National Astronomical Observatories,Chinese Academy of Sciences,Beijing 100012,China;3.Yunnan Observatories,Chinese Academy of Sciences,Kunming 650011,China)
Raw data observed with the Chinese Spectral Radio Heliograph(CSRH)will be recorded in a self-defined format.For convenient distribution and use it is necessary to convert CSRH data files to be of other standard formats such as the FITS-IDI.After an in-depth analysis of the FITS-IDI data format,we present a proposal of mandatory and optional FITS-IDI fields for the CSRH.We also discuss calculation equations of values of several data fields,including the UU,VV,and WW.A FITS-IDI data file converted from a raw-data file has been input into the CASA software package,successfully resulting in a CASA file of integrated Measurement Sets(MS).The generating and subsequent processing of the CASA file demonstrate the correctness of the proposed CSRH FITS-IDI format.Our study could effectively advance the CSRH project and provide useful references for further research of data storage for other astronomical instruments.
Chinese Spectral Radio Heliograph;FITS-IDI;Data storage
TP274.2
A
1672-7673(2014)04-0388-08
2013-12-26;
2014-01-20
梅 盈,女,碩士.研究方向:計(jì)算機(jī)應(yīng)用.Email:meiying@cnlab.net
王 鋒,教授,研究方向:天文技術(shù)與方法.Email:wangfeng@cnlab.net