陳紅梅等
摘要:高性能計(jì)算已被公認(rèn)為繼理論科學(xué)和實(shí)驗(yàn)科學(xué)之后的第三大科學(xué)研究方法,是科技創(chuàng)新的重要手段。高性能計(jì)算機(jī)經(jīng)過(guò)幾十年的發(fā)展,經(jīng)歷了向量機(jī)、MPP、集群等幾個(gè)階段,我國(guó)高性能計(jì)算機(jī)的研制和應(yīng)用也得到了快速發(fā)展。國(guó)內(nèi)多所高校和科研院所紛紛構(gòu)建高性能計(jì)算平臺(tái),江漢大學(xué)也構(gòu)建了自己的高性能計(jì)算平臺(tái)。對(duì)高性能計(jì)算機(jī)發(fā)展歷程進(jìn)行了梳理,并分析了其現(xiàn)狀,重點(diǎn)介紹了江漢大學(xué)高性能計(jì)算平臺(tái)。
關(guān)鍵詞:高性能計(jì)算機(jī);向量機(jī);MPP;集群;中國(guó)TOP100;國(guó)際TOP500
中圖分類(lèi)號(hào):TP3-0
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2015)003-0007-02
0 引言
目前,高性能計(jì)算科學(xué)與技術(shù)已成為世界各國(guó)競(jìng)相爭(zhēng)奪的戰(zhàn)略制高點(diǎn)[1]。一些發(fā)達(dá)國(guó)家和發(fā)展中國(guó)家紛紛制定戰(zhàn)略計(jì)劃,投入大量資金,加速研究開(kāi)發(fā)步伐。美國(guó)從20世紀(jì)70年代起就實(shí)施了一系列推動(dòng)計(jì)算科學(xué)發(fā)展的國(guó)家計(jì)劃,包括“戰(zhàn)略計(jì)算機(jī)計(jì)劃”(SCP)、“高性能計(jì)算和通訊計(jì)劃”(HPCC)、“加速戰(zhàn)略計(jì)算計(jì)劃”(ASCI)、“先進(jìn)計(jì)算設(shè)施伙伴計(jì)劃”(PACI)等。
1 高性能計(jì)算機(jī)發(fā)展歷程
從20世紀(jì)70年代產(chǎn)生第一代高性能計(jì)算機(jī)開(kāi)始,經(jīng)過(guò)幾十年的發(fā)展,高性能計(jì)算機(jī)經(jīng)歷了向量機(jī)、MPP、集群等幾個(gè)發(fā)展階段。
1.1 向量機(jī)
1974年,控制數(shù)據(jù)公司(Control Data Corporation,CDC)推出了CDC STAR-100,它是首先使用向量處理器(Vector Processor)的計(jì)算機(jī),被認(rèn)為是第一臺(tái)向量機(jī)。1982年,克雷公司生產(chǎn)的Cray X-MP/2誕生,它是世界上第一部并行向量計(jì)算機(jī)。Cray X-MP系列計(jì)算機(jī)基于并行向量處理機(jī)結(jié)構(gòu),并行向量處理機(jī)是將向量處理器直接并行的一種體系結(jié)構(gòu)。
當(dāng)時(shí)的并行向量機(jī)占領(lǐng)高性能計(jì)算市場(chǎng)達(dá)20年之久,并行向量機(jī)處理器數(shù)目的增加,使得定制費(fèi)用和維護(hù)費(fèi)用越來(lái)越昂貴,性?xún)r(jià)比越來(lái)越低,已難以滿(mǎn)足高性能計(jì)算機(jī)市場(chǎng)化的要求。
1.2 MPP
自20世紀(jì)90年代開(kāi)始,基于微處理器的大規(guī)模并行處理(Massively Parallel Processing, MPP)計(jì)算機(jī)逐漸成為高性能計(jì)算機(jī)的主流。大規(guī)模并行處理計(jì)算機(jī)是指由大量結(jié)點(diǎn)通過(guò)高帶寬低延時(shí)的專(zhuān)有網(wǎng)絡(luò)互聯(lián)而組成的大規(guī)模計(jì)算機(jī),其中每一個(gè)結(jié)點(diǎn)由處理器/緩存、局部存儲(chǔ)器和網(wǎng)絡(luò)接口電路構(gòu)成。
MPP系統(tǒng)使用專(zhuān)門(mén)的網(wǎng)絡(luò)和操作系統(tǒng)。隨著個(gè)人計(jì)算機(jī)的發(fā)展,集群出現(xiàn)了。
1.3 集群
20世紀(jì)90年代中期,個(gè)人電腦市場(chǎng)日趨成熟。并且,局域網(wǎng)技術(shù)也快速發(fā)展,在帶寬和延遲上與傳統(tǒng)高性能計(jì)算機(jī)所采用的專(zhuān)有網(wǎng)絡(luò)的差距也日漸縮小。在軟件方面,1991年出現(xiàn)的Linux操作系統(tǒng),至1994年已經(jīng)相當(dāng)穩(wěn)定,1993年發(fā)布了基于消息傳遞的并行程序設(shè)計(jì)標(biāo)準(zhǔn)MPI。
集群系統(tǒng)是使用高速通信網(wǎng)絡(luò)將多臺(tái)原本獨(dú)立、完整的微機(jī)或工作站連接在一起,構(gòu)成一個(gè)統(tǒng)一的整體,使之可作為一種單一的計(jì)算資源來(lái)使用[2]。與SMP和MPP相比,集群具有更高的可擴(kuò)展性、可用性和易維護(hù)性,而且價(jià)格低、性?xún)r(jià)比高。
2 我國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀
國(guó)際上,自1993年起每年都會(huì)按Linpack的測(cè)試性能公布世界范圍內(nèi)已安裝的前500臺(tái)高性能計(jì)算機(jī)排行。2002年之前,我國(guó)高性能計(jì)算機(jī)未曾向國(guó)際申報(bào)Linpack性能測(cè)試結(jié)果,故而未列入國(guó)際TOP500排行榜。從2002年起,中國(guó)軟件行業(yè)協(xié)會(huì)數(shù)學(xué)軟件分會(huì)聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專(zhuān)業(yè)委員會(huì)與國(guó)家“863”高性能計(jì)算機(jī)評(píng)測(cè)中心,每年11月在其網(wǎng)站(www.samss.org.cn)及國(guó)內(nèi)主要相關(guān)媒體上公開(kāi)發(fā)布國(guó)內(nèi)(目前限于大陸)已經(jīng)安裝運(yùn)行的、公開(kāi)的、以L(fǎng)inpack作為基準(zhǔn)測(cè)試程序(Benchmark)測(cè)試的性能最高的100臺(tái)計(jì)算機(jī)系統(tǒng)名單——中國(guó)高性能計(jì)算機(jī)百?gòu)?qiáng)(China Top 100 List of High Performance Computing,簡(jiǎn)稱(chēng)中國(guó)TOP100)[3]。這一舉動(dòng),為促進(jìn)我國(guó)高性能計(jì)算機(jī)的研制及在眾多領(lǐng)域的應(yīng)用推廣作出了積極貢獻(xiàn)。
在中國(guó)高性能計(jì)算機(jī)排行榜首次發(fā)布的2002年,排行榜中名列第一的聯(lián)想深騰1 800萬(wàn)億次機(jī)群名列該年國(guó)際TOP 500排行榜的第43名。2003年,在中國(guó)TOP 100排行榜中名列第一的聯(lián)想深騰6 800萬(wàn)億次機(jī)群名列該年國(guó)際TOP500第14名。2004年,在中國(guó)TOP100排行榜中名列第一的由中科院計(jì)算技術(shù)研究所研制的曙-4000A取得了6月份國(guó)際TOP500排行榜第10的歷史性突破。2009年10月發(fā)布的由國(guó)防科技大學(xué)研制的“天河一號(hào)”千萬(wàn)億次超級(jí)計(jì)算機(jī)以563.1 TFlops的Linpack性能名列2009年11月世界TOP500排行榜的第5名。2010年9月發(fā)布的國(guó)產(chǎn)“天河-1A”千萬(wàn)億次超級(jí)計(jì)算機(jī)以2.56 PFlops的Linpack性能奪取2010年11月世界TOP500排行榜的第一名,是中國(guó)國(guó)產(chǎn)超級(jí)計(jì)算機(jī)首次奪得世界冠軍。2013年,部署于廣州超級(jí)計(jì)算中心、由國(guó)防科技大學(xué)研制的“天河二號(hào)”以33.863 PFlops的Linpack性能奪得國(guó)際TOP500排行榜首位。以上數(shù)據(jù)充分展現(xiàn)了我國(guó)高性能計(jì)算機(jī)的研發(fā)能力,證明我國(guó)已經(jīng)成為了高性能計(jì)算強(qiáng)國(guó)。
3 江漢大學(xué)高性能計(jì)算平臺(tái)
隨著高性能計(jì)算機(jī)和計(jì)算方法的快速發(fā)展,物理、化學(xué)、生物等學(xué)科對(duì)計(jì)算資源有著迫切需求,國(guó)內(nèi)多所高校和科研院所紛紛開(kāi)始構(gòu)建高性能計(jì)算平臺(tái)[4]。江漢大學(xué)高性能計(jì)算平臺(tái)就是在這樣的背景下構(gòu)建的。平臺(tái)是集群結(jié)構(gòu),采用DELL模式構(gòu)建, 包括19個(gè)計(jì)算節(jié)點(diǎn)、2個(gè)I/O節(jié)點(diǎn)、2個(gè)登陸節(jié)點(diǎn)、1個(gè)管理節(jié)點(diǎn)、1組管理網(wǎng)絡(luò)、1組計(jì)算網(wǎng)絡(luò)。
19個(gè)計(jì)算節(jié)點(diǎn)包括:16個(gè)刀片式計(jì)算節(jié)點(diǎn)和2個(gè)GPU計(jì)算節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)2個(gè)CPU,每個(gè)CPU 12核,主頻2.6GHz,節(jié)點(diǎn)內(nèi)存64GB;一個(gè)胖節(jié)點(diǎn),配置為4個(gè)CPU,每個(gè)CPU 8核,主頻2.0GHz,節(jié)點(diǎn)內(nèi)存1TB。I/O節(jié)點(diǎn)和登陸節(jié)點(diǎn)為:每個(gè)節(jié)點(diǎn)2個(gè)CPU,每個(gè)CPU 8核,主頻2.0GHz,節(jié)點(diǎn)內(nèi)存64GB; 管理節(jié)點(diǎn)為:每個(gè)節(jié)點(diǎn)2個(gè)CPU,每個(gè)CPU 6核,主頻2.0GHz,節(jié)點(diǎn)內(nèi)存64GB。
計(jì)算網(wǎng)絡(luò)使用56Gbps速率的Infiniband網(wǎng)絡(luò)將刀片式計(jì)算節(jié)點(diǎn)、GPU計(jì)算節(jié)點(diǎn)、胖節(jié)點(diǎn)、登陸節(jié)點(diǎn)和I/O節(jié)點(diǎn)全部相連。管理網(wǎng)絡(luò)通過(guò)萬(wàn)兆以太網(wǎng)將計(jì)算節(jié)點(diǎn)、登陸節(jié)點(diǎn)、I/O節(jié)點(diǎn)和管理節(jié)點(diǎn)全部相連。
江漢大學(xué)高性能計(jì)算平臺(tái)操作系統(tǒng)為Redhat Linux Server 6.4,應(yīng)用開(kāi)發(fā)環(huán)境軟件為Intel Cluster Studio軟件工具包,作業(yè)調(diào)度系統(tǒng)為IBM Platform。
參考文獻(xiàn):
[1] 周興銘.高性能計(jì)算技術(shù)發(fā)展[J].自然雜志,2011,33(5):249-254.
[2] 趙玉廣,孫愛(ài)國(guó),郎美娜,等.基于集群技術(shù)的高性能計(jì)算系統(tǒng)研究平臺(tái)的構(gòu)建[J].吉林醫(yī)藥學(xué)院學(xué)報(bào),2013,34(5):363-366.
[3] 袁國(guó)興,孫家昶,張林波,等. 2013年中國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析及系統(tǒng)測(cè)評(píng)技術(shù)簡(jiǎn)析[J].計(jì)算機(jī)工程與科學(xué),2013,35(11):1-5.
[4] 盛樂(lè)標(biāo),游偉倩,周慶林.南京大學(xué)高性能計(jì)算中心建設(shè)的探索與實(shí)踐[J].實(shí)驗(yàn)技術(shù)與管理,2013,30(11):144-146.
(責(zé)任編輯:孫 娟)