周倩
超算領(lǐng)域的國際競逐并非只有一個(gè)維度,而是運(yùn)算速度、體系規(guī)模、產(chǎn)業(yè)應(yīng)用的協(xié)同共進(jìn)。中國超算研發(fā)的全面崛起,是建立在強(qiáng)悍的計(jì)算個(gè)體芯片、先進(jìn)的運(yùn)算管理技術(shù)、可靠的操作系統(tǒng)支持基礎(chǔ)之上的。
2018國際超算大會(huì)發(fā)布最新一期《Top500全球超算排行榜》,不出意外,美國橡樹嶺國家實(shí)驗(yàn)室的超級計(jì)算機(jī)Summit(頂點(diǎn)),以峰值計(jì)算性能每秒20億億次(200 PFlops)的速度登頂全球最快超級計(jì)算機(jī),中國的神威·太湖之光和天河二號退居第2位和第4位。
現(xiàn)今,超算領(lǐng)域的最強(qiáng)爭奪已是中國、美國、日本和歐洲的競爭,幾乎沒有哪一方能長久保持超算速度之冠。不過,中國超算的研發(fā)實(shí)力已經(jīng)躋身世界第一陣營。2016年,美國國家安全局和能源部在一份有關(guān)高性能計(jì)算的報(bào)告中指出:中國超算已經(jīng)和美國接近并跑(near-peer),如果不加大投資,尋求改變,中國將取代美國在超算領(lǐng)域的領(lǐng)導(dǎo)地位。超算強(qiáng)國并不僅僅贏在速度,速度永遠(yuǎn)在刷新。超算領(lǐng)域的全球競逐遠(yuǎn)遠(yuǎn)沒有外界看到的那么簡單。
超算競逐的三個(gè)維度
超級計(jì)算(Supercomputing)這一概念最早出現(xiàn)在1929年《紐約世界報(bào)》的一則報(bào)道中,當(dāng)時(shí)計(jì)算機(jī)還沒有發(fā)明出來,新聞背景是IBM給哥倫比亞大學(xué)建造大型報(bào)表機(jī)(tabulator)。隨著20世紀(jì)后半段IT技術(shù)的持續(xù)突破,超級計(jì)算機(jī)的完整定義是“由超過百個(gè)處理器組成的、能夠完成普通PC機(jī)和服務(wù)器不能完成的大型復(fù)雜課題的計(jì)算機(jī)。”1976年,中國第一臺超級計(jì)算機(jī)的運(yùn)算峰值速度只有每秒1.6億次;2016年,神威·太湖之光的運(yùn)算峰值速度超過10億億次,運(yùn)算能力相當(dāng)于200多萬臺普通個(gè)人電腦。
有人認(rèn)為,人類未來的最大痛點(diǎn)是“日益增長的數(shù)據(jù)處理與有限算力之間的矛盾”。諸如蘋果、谷歌、亞馬遜、阿里巴巴、騰訊、百度等這些公眾熟知的IT產(chǎn)業(yè)巨頭,對算力盡管都有著無窮無盡的緊迫需求,然而,這些公司都不是超級計(jì)算機(jī)的主要用戶。那些與民生相關(guān)的天氣預(yù)報(bào)、地震海嘯預(yù)測、橋梁結(jié)構(gòu)分析,或者與國家相關(guān)的導(dǎo)彈模擬、風(fēng)洞實(shí)驗(yàn)、核聚變模型檢測等,才是超級計(jì)算機(jī)的高頻應(yīng)用領(lǐng)域。
速度,當(dāng)然是超算的核心,運(yùn)算速度更快意味著一切繁復(fù)的運(yùn)算、模擬將能做到更快、更準(zhǔn)確,相應(yīng)的,設(shè)計(jì)、制造周期將大幅縮短,這在軍事和民用上都將獲得無可比擬的領(lǐng)先優(yōu)勢。不過,超算領(lǐng)域的國際競逐并非只有一個(gè)維度,而是運(yùn)算速度、體系規(guī)模、產(chǎn)業(yè)應(yīng)用的協(xié)同共進(jìn)。
速度節(jié)點(diǎn)
最近十幾年來,超級計(jì)算機(jī)主要邁過了三個(gè)速度節(jié)點(diǎn):
千萬億次:2010年以前,美國IBM“藍(lán)色基因”超級計(jì)算機(jī)曾連續(xù)五年雄踞世界第一,峰值速度達(dá)到每秒367萬億次。2010年11月,中國“天河一號”首次成為世界上最快的超級計(jì)算機(jī),實(shí)測運(yùn)算速度可以達(dá)到每秒2570萬億次。2011年10月,落戶濟(jì)南的“神威藍(lán)光”,全部采用國產(chǎn)處理器和系統(tǒng)軟硬件,峰值速度也超過千萬億次。
一億億次:2011年,日本K-computer超越了天河一號成為世界第一,而且成為人類歷史上第一次突破每秒一億億次計(jì)算能力的超級計(jì)算機(jī)。2013年,由國防科技大學(xué)研制的“天河二號” 以每秒5.49億億次的峰值計(jì)算速度,成為“全球最快”。
十億億次:2016年,由國家并行計(jì)算機(jī)工程技術(shù)研究中心研制的“神威·太湖之光”,峰值計(jì)算速度達(dá)到每秒12.5億億次,性能也更加穩(wěn)定,成為世界上第一臺運(yùn)算速度超過十億億次的超級計(jì)算機(jī)。直到兩年之后,“神威·太湖之光”創(chuàng)造的世界記錄才被美國IBM“頂點(diǎn)”超級計(jì)算機(jī)完成超越。
體系規(guī)模
美國“頂點(diǎn)”盡管拿回超算速度之冠,但世界超算大會(huì)(ISC)發(fā)布的2018年《Top500全球超算排行榜》當(dāng)中,中國體系規(guī)模上增加到206臺,美國下跌到124臺。而且在制造商方面,聯(lián)想成為第一個(gè)在榜單上排名第一的中國供應(yīng)商,從惠普分拆出去的慧與科技排名第二,其后則是中國企業(yè)浪潮、美國企業(yè)Cray和中國企業(yè)中科曙光。世界五大超級計(jì)算機(jī)供應(yīng)商,中國占了三個(gè)。
中國超算的研發(fā)布局也更具有體系優(yōu)勢,目前來看,中國超級計(jì)算機(jī)的研發(fā)機(jī)構(gòu)主要有四個(gè),其中三個(gè)在北京,一個(gè)在長沙。在長沙的是國防科技大學(xué)計(jì)算機(jī)研究所,主要從事計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)、高可信系統(tǒng)結(jié)構(gòu)、工程工藝、操作系統(tǒng)、編譯系統(tǒng)及應(yīng)用軟件的研究與開發(fā),兩次問鼎世界超算冠軍的天河一號、天河二號以及未來的天河三號都是這個(gè)研究所研制的。
北京的三個(gè)超算研發(fā)機(jī)構(gòu)分別是國家并行計(jì)算機(jī)工程技術(shù)中心、中科院計(jì)算技術(shù)研究所、聯(lián)想數(shù)據(jù)中心集團(tuán)。其中,2016年登頂世界的“神威·太湖之光”即由國家并行計(jì)算機(jī)工程技術(shù)中心研制。中科院計(jì)算機(jī)技術(shù)研究所的超算品牌為“曙光”系列,聯(lián)想數(shù)據(jù)中心集團(tuán)的超算品牌為“深騰”系列。
產(chǎn)業(yè)應(yīng)用
制造最快的超級計(jì)算機(jī)固然很了不起,能否真正推進(jìn)產(chǎn)業(yè)應(yīng)用才是關(guān)鍵,這就必須知道超算到底要用來解決什么問題。日本在設(shè)計(jì)一個(gè)超級計(jì)算機(jī)的時(shí)候,如果想做地球系統(tǒng)的模擬,那么它的名字就叫地球模擬器。設(shè)計(jì)完了之后馬上就做這個(gè)事情。
在企業(yè)級超算應(yīng)用方面,國內(nèi)還有不小的缺失。美國較大的汽車、石油企業(yè)有10個(gè)大型超算系統(tǒng),此外還有一堆小的超算機(jī)器。在中國汽車產(chǎn)業(yè),超算主要用來算部件,而美國算的是整車。如果拿中美同等規(guī)模的公司作對比,美國公司的超算系統(tǒng)規(guī)模是中國公司的10倍多。這才是不可忽視的差距。
另外,超級計(jì)算機(jī)也不能不考慮性價(jià)比,消耗少、干活多,才更有商用化價(jià)值。“每瓦電能算力”就是評價(jià)超算性價(jià)比的指標(biāo),Green500(綠色500)就是按照這一指標(biāo)對超級計(jì)算機(jī)進(jìn)行排名。日本有幾個(gè)超級計(jì)算機(jī)型號能排進(jìn)Green500的前30名,但在峰值速度榜單上甚至排不進(jìn)前300名。
“模塊化”思維
中國超算研發(fā)實(shí)力的突飛猛進(jìn)始于一篇論文,在2007年“國際計(jì)算機(jī)體系結(jié)構(gòu)年會(huì)”上,“天河一號”總設(shè)計(jì)師楊學(xué)軍教授的一篇論文《64位流處理器體系結(jié)構(gòu)研究》,引起各方專家高度關(guān)注,他們從中看到突破更高性能計(jì)算機(jī)的方法——采用“異構(gòu)協(xié)同計(jì)算技術(shù)”。其實(shí),“異構(gòu)協(xié)同計(jì)算技術(shù)”就是一套很好的體系結(jié)構(gòu),將很多芯片連接起來。
經(jīng)過一段時(shí)間的實(shí)驗(yàn)驗(yàn)證,“異構(gòu)協(xié)同計(jì)算技術(shù)”應(yīng)用于“天河一號”的工程研制中,國防科技大學(xué)的科研人員在國際上首創(chuàng)CPU(中央處理器)和GPU(圖形加速處理)相結(jié)合的異構(gòu)融合計(jì)算體系結(jié)構(gòu)。在理論探索和工程實(shí)現(xiàn)上的全面突破,締造了此后“天河二號”“神威·太湖之光”的登頂世界。
計(jì)算機(jī)研發(fā)有一個(gè)重要思維方式:任何極其復(fù)雜的事情,都能被拆分成為若干個(gè)小問題去解決,用少數(shù)簡單的模塊,可以搭建出各種復(fù)雜功能。簡而言之,這就是計(jì)算機(jī)研發(fā)的“模塊化”思維。
美國有一個(gè)天體物理學(xué)家,用16臺索尼PS3游戲機(jī)、一個(gè)千兆以太網(wǎng)交換機(jī)和Linux操作系統(tǒng)(全球頂尖的500臺超級計(jì)算機(jī)中有60%安裝了Linux操作系統(tǒng)),搭建了一個(gè)超級計(jì)算機(jī),用于模擬“兩個(gè)黑洞碰撞時(shí)所產(chǎn)生的重力波的特性”。為什么用索尼PS3游戲機(jī)可以搭建超級計(jì)算機(jī)?答案是PS3游戲機(jī)所用的Cell處理器(由IBM研發(fā)),正是針對高密度計(jì)算和大規(guī)模并行計(jì)算網(wǎng)格所設(shè)計(jì)的,是非常理想的“算力積木”。
模塊化其實(shí)就是“搭積木”,你要設(shè)計(jì)一個(gè)功能非常強(qiáng)大的程控交換機(jī),里面基本的模塊是非常簡單的。你要設(shè)計(jì)一個(gè)超級計(jì)算機(jī),用大量相同的模塊搭建就可以了。有學(xué)者講,超算產(chǎn)品其實(shí)在計(jì)算機(jī)科學(xué)方面水平并不高,更多是工程成就。在IT產(chǎn)品中,常常是大量相同模塊的復(fù)制,這也是IT產(chǎn)業(yè)能夠發(fā)展很快,摩爾定律能夠成立的重要原因。這不像一輛內(nèi)燃機(jī)汽車或者一臺鋼琴,里面有幾千幾萬個(gè)零部件,形狀各異,功能各不相同,要依靠長期技術(shù)積累才能做好。
“天河一號”連接了1.4萬多顆英特爾“至強(qiáng)”CPU、7000多顆英偉達(dá)GPU和2000多顆國產(chǎn)飛騰FT-1000 CPU?!吧裢ぬ狻边B接了超過4萬塊處理器,幾乎都是國產(chǎn)的,有40個(gè)運(yùn)算機(jī)柜、8個(gè)網(wǎng)絡(luò)機(jī)柜,每個(gè)運(yùn)算機(jī)柜比家用雙門冰箱都要大。
當(dāng)然,超級計(jì)算機(jī)并不像大部分外行人想象的那樣容易,并不只是將很多芯片連接起來那么簡單,如果系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)不好,將它們連接起來的性能是非常差的。所以,獲得很高計(jì)算性能的前提,是設(shè)計(jì)一套很好的系統(tǒng)體系結(jié)構(gòu)將很多芯片搭建在一起。
E級超算
中國在2001年幾乎沒有世界級的超算產(chǎn)品,構(gòu)建一整套全球頂級的超算系統(tǒng),也并非堆砌處理器這么簡單。中國超算研發(fā)的全面崛起,是建立在強(qiáng)悍的計(jì)算個(gè)體芯片、先進(jìn)的運(yùn)算管理技術(shù)、可靠的操作系統(tǒng)支持基礎(chǔ)之上的。
核心硬件
芯片無疑是超級計(jì)算機(jī)的核心部分,一臺超算產(chǎn)品至少裝有幾千枚甚至數(shù)萬枚CPU和GPU芯片,同時(shí)配備特殊的操作系統(tǒng),負(fù)責(zé)管理這些芯片之間如何合作,進(jìn)行一系列復(fù)雜的運(yùn)算,才能真正使之擁有十分可靠的強(qiáng)大算力。
國防科技大學(xué)分別在2010和2013年建造的“天河一號”和“天河二號”超級電腦,都曾登頂世界超算TOP500榜單,兩者都主要使用Intel和AMD提供的芯片。2015年4月,美國政府宣布制裁中國四家超算中心,禁止向中國超算中心出售Intel的Xeon Phi超算芯片。天河二號就因?yàn)槊绹闹撇?,耽擱了升級計(jì)劃,不得已調(diào)整技術(shù)路線,并且采用國產(chǎn)矩陣2000替換Intel的Xeon Phi。但這無法阻止中國超算研發(fā)的強(qiáng)勢崛起。2017年,廣州超算中心宣布使用國產(chǎn)矩陣-2000芯片,升級了天河二號超算系統(tǒng),并成功實(shí)現(xiàn)算力翻倍。而神威·太湖之光超級計(jì)算機(jī)起初就安裝了40960個(gè)中國自主研發(fā)的“申威26010”眾核處理器,而且性能不俗。
多年以來,計(jì)算機(jī)CPU芯片一直遵循摩爾定律進(jìn)行升級迭代。但摩爾定律也是有極限的,集成電路上的元器件已經(jīng)足夠小,已經(jīng)逼近“原子尺度”了,很難再延續(xù)過往路徑進(jìn)行升級迭代。這個(gè)時(shí)候,就要想辦法挖掘計(jì)算機(jī)的系統(tǒng)潛力。
系統(tǒng)潛力
在挖掘計(jì)算機(jī)系統(tǒng)潛力方面,有兩個(gè)思維路徑:一個(gè)是阿里方案,一個(gè)是聯(lián)想方案。
阿里方案其實(shí)就是“大規(guī)模并行化處理非結(jié)構(gòu)化數(shù)據(jù)”,即“云計(jì)算”。計(jì)算機(jī)科學(xué)的精髓在于自頂向下的遞歸,先在最頂層將一個(gè)大任務(wù)分解成為幾千個(gè)、幾萬個(gè)小任務(wù),然后將每一個(gè)小任務(wù)分配到每一個(gè)服務(wù)器上。最后,再將每一個(gè)服務(wù)器上的結(jié)果綜合起來,得到原來大任務(wù)的最后結(jié)果。國內(nèi)主要互聯(lián)網(wǎng)公司包括阿里巴巴、百度、京東商城等,都是用大量廉價(jià)的服務(wù)器取代一臺超級計(jì)算機(jī)。前者的價(jià)格不到后者的1/5,大大降低了運(yùn)營成本。
這就像一個(gè)公司CEO,如果事無巨細(xì)、什么都管,那就是中心化的“control模式”,也就是一個(gè)超級計(jì)算機(jī),control是“控制”的意思。而互聯(lián)網(wǎng)公司普遍采用去中心化的“context模式”,context是“上下文語境”的意思,就是CEO將任務(wù)和資源分解,讓更多人根據(jù)上下文語境做出決策,充分發(fā)掘系統(tǒng)中每一個(gè)環(huán)節(jié)的潛力。
而聯(lián)想作為商業(yè)公司,在幫助用戶“挖掘算力潛力”上是做得比較好的。在2018全球最強(qiáng)500臺超級電腦中,聯(lián)想獨(dú)占117臺,中國制造商還是第一次搶下這個(gè)世界第一。一般使用的服務(wù)器包括臺式機(jī)、筆記本,CPU和整機(jī)性能的負(fù)載不超過50%,即使是現(xiàn)在技術(shù)非常領(lǐng)先的互聯(lián)網(wǎng)用戶的服務(wù)器負(fù)載也不超過70%。但在高性能場景下,聯(lián)想可以把一臺機(jī)器能壓榨出來的性能壓榨到了極限。聯(lián)想超算產(chǎn)品在全世界最好的25所大學(xué)中有廣泛應(yīng)用,尤其是北京大學(xué)的水冷超算機(jī)型,理論峰值是100%,最后聯(lián)想釋放出來的算力達(dá)到了92.7%。同時(shí),應(yīng)用層面的持續(xù)反饋,也是在給超算產(chǎn)品的研發(fā)方向探路。
超級計(jì)算機(jī)就算是速度再快、算力再強(qiáng),目的仍是要解決問題,如何用好才是關(guān)鍵。僅有超算技術(shù)的突破是不夠的,更重要是,能夠?qū)Τ惚澈蟮闹T多產(chǎn)業(yè)形成一個(gè)正面反饋,不斷實(shí)現(xiàn)對產(chǎn)業(yè)的輻射和支撐,也就是擴(kuò)大各個(gè)產(chǎn)業(yè)應(yīng)用超級計(jì)算機(jī)的“朋友圈”。
E級超算被視為超級計(jì)算機(jī)前沿競爭的下一個(gè)戰(zhàn)略高地——“E級”意味著每秒能夠達(dá)到百億億次的運(yùn)算速度,相當(dāng)于目前最快超級計(jì)算能力(美國Summit)的5倍左右。按照中國的時(shí)間表,中國最早有望在2020年發(fā)布E級超算。目前中國同時(shí)啟動(dòng)了三大E級超算原型系統(tǒng)的研發(fā),分別是國防科技大學(xué)和天津超算中心的“天河三號”、中科曙光的E級超算,以及江南所和濟(jì)南超算中心的“神威”E級超算。
2018年8月5日,國產(chǎn)超算研制向著皇冠又邁進(jìn)了一步:神威E級超算原型機(jī)在國家超級計(jì)算濟(jì)南中心完成部署,并正式啟用??梢灶A(yù)期,中國超算未來可以贏得很多世界第一,但這并不表示可以贏得未來。
長期以來,國內(nèi)更關(guān)注升級技術(shù)、做好產(chǎn)品,很少去想如何提出一個(gè)好的問題。很多基礎(chǔ)的概念都是別人提出來的,別人設(shè)立這個(gè)跑道,我們在上面跟著跑。也許我們速度更快,但從超級計(jì)算機(jī)最初的體系架構(gòu),到人工智能的測試,我們都是在里面做跟進(jìn)。我們很少找出問題和邏輯的源頭,所以,哪怕中國超算的研發(fā)實(shí)力已經(jīng)十分強(qiáng)大,但未能提出更多真正有價(jià)值的問題,也就不能真正掌握未來。因?yàn)椋瑐ゴ蟮膭?chuàng)新往往源于一個(gè)絕佳的問題。