科技興則民族興,科技強則國家強。
超級計算機的發(fā)展關(guān)乎國家的科技未來,它是計算機領(lǐng)域“皇冠上的明珠”,是衡量一個國家科技水平的重要標志。
作為大國重器,超級計算機多用于國家高科技領(lǐng)域和尖端技術(shù)研究,如航空航天、天體物理研究、氣象預報、潮汐預報等,其重要性不言而喻。
超級計算機的運算速度有多快?以我國自主研制的首臺千萬億次超級計算機“天河一號”為例,其峰值運算速度為4700萬億次/秒,60億人需要算一年的問題,超級計算機一秒就可以算完。
回顧中國超級計算機的發(fā)展史,“玻璃房”是無法被遺忘的過去。20世紀80年代,世界超級計算機技術(shù)飛速發(fā)展。西方國家長期對中國采取多邊出口管制政策。中國雖花了高價從美國購買超級計算機,但相關(guān)性能受到閹割,設備需要放置于獨立的機房,機房鑰匙和啟動密碼由美方掌握,上機需要美方人員審核監(jiān)督。
關(guān)鍵核心技術(shù)很難買到,中國要有自己的超級計算機。
1978年5月,國防科委在北京召開巨型機方案論證和協(xié)作會議,確定該機代號為“785工程” ,我國正式啟動超級計算機研制工作。
一窮二白是當時再真實不過的寫照。技術(shù)落后、資料匱乏,但攔不住下定決心攻關(guān)的科研人員?!熬扌陀嬎銠C之父”慈云桂更是立下軍令狀:“就算是豁出這條老命,也要把中國的巨型機搞出來。”
1983年12月,我國第一臺億次超級計算機“銀河一號”研制成功,中國成為繼美國、日本之后,第三個能獨立設計和制造超級計算機的國家。
以“銀河一號”為起點,多方支持之下,中國超級計算機一步一個腳印,踏上自主創(chuàng)新、不斷超越的征程。
銀河、天河、神威等系列超級計算機產(chǎn)品逐漸大放光彩,國產(chǎn)超級計算機的運算速度也實現(xiàn)了從千萬億次到億億次,再到百億億次的突破。
2010年,“天河一號”摘下全球超級計算機500強排行榜(以下簡稱“TOP500”)的桂冠;2013年研制成功的“天河二號”標志著我國在超級計算機領(lǐng)域已走在世界前列;采用全自主創(chuàng)新的天河新一代超級計算機運算速度達到百億億次。2016年6月,我國第一臺全部采用國產(chǎn)處理器構(gòu)建的超級計算機“神威·太湖之光”,以超第二名近3倍的運算速度位列TOP500排行榜第一。
“神威·太湖之光”也是世界上首臺峰值運算性能超過每秒十億億次浮點運算能力的超級計算機,曾獲得高性能計算應用最高獎“戈登·貝爾獎”。
超級計算機發(fā)展已40余年,在一代又一代科研工作者的努力之下,中國的超級計算機已經(jīng)實現(xiàn)了從追趕到并跑,再到部分領(lǐng)跑的跨越。
2009年,博士畢業(yè)的我加入正在籌建的首個國家超算中心——國家超級計算天津中心(以下簡稱“天津超算中心”),參與研制、部署我國首個排名世界第一的超級計算機“天河一號”相關(guān)工作。這段經(jīng)歷讓我倍感驕傲和榮幸。
隨后,我又參與了超算的“二次創(chuàng)業(yè)”。十年磨一劍,國際真正認可了我們在超級計算領(lǐng)域取得的成績。
目前,我國超算已經(jīng)實現(xiàn)了從追趕到并跑,再到部分領(lǐng)跑的跨越,不僅在于技術(shù),更在于軟件和應用的突破。相關(guān)成績離不開一代又一代科研工作者的努力,更離不開科研工作者志氣、骨氣、底氣的傳承。
2006年,我在天津南開大學攻讀理論物理博士,相關(guān)課題研究需要強大算力支撐,但當時國內(nèi)并不具備這樣的條件。后來在國家留學基金委的支持下,我前往美國學習深造。
美國創(chuàng)新能力的平臺和環(huán)境讓我感受頗多。到達美國學習的第二年,我所在的實驗室在理論物理領(lǐng)域的國際年會上共發(fā)布4個研究成果,其中兩個半由我主要完成,當時非常有成就感。但同時我也看到了另一個問題:美國機構(gòu)的署名位列第一,我們所作的貢獻實在是給他人錦上添花。
學業(yè)結(jié)束之時,美國導師希望我留美。迷茫之時,一天散步的路上,我想起南開老校長的“愛國三問”,感覺到作為一個中國人,還沒對自己國家的創(chuàng)新發(fā)展作出貢獻。我決定回國,不管干多干少,都是我們自己的。
2009年,我加入天津超算中心,參與“天河一號”的研制和中心建設工作。
當時面臨的挑戰(zhàn)不小,我們并未選擇當時主流的環(huán)形架構(gòu)體系路線,而是采用CPU和GPU相結(jié)合的異構(gòu)融合計算體系結(jié)構(gòu)來做超級計算機,我們是這條路線的“第一人”。
其實,相關(guān)研究工作從2007年便已開始,為了完成相關(guān)任務,整個研發(fā)團隊選擇“閉關(guān)”,通過關(guān)鍵底層技術(shù),如軟硬件設計、操作系統(tǒng)、編譯器、軟硬件的協(xié)同調(diào)度等,驗證了我們的方向是正確的。
2009年夏天,我們啟動基礎(chǔ)環(huán)境建設和整機系統(tǒng)安裝工作。我們需要完成上萬根光纖、上噸重機柜的部署和安裝。在接近40℃的房間里,累了就睡在地上,醒了再接著干。設備安裝過程中,有些快要退休的老專家,也在一線跟我們拉光纖、搬機柜,讓當時的我受到了教育。
就這樣,我們用了7個月左右的時間,完成了別人要一年半以上時間才能完成的部署任務,中國首臺千萬億次超級計算機“天河一號”誕生了。
2010年11月,全球超級計算機500強排行榜公布,“天河一號”勇奪第一。
消息傳來已是晚上,我正和幾個同事值班,聽到這個消息之后,非常激動興奮,從來沒想到我們的團隊竟然干成了世界第一的工程。我和同事一起振臂高呼之后,繞著我們“天河一號”跑了幾圈,對于平時淡定的我來說,已經(jīng)很是“超綱”了。
但很快,“中看不中用”的質(zhì)疑接踵而來。國際專家質(zhì)疑我們造了個“跑車”,只是為了快而快;國內(nèi)也有人質(zhì)疑我們造了個大型“游戲機”。
原因是,超算技術(shù)雖然突破了,但當時也面臨著挑戰(zhàn):一是當時的超算應用基礎(chǔ)不足,二是軟件層面、算法模型尚未有所變化。
對我們來說,真正難的還是要實現(xiàn)應用創(chuàng)新的“二次突破”,即把超算真正轉(zhuǎn)化為創(chuàng)新力和生產(chǎn)力。
“二次突破”交到了我們年輕團隊手中。作為應用研發(fā)團隊的負責人,面對質(zhì)疑情緒容易“上頭”的我立了軍令狀:干不好“天河一號”的應用,我卷鋪蓋走人。
我們打造了售前、售后、研發(fā)的全方位團隊,帶著售前團隊出去摸需求、做推廣,負責超算系統(tǒng)、能力、創(chuàng)新的推廣工作。我們坐著綠皮火車每年跑幾十個城市,開上百場報告會或者交流會,讓大家了解超級計算機。
售后、研發(fā)團隊主要開發(fā)超算的技術(shù)服務能力,摸清實踐和產(chǎn)業(yè)需求,用我們的超算平臺解決需求,或者根據(jù)需求重新研發(fā)運行軟件或者模型,以解決科技創(chuàng)新和產(chǎn)業(yè)的問題。
正是過去這些年,我們把超級計算機打造成了能夠算天、算地、算人的大國重器。
算天,應用于諸如航空航天飛行模式、天氣預報預測等。算地,應用于石油勘探、大壩抗震分析等。算人,可應用于藥物研發(fā)、大規(guī)?;驍?shù)據(jù)的分析。
算力真正轉(zhuǎn)化成了創(chuàng)新力和生產(chǎn)力,實現(xiàn)了二次創(chuàng)新,各類生態(tài)自然而然涌現(xiàn)出來。圍繞超算發(fā)展,國內(nèi)芯片、操作系統(tǒng)、服務器等領(lǐng)域涌現(xiàn)了一大批信息技術(shù)企業(yè),為中國信創(chuàng)產(chǎn)業(yè)發(fā)展奠定了基礎(chǔ)。
“二次創(chuàng)業(yè)”讓中國超算真正站穩(wěn)了腳跟。從2010年以來,十年磨一劍,國際范圍內(nèi)真正認可了中國在超算領(lǐng)域取得的成績。
現(xiàn)在來看,中國超算的發(fā)展體現(xiàn)了三個“氣”:
志氣,“天河一號”搭載的異構(gòu)融合計算體系結(jié)構(gòu)成為世界第一并引領(lǐng)國際超算潮流,體現(xiàn)我們向前邁進、勇爭領(lǐng)域前列的志氣。
骨氣,剛起步的時候我們一窮二白,前輩們接受這個任務并立下軍令狀,挑戰(zhàn)不可能。
底氣,全自主創(chuàng)新的天河新一代超級計算機,讓我們在高度競爭的超算領(lǐng)域更有底氣。
當然,超級計算也面臨著新的挑戰(zhàn):摩爾定律面臨終結(jié)挑戰(zhàn),計算范式出現(xiàn)了變化;人工智能快速發(fā)展,需要大規(guī)模低精度混合計算支持,超算需要思考如何與智算融合;此外,量子計算興起,未來超算需與其協(xié)同發(fā)展。當下,我們在設計新一代超級計算機的時候,已經(jīng)提前考慮這些問題了。
責編:楊琳 yanglin@ceweekly.cn
美編:孟凡婷