■ 賈朋群 張萌
剛剛過去的2021年,全球氣象界的一個(gè)熱點(diǎn),是以“機(jī)器學(xué)習(xí)”(machine learning,ML)和“神經(jīng)網(wǎng)絡(luò)”(neural network,NN)等為代表的AI技術(shù),從幾年前有“炒作”嫌疑和爆炸式的登場,到開始入駐氣象研究和業(yè)務(wù)各領(lǐng)域并產(chǎn)生效果和積極影響的過渡年。伴隨這樣的過渡,“trustworthy”一詞被很多學(xué)者加在AI之前,組成“可信的AI”。強(qiáng)調(diào)AI技術(shù)可信,既與AI技術(shù)本身的神奇有關(guān),還是現(xiàn)代氣象科學(xué)本身“物理求真”的傳統(tǒng)使然。
2021年10月,歐洲中期天氣預(yù)報(bào)中心(ECMWF)和歐空局(ESA)共同主持召開了“地球系統(tǒng)觀測和預(yù)報(bào)中的機(jī)器學(xué)習(xí)研討會”。會上來自ECMWF的學(xué)者介紹了ML在該機(jī)構(gòu)的發(fā)展情況。未來10年,ML會在全業(yè)務(wù)鏈得到應(yīng)用,按照應(yīng)用從弱到強(qiáng)分布的領(lǐng)域?yàn)椋河^測篩選(observation screening)、后處理應(yīng)用、模式輸出特征研判(feature detection)、同化偏差糾正、參數(shù)化方案仿真、模式的觀測學(xué)習(xí)分量(learn model components from observation)和學(xué)習(xí)運(yùn)動(dòng)方程(learn equations of motion)。這些應(yīng)用領(lǐng)域,如果說前面幾項(xiàng)針對預(yù)報(bào)業(yè)務(wù),還僅僅是改進(jìn)意義上的發(fā)展,ML強(qiáng)介入的最后三項(xiàng)則具備顛覆性的意義:即以經(jīng)典力學(xué)和熱力學(xué)為支撐的預(yù)報(bào)系統(tǒng)中的參數(shù)化方案、模式分量乃至運(yùn)動(dòng)(動(dòng)力)方程,都可以通過ML技術(shù),基于已有預(yù)報(bào)系統(tǒng)的預(yù)報(bào)和觀測結(jié)果重新打造。
報(bào)告人隨后介紹了“自下到上”和“從上到下”兩種打造方法,前者強(qiáng)調(diào)了基于物理的ML、可信的AI、混合模式和不確定性量化等科學(xué)概念和領(lǐng)域。這里,學(xué)者指出針對天氣和氣候應(yīng)用,需要建設(shè)定制的ML解決方案,而方案中強(qiáng)調(diào)“trustworthy”,無疑是針對AI技術(shù)的“灰色”甚至“黑色”的本質(zhì),畫出了底線。
與歐洲學(xué)者相呼應(yīng),美國國家科學(xué)基金(NSF)在其最新AI戰(zhàn)略布局中,以強(qiáng)強(qiáng)聯(lián)合方式成立了“天氣、氣候和沿海海洋可信的AI研究所”(AI Institute for Research on Trustworthy AI in Weather, Climate, and Coastal Oceanography,AI2ES)。AI2ES匯集了來自俄克拉何馬大學(xué)等7所高校,谷歌、IBM、NVIDIA等4家高技術(shù)企業(yè)和NCAR及NOAA等聯(lián)邦機(jī)構(gòu)的研究實(shí)體,扛起了在環(huán)境科學(xué)領(lǐng)域提倡“trustworthy”AI的大旗。2021年,NCAR學(xué)者在一次學(xué)術(shù)會上解釋AI2ES要發(fā)展可信的AI技術(shù)的宗旨時(shí),先提出了ML是否是面對未來氣象挑戰(zhàn)的“高招”(Silver Bullet)的問題。他問道:為什么可解釋的AI非常重要?回答這個(gè)問題時(shí),NCAR學(xué)者引用了系列科幻小說《銀河系漫游指南》作者道格拉斯·亞當(dāng)斯的回答:42①在亞當(dāng)斯的經(jīng)典科幻小說《銀河系漫游指南》中,一臺名為“深思”(Deep Thought)的超級計(jì)算機(jī)經(jīng)過700萬年的思考,得出了關(guān)于“生命、宇宙和萬事萬物終極問題”的答案,這個(gè)答案就是“42”。巧合的是,42在數(shù)學(xué)領(lǐng)域具有許多特殊的意義。其中之一便是2019年由MIT的Andrew Sutherland和布里斯托大學(xué)的Andrew Booker領(lǐng)導(dǎo)的團(tuán)隊(duì)解開了著名的數(shù)學(xué)難題——丟番圖方程(Diophantine Equation)x3+y3+z3=k中最難以琢磨的數(shù)字k=42的解。這個(gè)由三個(gè)立方組成的難題于1954年在劍橋大學(xué)被首次提出。對于較小的數(shù)字,這類方程比較容易求解:例如,29可以寫成33+13+13,而32是不可解的。在1~100之中,除了33和42之外,所有問題最終都通過各種技術(shù)和超級計(jì)算機(jī)解決,或者被證明是無法解決的。Booker設(shè)計(jì)了一個(gè)巧妙的算法用布里斯托大學(xué)的超算花了幾個(gè)星期的時(shí)間算出了33的一個(gè)解決方案。但對于求解42他發(fā)現(xiàn)所需的計(jì)算量要高一個(gè)數(shù)量級,可能超出了超級計(jì)算機(jī)的能力。在嘗試破解33時(shí),搜索界限是1016,但對于破解42來說需要將搜索界限設(shè)置為1017。通過UK-based Charity Engine的幫助,他們從遍布世界各地的40多萬名志愿者的家用電腦中獲得計(jì)算能力,最終得到了x3+y3+z3=42的第一種解決方案:42 = (-80538738812075974)3 + 804357581458175153+126021232973356313。目前,在101~1000中還有10個(gè)數(shù)字尚未被破解;另外,對于k=3是否存在更多解,也是人們關(guān)注的一個(gè)方向。,即關(guān)于生命、宇宙和一切事情的終極問題的答案(“The ultimate answer to life, the universe and everything is...42!”)。
學(xué)者引用科幻作家的終極答案,實(shí)際上并沒有多少調(diào)侃的意味,他實(shí)際上也在負(fù)責(zé)任地提出AI2ES需要面對的:what are the limitations/ boundaries of this silver bullet?(這一高招的局限和邊界在哪里?)。完整回答這個(gè)問題,“可信的”要素完全不可喪失,這也是為什么在AI2ES的LOGO(附圖)中,與人工智能和環(huán)境科學(xué)并列的第三個(gè)關(guān)鍵詞,選擇了Risk Communication(風(fēng)險(xiǎn)溝通),在更現(xiàn)實(shí)的意義上,點(diǎn)出了環(huán)境學(xué)者在引入AI時(shí)要有的意識。
ML和NN等AI技術(shù),已經(jīng)成為氣象科技發(fā)展重要因素和變數(shù),要發(fā)展與氣象預(yù)報(bào)這一與國計(jì)民生密切相關(guān)領(lǐng)域的、融合了AI的新技術(shù),“trustworthy”或許是我們選擇、改進(jìn)和應(yīng)用各種AI技術(shù)的前提。堅(jiān)持這樣的前提,不可或缺的做法之一,就是更加準(zhǔn)確、科學(xué)地定義或再定義融入了各種AI技術(shù)的新術(shù)語,例如:De-biasing Techniques(消偏技術(shù))、Fast linearised models for DA(快速線性化DA模式)、Fast Emulation of Parameterisations(參數(shù)化快速仿真)、Data driven Parameterisations(數(shù)據(jù)驅(qū)動(dòng)參數(shù)化)和Non-linear Ensemble Averaging(非線性集合平均)等。
Advances in Meteorological Science and Technology2022年1期