2024年的諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)有一個(gè)共同的特點(diǎn),都青睞人工智能(AI)。物理學(xué)獎(jiǎng)?lì)C給了美國(guó)新澤西州普林斯頓大學(xué)的約翰-霍普菲爾德和加拿大多倫多大學(xué)的杰弗里-辛頓,以表彰他們利用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)發(fā)現(xiàn)和發(fā)明?;瘜W(xué)獎(jiǎng)授予3位科學(xué)家,其中一半授予美國(guó)華盛頓大學(xué)的戴維-貝克,以表彰他在蛋白質(zhì)設(shè)計(jì)方面的貢獻(xiàn);另一半則共同授予英國(guó)倫敦谷歌旗下人工智能公司“深層思維”的德米斯-哈薩比斯和約翰·江珀,以表彰他們?cè)诘鞍踪|(zhì)結(jié)構(gòu)預(yù)測(cè)方面的貢獻(xiàn)。
概括地講,就是霍普菲爾德模擬人腦神經(jīng)網(wǎng)絡(luò)發(fā)明了一個(gè)人工神經(jīng)網(wǎng)絡(luò),辛頓發(fā)明了人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法,貝克利用AI軟件設(shè)計(jì)出全新的蛋白質(zhì),哈薩比斯和江珀利用人工神經(jīng)網(wǎng)絡(luò)快速而準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。
物理學(xué)獎(jiǎng)?lì)C給了AI科學(xué)家
20世紀(jì)80年代,霍普菲爾德研發(fā)了一個(gè)人工智能網(wǎng)絡(luò),它相當(dāng)于物理學(xué)中自旋系統(tǒng)中的能量,并通過(guò)查找節(jié)點(diǎn)之間的連接值進(jìn)行訓(xùn)練,而節(jié)點(diǎn)就相當(dāng)于像素。當(dāng)這個(gè)網(wǎng)絡(luò)收到失真或不完整的圖像時(shí),會(huì)有條不紊地通過(guò)節(jié)點(diǎn)并更新它們的值。因此,網(wǎng)絡(luò)能逐步工作以找到與它所傳送的不完美圖像最相似的已保存圖像。
辛頓則利用霍普菲爾德的網(wǎng)絡(luò)來(lái)使用物理工具,如使用玻爾茲曼機(jī),由此可以學(xué)習(xí)識(shí)別給定數(shù)據(jù)類(lèi)型中的特征元素。辛頓通過(guò)向機(jī)器提供規(guī)范示例來(lái)訓(xùn)練機(jī)器,而玻爾茲曼機(jī)可用于對(duì)圖像進(jìn)行分類(lèi)或創(chuàng)建訓(xùn)練它的模式類(lèi)型。辛頓以這項(xiàng)工作為基礎(chǔ),幫助啟動(dòng)了當(dāng)前機(jī)器學(xué)習(xí)突飛猛進(jìn)的發(fā)展。
人工智能有三大基石,分別是數(shù)據(jù)、算力、算法。物理研究包括理論推導(dǎo)和實(shí)驗(yàn),后者也要用計(jì)算機(jī)模擬。機(jī)器學(xué)習(xí),即深度學(xué)習(xí),其實(shí)是一種算法,本質(zhì)上是數(shù)學(xué)領(lǐng)域的問(wèn)題。如果數(shù)據(jù)充足,就可以搭建一個(gè)神經(jīng)網(wǎng)絡(luò),然后通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型(機(jī)器學(xué)習(xí))找到數(shù)據(jù)之間隱藏的規(guī)律。
辛頓開(kāi)啟和奠定了算法基礎(chǔ),包括證明反向傳播算法、發(fā)明玻爾茲曼機(jī)、改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)。由于研發(fā)了深度卷積神經(jīng)網(wǎng)絡(luò),他被譽(yù)為“深度學(xué)習(xí)教父”。深度卷積神經(jīng)網(wǎng)絡(luò)直接促使了AI識(shí)圖功能的大爆發(fā),現(xiàn)在被廣泛應(yīng)用的人臉識(shí)別技術(shù)正來(lái)源于此。
同時(shí),人們熟知的大型語(yǔ)言模型(LLM)就是基于大量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的超大型深度學(xué)習(xí)模型。它的底層轉(zhuǎn)換器是一組神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)由具有自注意力功能的編碼器和解碼器組成。編碼器和解碼器從一系列文本中提取含義,并理解其中的單詞和短語(yǔ)之間的關(guān)系,以及語(yǔ)法。OpenAI的GPT系列就是大語(yǔ)言模型的典型代表。
因此,人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)并非只用于數(shù)據(jù)處理,而是有廣泛的用途,相當(dāng)于擴(kuò)大了數(shù)億人的大腦功能,可以進(jìn)行歸納和推理,幫助人作出正確的決策。這也是為何2024年諾貝爾物理學(xué)獎(jiǎng)授予這一基礎(chǔ)發(fā)現(xiàn)和發(fā)明的原因。
化學(xué)獎(jiǎng)也和人工智能有關(guān)
在2024年諾貝爾化學(xué)獎(jiǎng)方面,貝克研發(fā)的計(jì)算機(jī)化的方法實(shí)現(xiàn)了許多人認(rèn)為的不可能的事情——?jiǎng)?chuàng)造了以前不存在的蛋白質(zhì);哈薩比斯和江珀則利用人工智能成功解決了化學(xué)家50多年來(lái)一直在努力解決的問(wèn)題——根據(jù)氨基酸序列預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)。
2003年,貝克成功地使用人工智能模型羅塞塔(Rosetta)設(shè)計(jì)了一種不同于任何其他蛋白質(zhì)的新蛋白質(zhì)。這個(gè)發(fā)現(xiàn)的重要意義在于:人類(lèi)可以設(shè)計(jì)和創(chuàng)造蛋白質(zhì),包括無(wú)數(shù)種藥物、疫苗,以及作為納米材料和微型傳感器的蛋白質(zhì)。
哈薩比斯和江珀則專(zhuān)注于蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)。在蛋白質(zhì)中,氨基酸以長(zhǎng)鏈的形式連接在一起,這些長(zhǎng)鏈折疊形成三維結(jié)構(gòu),這對(duì)蛋白質(zhì)的功能起決定性作用。20世紀(jì)70年代以來(lái),研究人員一直試圖從氨基酸序列中預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu),但這似乎難于上青天。尤其是蛋白質(zhì)折疊,被視為難上加難。以前,研究人員只能用實(shí)驗(yàn)方法去測(cè)定蛋白質(zhì)的三維構(gòu)型,而這需要大量的人力、物力和時(shí)間,需要復(fù)雜的儀器與專(zhuān)家級(jí)專(zhuān)業(yè)人員。然而,2000年,哈薩比斯和江珀推出了一個(gè)石破天驚的模型,它名為“阿爾法折疊-2”,對(duì)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)準(zhǔn)確率達(dá)到90%。
阿爾法折疊能從蛋白質(zhì)的一級(jí)結(jié)構(gòu),即氨基酸的排列序列來(lái)預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu),即蛋白質(zhì)分子中某一段肽鏈的局部空間結(jié)構(gòu),進(jìn)而預(yù)測(cè)蛋白質(zhì)的三級(jí)結(jié)構(gòu),即在二級(jí)結(jié)構(gòu)的基礎(chǔ)上多段進(jìn)一步折疊盤(pán)繞后形成的特定空間結(jié)構(gòu),以及預(yù)測(cè)蛋白質(zhì)的四級(jí)結(jié)構(gòu),即蛋白質(zhì)一蛋白質(zhì)復(fù)合形成的結(jié)構(gòu),這是更為復(fù)雜的生物大分子。有了阿爾法折疊及其開(kāi)放的源代碼,研究人員可以立體和全方位地分析所有蛋白質(zhì)的結(jié)構(gòu)。
當(dāng)AI助力或者本身就融于物理學(xué)和化學(xué)之時(shí),物理學(xué)和化學(xué)都有可能成為真正的“理綜”,未來(lái)的諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)也有可能會(huì)融合為諾貝爾科學(xué)獎(jiǎng)。