【摘要】生成式人工智能的發(fā)布標(biāo)志著人工智能邁入社會應(yīng)用階段,引發(fā)各領(lǐng)域?qū)θ斯ぶ悄苡绊懙挠懻?。在學(xué)術(shù)領(lǐng)域,人工智能帶來的影響遠(yuǎn)大于科學(xué)革命中計量技術(shù)帶來的震動,其中,對文科的影響尤其具有顛覆性。在學(xué)術(shù)發(fā)展的歷史里,文科是整體性學(xué)術(shù)在科學(xué)革命里的剩余,其中人文學(xué)科還帶著整體性學(xué)術(shù)的特征。在技術(shù)發(fā)展的脈絡(luò)里,人工智能不是一個具有充分共識的概念,可對人工智能的應(yīng)用均指向?qū)θ祟愃季S與行動能力的延展和替代。人工智能對學(xué)術(shù)領(lǐng)域的影響產(chǎn)生了學(xué)術(shù)智能,其中理科智能形成了一些可資借鑒的路徑,文科智能將會與理科智能殊途同歸,文科的未來終將通過人機(jī)互生的知識創(chuàng)新與積累而成為人類日常需求的知識源。
【關(guān)鍵詞】人工智能? 學(xué)術(shù)智能? 理科智能? 文科智能
【中圖分類號】G434/G642.3? ? ? ? ? ? ? ? ? ?【文獻(xiàn)標(biāo)識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2024.02.002
2022年11月30日,ChatGPT的發(fā)布標(biāo)志著人工智能從實驗室邁入社會應(yīng)用。一年多以來,人工智能話題的熱度持續(xù)不減。近期,GPTs的發(fā)布,進(jìn)一步延續(xù)了人工智能話題的熱度。圍繞人工智能與人類未來,從日常支持、工作替代,到人類替代;從社會大眾、專家精英到國際社會,人們熱議人工智能給人類社會帶來的無限可能。其中,既有對人工智能影響的積極期待,如改善人類健康、提高殘障人士的生活質(zhì)量、增進(jìn)人類福祉等;也有對人工智能負(fù)面影響的想象,如替代人類工作,讓大量勞動力失去工作崗位,包括對人類的奴役、替代,甚至消滅等。
在豐富的想象中,處理人工智能與人類關(guān)系的人工智能倫理成為各國政府和社會關(guān)注的重點(diǎn)議題。2023年11月1日,首屆人工智能安全峰會在英國倫敦布萊奇利莊園舉行,標(biāo)志著對人工智能負(fù)面影響的警惕已經(jīng)進(jìn)入各國政府的視野。
在保證人類安全的前提下,應(yīng)用人工智能造福人類社會也成為各國努力和競爭的主要場域。其中,知識創(chuàng)新與積累是一個小眾卻又對人類影響深遠(yuǎn)的領(lǐng)域。事實上,人工智能對學(xué)術(shù)的影響快速且深入,業(yè)已形成了一個通用術(shù)語“理科智能”(AI for science)。按照人們當(dāng)下對學(xué)術(shù)的理解,學(xué)術(shù)包含自然科學(xué)、社會科學(xué)和人文學(xué)科。如果不那么精準(zhǔn)和復(fù)雜地進(jìn)行分類,則可以簡化為文科和理科。與16世紀(jì)中葉科學(xué)革命初期的格局類似,人工智能在學(xué)術(shù)領(lǐng)域應(yīng)用(學(xué)術(shù)智能,AI for academia)的切入點(diǎn)主要集中在理科(science)。對于文科智能,專家們雖然進(jìn)行了許多努力(Lazer et al., 2009; Lazer et al., 2020),當(dāng)下卻還沒有找準(zhǔn)突破口,還沒有像理科智能那樣形成可以閉環(huán)的工作流程或場景邏輯,更沒有形成可以上線GPTs的應(yīng)用。
本文從學(xué)術(shù)發(fā)展的歷史和人工智能技術(shù)的脈絡(luò)出發(fā),試圖探討人工智能與文科未來。自從人類把對自然與社會的解釋權(quán)從諸神手中奪過來、用知識替代神諭以來,學(xué)術(shù)發(fā)展始終呈現(xiàn)為“素材-方法-理論”之間的互動與促進(jìn)。其中,觸發(fā)三要素形成新互動模式的始終是技術(shù)演進(jìn)(邱澤奇,2023)。如果把人工智能理解為新一輪的技術(shù)變革,便意味著文科三要素面臨互動模式的新發(fā)展。新的互動模式會怎樣呈現(xiàn)呢?對該問題的回答可以有兩條研究路徑。一是運(yùn)用事實進(jìn)行歸納和提煉,獲得人工智能與文科未來的事實邏輯。只是,開啟這一路徑的前提是有事實,即需要在實踐層次獲得人工智能與文科發(fā)展的諸多場景。遺憾的是,理科智能在當(dāng)下已有若干場景,而文科智能還沒有。如此,我們只能選擇另一條路徑——借鑒已有的事實,在概念層次進(jìn)行探討。本文采用的是第二條研究路徑。為了在概念層次闡述人工智能與文科未來,我們還需要回答幾個基本問題,如什么是文科?什么是人工智能?人工智能與文科未來有什么關(guān)系?后面的討論將分為三個部分:從學(xué)術(shù)發(fā)展的歷史中論證文科是人類知識創(chuàng)新與積累的剩余領(lǐng)域;從技術(shù)脈絡(luò)的演進(jìn)里闡述人工智能是人類智力的延展和替代;運(yùn)用理科智能實踐闡述文科未來是文科智能,而文科智能的本質(zhì)也是人機(jī)互生。
學(xué)術(shù)發(fā)展史中的文科
文科通常是人文學(xué)科和社會科學(xué)的總稱。人文學(xué)科與社會科學(xué)的分野不是從來如此。夫子講“六藝”,講的是人類的知識和能力,并沒有區(qū)分人文和社科,也沒有區(qū)分文科和理科。區(qū)分人文和社科是科學(xué)革命之后的現(xiàn)象。當(dāng)下,大多數(shù)人的第一個共識是,把以探索人類精神為基本目標(biāo)的學(xué)科稱為人文學(xué)科。人們不以“科學(xué)”指稱人文類的學(xué)術(shù)研究,是因為在對人文的探索中還有許多不滿足科學(xué)邏輯的部分,譬如文學(xué)與藝術(shù)對人類精神的探索很難用科學(xué)邏輯進(jìn)行歸納和解釋。當(dāng)然,人文探索是否需要滿足科學(xué)邏輯要另當(dāng)別論,因為這也是一個極有爭議的議題。大多數(shù)人的第二個共識是把以探索社會規(guī)律為目標(biāo)的學(xué)科稱為社會科學(xué)。人們以科學(xué)指稱對社會現(xiàn)象的學(xué)術(shù)探索,是因為在對社會的探索中均試圖用科學(xué)邏輯對社會現(xiàn)象進(jìn)行歸納和解釋。毋庸諱言,社會科學(xué)對社會現(xiàn)象的歸納和解釋與自然科學(xué)對自然現(xiàn)象的歸納和解釋還有很大區(qū)別??墒?,社會科學(xué)家們總是試圖理解社會現(xiàn)象發(fā)生發(fā)展的規(guī)律,也盡量讓對社會現(xiàn)象的歸納和解釋符合嚴(yán)謹(jǐn)?shù)目茖W(xué)邏輯,在這一點(diǎn)上,他們與自然科學(xué)家們對自然現(xiàn)象歸納和解釋的努力是一致的。
在人工智能運(yùn)用于科學(xué)研究之前,依據(jù)科學(xué)探索三要素(素材、方法、理論)組合的發(fā)展,文科大致經(jīng)歷過兩個相互承接卻又有本質(zhì)差異的階段,即學(xué)術(shù)階段和學(xué)科階段(邱澤奇,2023)。進(jìn)入數(shù)字時代以來,文科發(fā)展進(jìn)入第三個階段,即智能階段。人工智能是這個階段出現(xiàn)的現(xiàn)象,也是在這個階段構(gòu)成了與文科的關(guān)系。回溯學(xué)術(shù)的歷史,在文科發(fā)展的每個階段,技術(shù)進(jìn)步始終是撬動文科(準(zhǔn)確地說是撬動整個學(xué)術(shù))變革的力量。要么帶來素材的豐富,要么帶來方法的革新,要么對既有理論提出挑戰(zhàn)。無論是素材豐富還是方法創(chuàng)新,都會推動人類觀念的變革,進(jìn)而帶來觀察事物視角或理論的革故鼎新。換句話說,三要素互動與促進(jìn)帶來的是人類對人文精神與社會規(guī)律認(rèn)知的創(chuàng)新與積累。
在人類發(fā)展的早期,用于知識創(chuàng)新與積累的素材數(shù)量和類型都相對有限,只有文本、圖像、實物、言語、音樂、舞蹈、儀式等。不過,人們把想象拓展和比較分析等方法運(yùn)用于有限素材,還是發(fā)展出了對自然與社會的認(rèn)知方法,形成了認(rèn)識自然與社會的知識創(chuàng)新與積累模式,也就是人們常說的學(xué)術(shù)(academia)。
學(xué)術(shù)是人類知識創(chuàng)新與積累的第一個階段,也是文科發(fā)展的第一個階段,在本質(zhì)上是人類理性與神諭分離的過程,形成的是人類對自然與社會現(xiàn)象的整體性認(rèn)知。必須指出的是,整體性知識是一部分人個性化地對自然和社會現(xiàn)象進(jìn)行非計量刻畫與闡釋的產(chǎn)物。我們說的文科,在那時還是整體性知識的一部分。從神諭到學(xué)術(shù)的發(fā)展,其價值和意義不只在于當(dāng)下理解的知識創(chuàng)新與積累,更重要的是讓人類在認(rèn)知上擺脫了對諸神的依附,用人類理性建構(gòu)起面向自然現(xiàn)象與社會現(xiàn)象的知識體系。與此同時,人類也因一部分人對創(chuàng)造與積累知識的貢獻(xiàn)而將他們塑造成知識精英(傳統(tǒng)中國人常說的“讀書人”),將他們奉為圣賢,并將對自然現(xiàn)象與社會現(xiàn)象的解釋權(quán)讓渡給他們。古希臘的“三圣”、中國春秋戰(zhàn)國時期的諸子百家莫不是如此。
在以整體性闡釋為特征的學(xué)術(shù)發(fā)展中,人們逐漸發(fā)現(xiàn),采用新的方法或技術(shù)工具可以獲得同一個對象或現(xiàn)象的不同素材,改變對對象或現(xiàn)象的認(rèn)知。例如,1543年,維薩里出版了《人體構(gòu)造》(De Humani Corporis Fabrica),他用解剖方法觀察人體結(jié)構(gòu),獲得了之前不曾了解的人體構(gòu)成內(nèi)容,讓諸神子民身體的構(gòu)造不再神秘。又如,哥白尼的“日心說”提出之后,第谷、伽利略、開普勒、牛頓等在其理論基礎(chǔ)之上不斷取得新的突破,特別是伽利略的望遠(yuǎn)鏡解決了哥白尼理論的不少困難。
事實上,將計量技術(shù)運(yùn)用于對自然現(xiàn)象的觀察,不僅獲得了新的素材,如觀察數(shù)據(jù)、調(diào)查數(shù)據(jù)、統(tǒng)計數(shù)據(jù)等,也對以整體性知識呈現(xiàn)的學(xué)術(shù)提出了嚴(yán)峻挑戰(zhàn),帶來了自人類樹立理性以來的另一場學(xué)術(shù)變革。直接的后果是自然科學(xué)同整體性學(xué)術(shù)的分離,這也是人類知識創(chuàng)新與積累的第二個階段,不過,這還不是文科發(fā)展的第二個階段。自然科學(xué)的獨(dú)立不只是人類理性同諸神的決裂,還是人類理性內(nèi)在的分化。伴隨自然科學(xué)分立的是分科知識的創(chuàng)新與積累。計量不僅推動了分析方法的發(fā)展,形成了科學(xué)界共識的科學(xué)實驗方法,還推動了以演繹邏輯為特征的理論發(fā)展,讓知識的創(chuàng)新與積累從對自然現(xiàn)象總體性的把握轉(zhuǎn)向?qū)唧w規(guī)律的追尋。
受自然科學(xué)影響,在面向社會現(xiàn)象時,人們也同樣試圖運(yùn)用計量技術(shù)開展研究,這便是文科發(fā)展的第二個階段。隨著統(tǒng)計思維發(fā)展為統(tǒng)計科學(xué),對社會現(xiàn)象規(guī)律的追尋也成為分科學(xué)術(shù)的重要組成部分。社會科學(xué)各學(xué)科的建立與發(fā)展正是這一歷史潮流的直接后果。政治學(xué)、經(jīng)濟(jì)學(xué)、社會學(xué)、教育學(xué)、法學(xué)等莫不如是。新素材的出現(xiàn)推動了新方法的發(fā)展。比照自然科學(xué)的實驗方法,社會科學(xué)發(fā)展出了思想實驗。為了證明思想實驗的現(xiàn)實性,社會科學(xué)又發(fā)展了實證分析,用客觀事實證明邏輯推理的現(xiàn)實性。對現(xiàn)實邏輯的歸納和檢驗則推動了對社會現(xiàn)象規(guī)律的檢驗。文科由此不再滿足于對人類價值和意義的闡釋,而希望通過對社會規(guī)律的發(fā)現(xiàn)和檢驗,減少人類面對的不確定性,進(jìn)而增進(jìn)人類的福祉。
緊隨自然科學(xué)潮流,試圖對社會規(guī)律進(jìn)行探討和對社會現(xiàn)象進(jìn)行解釋的分科學(xué)術(shù)也制造了一個理想與現(xiàn)實的悖論:學(xué)科化的規(guī)律探索與整體性人類生態(tài)的背離。與自然現(xiàn)象不同,社會現(xiàn)象原本具有整體性和生態(tài)性,學(xué)科化的確可以在給定條件下獲得社會具體現(xiàn)象的規(guī)律,卻忽略了社會現(xiàn)象之間的整體關(guān)聯(lián)和生態(tài)關(guān)聯(lián)。一系列來自嚴(yán)格給定條件的具體規(guī)律,在面向一般社會現(xiàn)象時,頃刻間變得離散化和碎片化,難以讓人們建立面向日常社會現(xiàn)象的總體圖景,也難以讓人們在總體上把握社會規(guī)律,自然也無法復(fù)盤社會現(xiàn)象。這便是科爾曼著名的宏微觀悖論(Coleman, 1994)。以此為依據(jù),人們總認(rèn)為社會科學(xué)是“軟”的,與人們試圖從現(xiàn)象獲得的對社會的認(rèn)識還差著一步。其實,這正是社會科學(xué)的軟肋:難以形成對社會現(xiàn)象的擬合或重建。
文科發(fā)展的第二個階段并不徹底。隨著社會科學(xué)同整體性學(xué)術(shù)的分立,整體性學(xué)術(shù)的剩余便是如今的人文學(xué)科。只是,這些剩余中的少部分也還在試圖進(jìn)入科學(xué)陣營,如計量史學(xué)、科技考古、分析哲學(xué)等。這些剩余中的大部分則還保留了傳統(tǒng)整體性學(xué)術(shù)的特征,用第一階段的方法分析第一階段既有素材,闡述人類的價值和意義。
基于計量的對自然規(guī)律的探索給人類帶來了具體且豐厚的回報。工業(yè)革命是以自然科學(xué)為基底的,人類物質(zhì)生活的豐富又是以工業(yè)革命為前提的。自然科學(xué)與工業(yè)技術(shù)的互動,在帶來人類物質(zhì)生活極大豐富的同時,還大大地延展甚至替代了人類的體力,把人類從繁重的或無力承擔(dān)的體力勞動中解放出來。與此同時,人類還希望分科學(xué)術(shù)對社會現(xiàn)象的探索可以與自然科學(xué)對自然現(xiàn)象的探索一樣為人類的社會生活帶來更大的確定性。遺憾的是,從經(jīng)濟(jì)到政治、從心理到社會,社會科學(xué)并沒有讓人類得償所愿,如今的人類依然面對著眾多難以解決的社會難題,文科也依然是一個有待積極發(fā)展的學(xué)術(shù)領(lǐng)域。
歸納起來說,在學(xué)術(shù)發(fā)展的歷史里,與其說文科經(jīng)歷了三個階段,不如說文科是科學(xué)革命的剩余。整體性知識創(chuàng)新與積累是學(xué)術(shù)的發(fā)端,在隨后的發(fā)展中,對自然現(xiàn)象的學(xué)術(shù)探索隨著科學(xué)探索三要素的計量化而分立出來,形成了被認(rèn)為是“硬科學(xué)”的自然科學(xué),即理科;剩下來的部分被認(rèn)為是“軟”的,稱之為文科。隨著對社會現(xiàn)象的學(xué)術(shù)探索也開始遵循科學(xué)邏輯,再次剩下的部分便被稱為人文學(xué)科。換句話說,不嚴(yán)格滿足科學(xué)邏輯的學(xué)術(shù)(在許多自然科學(xué)家看來,社會科學(xué)也不滿足科學(xué)邏輯),便是人們所說的文科。
技術(shù)脈絡(luò)里的人工智能
人們熱議的人工智能或許各有不同的所指。概略地說,至少有三類不同的指稱(蔡自興等,2020)。例如,作為能力的人工智能;作為機(jī)器的人工智能;以及作為學(xué)科的人工智能。筆者認(rèn)為,機(jī)器是能力的載體,是學(xué)科的產(chǎn)出。因此,這三類指稱的人工智能,在本質(zhì)上其實是一類,即機(jī)器智能。因此,筆者也更愿意用機(jī)器智能表述人工智能。
1956年召開的達(dá)特茅斯暑期研討會議標(biāo)志著人工智能作為一個學(xué)科的誕生?!蛾P(guān)于舉辦達(dá)特茅斯人工智能暑期研討會的提議》(A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence)首次提出了“人工智能”(Artificial Intelligence)概念(McCarthy et al., 1955),認(rèn)為人類學(xué)習(xí)能力的一切方面,以及智能的其他一切特性在原則上都可以被精確刻畫,從而可以用機(jī)器作為載體進(jìn)行模擬。機(jī)器可模擬諸如語言運(yùn)用、概念抽象、問題求解、自我改進(jìn)等人類能力。以此為基礎(chǔ),人工智能至少包括以下7個方面:(1)自動計算機(jī),以程序模擬人腦的功能;(2)計算機(jī)對語言的使用(學(xué)習(xí)新詞匯,并按照規(guī)則進(jìn)行語句推斷);(3)神經(jīng)網(wǎng)絡(luò)(假想神經(jīng)元如何排列組合形成概念);(4)計算復(fù)雜度理論(建立衡量計算復(fù)雜度、改進(jìn)計算效率的標(biāo)準(zhǔn));(5)自我改進(jìn);(6)抽象能力(從各種感知數(shù)據(jù)中進(jìn)行抽象);(7)隨機(jī)性與創(chuàng)造力(通過有控制的隨機(jī)性來模擬人類思維的創(chuàng)造性)??梢哉J(rèn)為,人工智能當(dāng)下探討的主要技術(shù)性議題在那次研討會上均已涉及,不過尚沒有涉及后來極具爭議的對“智能”的界定。
人們對智能的理解大致有兩類。第一類認(rèn)為,人類智能是理解和學(xué)習(xí)事物的思考能力,強(qiáng)調(diào)將智能與本能區(qū)別開來(蔡自興等,2020)。例如,計算機(jī)科學(xué)家明斯基就將智能理解為“解決困難問題的能力”(Minsky, 1985)。第二類則將智能視為應(yīng)用知識處理問題的能力或由目標(biāo)準(zhǔn)則衡量的抽象思考能力(蔡自興等,2020),強(qiáng)調(diào)人類如何適應(yīng)環(huán)境并達(dá)成系統(tǒng)目標(biāo)。例如,有人將智能定義為給定一個輸入集或給定條件下進(jìn)行正確決策的能力(瓊斯,2010)。計算機(jī)科學(xué)家紐厄爾和西蒙則將涵蓋了人類智能的“一般智能行動”定義為,發(fā)生在實際情境中在一定的速度和復(fù)雜程度約束下,適合系統(tǒng)目標(biāo)、適應(yīng)環(huán)境需要的行為(Newell and Simon, 1976)。如果跳出人工智能的技術(shù)邏輯觀察人工智能,在筆者看來,兩類能力都是智能,是智能的一體兩面。學(xué)習(xí)能力是獲取知識和積累技能的能力,處理問題包括進(jìn)行決策則是運(yùn)用知識和技能的能力。兩類能力都是人類智能的重要組成部分。既然如此,人工智能和人類智能又有什么關(guān)系呢?人工智能是否為人類智能的孿生?
羅素和諾維格指出,有些人根據(jù)對人類行為的復(fù)刻來定義智能,而另一些人則更喜歡用理性(rationality)來抽象地定義智能(Russell and Norvig, 2021)。智能原本各不相同:一些人將智能視為內(nèi)部思維過程和推理;而另一些人則關(guān)注智能的外部特征,即智能行為。事實上,既有的探討實際覆蓋了4種可能的組合(如表1)(Russell and Norvig, 2021)。
崇尚類人智能的人有他們對智能的定義。一年多來,人工智能熱議中經(jīng)常出現(xiàn)的圖靈測試是用類人行為理解人工智能的典型例子。圖靈提出,如果人類提問者在提出書面問題后無法分辨書面回答是來自人還是來自計算機(jī),那么,這樣的計算機(jī)便是“會思考的機(jī)器”(Turing, 1950)。值得注意的是,類人行為有特定的指稱,如需要智能才能完成的任務(wù)(Raphael, 1976),能夠發(fā)揮需要人類智能才能實現(xiàn)的功能(Kurzwell, 1990),又或者是執(zhí)行人或動物具有的智能任務(wù)(Dean et al., 1995)等。這些理解,如今被標(biāo)準(zhǔn)化為自然語言處理、知識表達(dá)、推理、學(xué)習(xí)、視覺等(Russell and Norvig, 2021)。
除了行為,強(qiáng)調(diào)思維的人認(rèn)為,會思考才是智能,主張使計算機(jī)像人類一樣思考(Newell and Simon, 1961),甚至主張反推人類思維機(jī)制。持這類觀點(diǎn)的學(xué)者認(rèn)為,人工智能是使計算機(jī)能思維、具有智力的新嘗試(Haugeland, 1985),是與人類思維、決策、問題求解和學(xué)習(xí)等有關(guān)的自動化(Bellman, 1978),是模擬人腦從事推理、規(guī)劃、設(shè)計、思考、學(xué)習(xí)等思維活動(Rich, 1983)。
同樣,推崇理性主義的人也從行為與思維兩個維度提出了自己的主張。關(guān)注思維的人認(rèn)為,智能并不在于逼真地模擬人類,而在于正確思維的法則與無可辯駁的推理過程。邏輯主義傳統(tǒng)追求用精確的邏輯符號系統(tǒng)刻畫物體及其關(guān)系,并用程序求解一切可用邏輯符號刻畫的問題。例如,用計算模型研究智力行為(Charniak and McDermott, 1985),用計算擬合理解、推理和行為(Winston, 1992),甚至有人極端地認(rèn)為,智能即知識,即怎樣表達(dá)知識,怎樣獲取知識和怎樣使用知識(Nilsson, 1998)。
關(guān)注行為的人則認(rèn)為,智能在行動上是一種智能體(agent,社會學(xué)稱之為能動的行動者),是在環(huán)境中、在與其他智能體共存時,能夠持續(xù)自動運(yùn)轉(zhuǎn)的實體(Shoham, 1993),它既是人工智能的初衷,也是人工智能的目標(biāo)(Hayes-Roth, 1995)。還有一些觀點(diǎn),雖然沒有使用智能體概念,卻明確地以理性行動為標(biāo)準(zhǔn),如通過計算力圖理解和模仿智能(Schalkoff, 1990),探索智能(Nilsson, 1998),或建立自然智能實體(Genesereth and Nilsson, 1987)。
無論在技術(shù)層次對人工智能的理解有多復(fù)雜,在與人類智能關(guān)聯(lián)的意義上,筆者認(rèn)為,第一,盡管觀點(diǎn)各異,但機(jī)器智能是一類思維智能。思維的內(nèi)在是否滿足人類思維邏輯,是技術(shù)層次甚或理想層次的議題,關(guān)鍵是可以輸出為智能行動。第二,智能行動具有階段性。類人智能是智能行動的初級階段,理性主義則是智能行動的理想目標(biāo)。如何達(dá)成是科學(xué)與技術(shù)的目標(biāo),對應(yīng)用而言,關(guān)鍵是面對一個需要解決的議題,具有不同智能類型和層級的人工智能與人類智能之間究竟是什么關(guān)系?給定我們討論的場景,即,對文科而言,人工智能現(xiàn)在與將來究竟意味著什么?
學(xué)術(shù)智能里的文科未來
在人工智能向一切滲透的歷史潮流中,學(xué)術(shù)智能是一個無法阻擋的部分。面向人工智能,就像歷史中的文科和理科一樣,理科已經(jīng)先行一步,形成了理科智能。或許,我們可以從理科智能的努力中窺見文科未來。
理科智能的英文表述——AI for science,字面含義非常清晰,即運(yùn)用人工智能進(jìn)行科學(xué)探索。言下之意是,人工智能是科學(xué)研究的新工具,科學(xué)研究則是人工智能的應(yīng)用場景。不過,還是有人持有不同的觀點(diǎn)。湯超(2022)認(rèn)為,理科智能有三個層次:第一是把人工智能技術(shù)、特別是深度學(xué)習(xí)技術(shù)應(yīng)用于各個學(xué)科中的科研、技術(shù)創(chuàng)新、成果轉(zhuǎn)化等之中,只是在實踐中是屬于從1到10、10到100,甚至10到1000的發(fā)展,而從0到1的突破性原始創(chuàng)新不多;第二是運(yùn)用人工智能發(fā)現(xiàn)新的科學(xué)定律、創(chuàng)立新的科學(xué)范式、引發(fā)新的科學(xué)革命,而不僅僅是充實、完善已有的科學(xué)范式;第三是人工智能科學(xué)(Science of AI),研究人工智能的科學(xué)原理,如2021年諾貝爾物理學(xué)獎研究的自旋玻璃模型發(fā)展的統(tǒng)計物理理論對神經(jīng)科學(xué)和機(jī)器學(xué)習(xí)的影響。筆者認(rèn)為,湯超的觀點(diǎn)有點(diǎn)混雜,他的第一、二層次實際是同一個議題的遞進(jìn)表述,第三個層次則是人工智能這一專門領(lǐng)域的前兩個層次。說到底,理科智能是運(yùn)用人工智能進(jìn)行面向自然現(xiàn)象的知識創(chuàng)新和積累,創(chuàng)新即湯超所說的第二個層次,積累即湯超所說的第一個層次。那么,如何運(yùn)用人工智能進(jìn)行創(chuàng)新和積累呢?
有人對理科智能的既有發(fā)展進(jìn)行了歸納(Wang et al., 2023)。當(dāng)下,人工智能在理科知識創(chuàng)新和積累里扮演的角色依然是工具性的。
第一,助力數(shù)據(jù)清理和提煉。在數(shù)據(jù)篩選中,實時識別并舍棄原始數(shù)據(jù)的背景噪音,保留富含信息的數(shù)據(jù)。例如,使用異常檢測(anomaly detection)算法能夠?qū)⑾∮惺录鳛楫惓?shù)據(jù)進(jìn)行識別并保存。在物理學(xué)、神經(jīng)科學(xué)、地球科學(xué)、海洋學(xué)以及天文學(xué)等領(lǐng)域,數(shù)據(jù)選擇智能得到了廣泛的應(yīng)用。
在數(shù)據(jù)注釋中,訓(xùn)練有監(jiān)督的模型需要依賴帶有標(biāo)簽的數(shù)據(jù)集,然而,對生物學(xué)、醫(yī)學(xué)等實驗性學(xué)科來說,生成大量準(zhǔn)確標(biāo)簽的數(shù)據(jù)集既耗時又耗力。偽標(biāo)簽法(pseudo labelling)和標(biāo)簽傳播法(label propagation)便是更優(yōu)的替代方案,它們允許在只有少量準(zhǔn)確注釋的大型無標(biāo)簽數(shù)據(jù)集中進(jìn)行自動注釋。此外,主動學(xué)習(xí)還可以幫助科學(xué)家確定最有必要進(jìn)行實驗標(biāo)注的數(shù)據(jù)點(diǎn),從而進(jìn)一步降低成本。另一種數(shù)據(jù)注釋策略是借助專業(yè)知識制定標(biāo)簽規(guī)則。
在數(shù)據(jù)生成中,通過自動數(shù)據(jù)增強(qiáng)(auto augment)和深度生成模型(deep generative AI)生成額外的合成數(shù)據(jù)點(diǎn)、擴(kuò)充訓(xùn)練數(shù)據(jù)集,是創(chuàng)建更好模型的有效方法。例如,生成式對抗網(wǎng)絡(luò)(generative adversarial network)可以在多個領(lǐng)域中生成逼真且有用的數(shù)據(jù),從粒子碰撞事件、病理切片、胸部X光、磁共振對比、三維材料微結(jié)構(gòu)、蛋白質(zhì)功能到基因序列。
在數(shù)據(jù)提煉中,人工智能則能進(jìn)一步提高測量分辨率、減少噪聲,并減小測量精度的誤差,使之具有一致性。例如,黑洞成像、捕捉物理粒子碰撞、提高活細(xì)胞圖像的分辨率,以及細(xì)胞類型檢測。
第二,學(xué)習(xí)有意義的數(shù)據(jù)表達(dá)。在數(shù)據(jù)表達(dá)中,幾何先驗、幾何深度學(xué)習(xí)、自監(jiān)督學(xué)習(xí)、語言模式化、轉(zhuǎn)接構(gòu)架(transformer architectures)、神經(jīng)算子等均能夠在多層次數(shù)據(jù)中提取有意義的表達(dá)方式、優(yōu)化表達(dá),以指導(dǎo)研究。
第三,支撐科學(xué)假設(shè)建構(gòu)??茖W(xué)家們在實踐中體會到,人工智能在假設(shè)構(gòu)建的多個階段都可以發(fā)揮重要的支撐作用。例如,可以在噪聲觀測中識別候選符號表達(dá)式,進(jìn)而生成假設(shè)、幫助設(shè)計(如一個能與治療目標(biāo)結(jié)合的分子),或設(shè)想可以推翻數(shù)學(xué)猜想的反例。此外,人工智能可以學(xué)習(xí)假設(shè)的貝葉斯后驗分布,利用分布生成與科學(xué)數(shù)據(jù)和知識相吻合的假設(shè)。實踐策略如黑箱預(yù)測、引導(dǎo)組合假設(shè)空間、優(yōu)化可微假設(shè)空間等。
第四,驅(qū)動實驗與仿真。實驗成本高昂、操作復(fù)雜是理科始終面對的實踐難題,計算機(jī)仿真一直是替代方案,人工智能為計算機(jī)仿真提供了更為有效和靈活的實驗手段??茖W(xué)家可以通過人工智能識別和優(yōu)化假設(shè)進(jìn)行測試,還可運(yùn)用計算機(jī)仿真進(jìn)行假設(shè)檢驗。例如,對科學(xué)假設(shè)進(jìn)行有效性評估,運(yùn)用仿真對假設(shè)進(jìn)行推演觀察等。
也有人認(rèn)為,理科智能是自然科學(xué)的新范式(Zhang et al., 2023)。學(xué)者們系統(tǒng)地考察了用于量子、原子和連續(xù)體系統(tǒng)的人工智能應(yīng)用,認(rèn)為從亞原子(波函數(shù)和電子密度)、原子(分子、蛋白質(zhì)、材料和相互作用)到宏觀(流體、氣候和地下)尺度,通過深度學(xué)習(xí)捕獲自然系統(tǒng)的物理第一性原理尤其是對稱性,是具有挑戰(zhàn)性的人工智能運(yùn)用領(lǐng)域,其中可解釋性、分布外泛化、使用基礎(chǔ)和大型語言模型進(jìn)行知識轉(zhuǎn)移以及不確定性量化,都是人工智能運(yùn)用的重要場景。還有人考察了人工智能在基礎(chǔ)科學(xué)的應(yīng)用(Xu et al., 2021),如信息科學(xué)、數(shù)學(xué)、醫(yī)學(xué)、材料科學(xué)、地球科學(xué)、生命科學(xué)、物理和化學(xué)等。
對20余位數(shù)據(jù)科學(xué)家進(jìn)行的半結(jié)構(gòu)式訪談研究(Wang et al., 2019)還表明,人工智能還運(yùn)用于自動化數(shù)據(jù)科學(xué)家的工作實踐,如Auto AI或Auto ML系統(tǒng)能自主獲取和預(yù)處理數(shù)據(jù)、設(shè)置新特征,并根據(jù)目標(biāo)(如準(zhǔn)確性或運(yùn)行效率)創(chuàng)建模型、給模型打分等。科學(xué)家們認(rèn)為,人工智能一方面加快了構(gòu)建數(shù)據(jù)科學(xué)的進(jìn)程;另一方面還可能過度降低數(shù)據(jù)科學(xué)從業(yè)人員的技術(shù)門檻。
還有科學(xué)家在設(shè)想一個能夠在生物醫(yī)學(xué)科學(xué)領(lǐng)域進(jìn)行重大科學(xué)發(fā)現(xiàn)的人工智能(Kitano, 2016),如生成并驗證大量假設(shè),開展實時的隨機(jī)推斷、開展多策略的適應(yīng)性學(xué)習(xí)、保持無限的數(shù)據(jù)記憶容量、執(zhí)行大量并行異質(zhì)處理等。在這些進(jìn)程中,人工智能可以克服人類在信息處理能力、知識表達(dá)能力、表型能力(phenotyping)等方面的認(rèn)知局限、推動生物醫(yī)學(xué)實現(xiàn)研究方法的迭代升級,使科學(xué)發(fā)現(xiàn)變?yōu)楦咝У膶嵺`成為可能。
科學(xué)家們認(rèn)為,理論上,人工智能系統(tǒng)可以檢驗所有可能的假設(shè),重新定義科學(xué)直覺的本質(zhì)與科學(xué)發(fā)現(xiàn)的過程。應(yīng)用于科學(xué)發(fā)現(xiàn)的人工智能將超越現(xiàn)有的人工智能與專家組合,成為頂級研究機(jī)構(gòu)的基礎(chǔ)設(shè)施,甚至有望居于其他人工智能系統(tǒng)和人類智能體網(wǎng)絡(luò)的中心,協(xié)調(diào)大規(guī)模的人機(jī)智力活動。例如,實現(xiàn)對數(shù)據(jù)的自動化分析和發(fā)現(xiàn),系統(tǒng)、準(zhǔn)確地搜索假設(shè)空間以確保最優(yōu)結(jié)果,自主地發(fā)現(xiàn)數(shù)據(jù)中的復(fù)雜模式,實現(xiàn)小規(guī)模科學(xué)過程應(yīng)用的可靠、一致、透明和可復(fù)制(Gil et al., 2014),包括在處理大數(shù)據(jù)、發(fā)現(xiàn)長尾的暗數(shù)據(jù)等方面作出貢獻(xiàn),并通過工作流程系統(tǒng)實現(xiàn)科學(xué)發(fā)現(xiàn)過程的自動化(Gil and Hirsh, 2012)。
縱觀理科智能的實踐和科學(xué)家們對理科智能的洞見,我們可以作如下歸納:
第一,數(shù)據(jù)是理科智能的前提,沒有數(shù)據(jù)便沒有理科智能。理科數(shù)據(jù)有兩類來源,一是科學(xué)活動產(chǎn)生的數(shù)據(jù),如實驗數(shù)據(jù)、觀測數(shù)據(jù)、傳感數(shù)據(jù)、調(diào)查數(shù)據(jù)等,在人工智能可以運(yùn)用于理科之前,理科已經(jīng)在依據(jù)數(shù)據(jù)做研究;二是人工智能生成的數(shù)據(jù),在給定事物之間關(guān)系的前提下,人工智能有能力產(chǎn)生可用于研究活動的數(shù)據(jù),即生成式數(shù)據(jù)。
第二,人工智能有助于標(biāo)記數(shù)據(jù)、清理數(shù)據(jù)、篩選數(shù)據(jù)、分析數(shù)據(jù)、表達(dá)數(shù)據(jù)。理科數(shù)據(jù)的規(guī)模和類型多元且復(fù)雜。清理數(shù)據(jù)曾經(jīng)是工作量巨大且勞動力密集型的科學(xué)活動,無論是實驗或觀測產(chǎn)生的數(shù)據(jù)還是人工智能生成的數(shù)據(jù),人工智能都可以用于標(biāo)記數(shù)據(jù)、清理數(shù)據(jù)、篩選數(shù)據(jù)、分析數(shù)據(jù)、表達(dá)數(shù)據(jù),讓數(shù)據(jù)以科學(xué)家希望的形式精準(zhǔn)地呈現(xiàn)。
第三,人工智能有助于檢驗或發(fā)現(xiàn)事物之間的關(guān)系模式。運(yùn)用數(shù)據(jù)檢驗科學(xué)假設(shè)是科學(xué)研究最重要的活動之一,人類計算能力的局限一度導(dǎo)致可以運(yùn)用于假設(shè)檢驗的數(shù)據(jù)量非常有限,人工智能之于科學(xué)計算,有能力在假設(shè)檢驗中納入更多數(shù)據(jù)和參數(shù),如生成式大模型的參數(shù)量級已經(jīng)逼近萬億,完全達(dá)到了人力不可及的量級。不僅如此,計算能力和模式發(fā)現(xiàn)(如機(jī)器學(xué)習(xí),無論是哪種學(xué)習(xí))能力的增長,讓人工智能所具備的從數(shù)據(jù)中發(fā)現(xiàn)事物之間關(guān)系模式的能力早已超越了人類,人工智能可以實現(xiàn)從數(shù)據(jù)中發(fā)現(xiàn)模式,使得創(chuàng)新和積累知識不只是理科智能的應(yīng)用場景,甚至開始運(yùn)用于生產(chǎn)實踐,如藥物篩選、材料發(fā)現(xiàn),等等。
第四,人機(jī)互生,科學(xué)家與機(jī)器智能相互促進(jìn)。對理科智能的眾多討論只是刻畫了科研實踐,即使提及理科的新范式,也語焉不詳。其實,科研實踐已經(jīng)揭示了理科智能的應(yīng)用場景,這也是在之前的理科中不曾出現(xiàn)的部分。例如,人機(jī)之間相互啟發(fā)與互動,一方面機(jī)器給人類帶來靈感,啟發(fā)人類進(jìn)行創(chuàng)新;另一方面人類也給機(jī)器提出難題,挑戰(zhàn)機(jī)器綜合人類知識和從知識中發(fā)現(xiàn)新知識的能力,促進(jìn)機(jī)器智能能力的迭代創(chuàng)新。既有的人工智能運(yùn)用幾乎都能證明這一點(diǎn),如Alpha Fold 2與蛋白質(zhì)結(jié)構(gòu)預(yù)測、Graphormer與分子建模等。
除此以外,筆者認(rèn)為,關(guān)于理科智能的討論有一個重要缺失,即對知識創(chuàng)新與積累的路徑缺乏討論。截至當(dāng)下,幾乎所有討論都還是以既有分科學(xué)術(shù)為默認(rèn)前提的討論,沒有觸及類似科學(xué)革命帶來的分科學(xué)術(shù)的路徑討論,或者尚未提及知識創(chuàng)新與積累的新形態(tài)或新范式。
即使如此,文科智能可以從理科智能中看到怎樣的未來呢?對此,筆者在之前的討論已有部分述及(邱澤奇,2023),這里不妨摘其要而論。
第一,與理科智能一樣,文科智能的前提也是數(shù)據(jù)。在一定程度上可以說,理科在科學(xué)革命之后就完成了以數(shù)據(jù)為支撐的科學(xué)邏輯建構(gòu),而文科還沒有完成以數(shù)據(jù)為基底的知識創(chuàng)新與邏輯建構(gòu)??芍灰狈?shù)據(jù),就難以讓人工智能進(jìn)入文科智能。因此,文科未來的第一階段工作是素材的數(shù)據(jù)化,將對社會現(xiàn)象的刻畫從文字的、形象的轉(zhuǎn)變?yōu)閿?shù)據(jù)的,從碎片化的、離散化的數(shù)據(jù)轉(zhuǎn)變?yōu)閰R聚化的、可以彼此關(guān)聯(lián)的數(shù)據(jù),進(jìn)而為運(yùn)用算法、回到整體視角提供條件,且可以讓人工智能支持甚至支撐數(shù)據(jù)化,如一切非數(shù)據(jù)素材的數(shù)據(jù)化。不僅如此,人工智能同樣可以針對社會現(xiàn)象生成數(shù)據(jù)。簡言之,“一切皆可數(shù)據(jù)化”的邏輯同樣適用于文科素材。
第二,接下來的場景,文科與理科是一致的。如標(biāo)記數(shù)據(jù)、清理數(shù)據(jù)、篩選數(shù)據(jù)、分析數(shù)據(jù)、表達(dá)數(shù)據(jù),讓數(shù)據(jù)以文科學(xué)者希望的形式精準(zhǔn)呈現(xiàn)。再如,檢驗假設(shè)、發(fā)現(xiàn)規(guī)律等。需要特別說明的是,素材的數(shù)據(jù)化將改變?nèi)宋呐c社科分立的現(xiàn)象,使得對人類精神的探索與對社會規(guī)律的探索殊途同歸。直到當(dāng)下,人類精神現(xiàn)象是否存在規(guī)律還是一個懸而未決的議題,對精神分析的爭議便是明證。文科智能至少可以讓文科學(xué)者們證明人類的精神世界是否有規(guī)律可循。同樣,文科智能也遵循人機(jī)互生的模式。其實,彭特蘭的實驗已經(jīng)證明,人類智能是在小群體中被激發(fā)的,在小群體中有一個記憶力、算力、歸納和綜合能力超群的同伴,意味著人機(jī)互生將獲得更大創(chuàng)造力(阿萊克斯·彭特蘭,2015)。
第三,文科智能的知識創(chuàng)新與積累更有機(jī)會突破科學(xué)革命之后文科的悖論,邁向新的綜合,以可靠的、可檢驗的整體性知識造福人類。與理科智能不同,除了運(yùn)用數(shù)據(jù)檢驗假設(shè)、發(fā)現(xiàn)規(guī)律,形成給定條件下的具體規(guī)律,文科智能還需要將具體場景的規(guī)律整合起來,形成彼此關(guān)聯(lián)的、有助于人們理解和解釋日?,F(xiàn)象的知識動態(tài)。換句話說,由文科智能帶來的知識不再是嚴(yán)格約束條件下的、面向社會現(xiàn)象的規(guī)律,而是以日常為條件的、面向日常社會現(xiàn)象的理解與解釋。文科智能帶來的文科知識創(chuàng)新與積累,在外顯形態(tài)上理應(yīng)成為每個人觸手可及的知識源。
而要實踐文科智能,除了面對理科智能的挑戰(zhàn)以外,還有文科特定的挑戰(zhàn)。在學(xué)術(shù)智能中,無論是理科還是文科,當(dāng)下的實踐路徑都是建立在科學(xué)革命之后分科學(xué)術(shù)路徑基礎(chǔ)上的,人們已經(jīng)養(yǎng)成了對專門問題進(jìn)行深入挖掘的習(xí)慣,如何重新回到“深入淺出”的路徑上,在專門知識之間建立聯(lián)系,讓專門知識成為日常知識池,還沒有一條明確的可以實踐的路徑。算法創(chuàng)新或許是路徑探索的關(guān)鍵(Wang et al., 2023)。在海量數(shù)據(jù)環(huán)境下,不要說深入淺出,即使只是深入,沒有算法也寸步難行。
更大的難題還在于,當(dāng)下,學(xué)術(shù)界似乎還沒有充分認(rèn)識到人工智能對學(xué)術(shù)的影響力,更缺乏相關(guān)能力的積累。從數(shù)據(jù)化、模型化、算法化到知識化,每一個環(huán)節(jié)與環(huán)節(jié)關(guān)聯(lián),文科未來的起點(diǎn)似乎要從培養(yǎng)跨學(xué)科的人才開始。
結(jié)論
之所以在概念層次探討文科未來,誠如讀者所見,文科智能的發(fā)展還沒有進(jìn)入理科智能的階段,還沒有可以討論的實踐和細(xì)節(jié)。盡管如此,文科未來的方向是明確的,那就是與理科智能一樣,推動人工智能與人類智能彼此互生,通過知識積累和創(chuàng)新,形成人類知識的新形態(tài),也形成知識服務(wù)于人類的新格局,促進(jìn)人類對自身的理解與解釋,進(jìn)而增進(jìn)人類福祉。
參考文獻(xiàn)
阿萊克斯·彭特蘭,2015,《智慧社會:大數(shù)據(jù)與社會物理學(xué)》,汪小帆、汪容譯,杭州:浙江人民出版社。
蔡自興等編,2020,《人工智能及其應(yīng)用(第6版)》,北京:清華大學(xué)出版社。
瓊斯,2010,《人工智能》,黃厚寬、尹傳環(huán)、董興業(yè)譯,北京:電子工業(yè)出版社。
邱澤奇,2023,《數(shù)字化與文科范式革命》,《大學(xué)與學(xué)科》,第2期。
湯超,2022,《關(guān)于AI for Science的幾層意思》, https://hub.baai.ac.cn/view/19780。
A. Newell and H. A. Simon, 1961, “Computer Simulation of Human Thinking,“ Science, 134.
A. Newell and H. A. Simon, 1976, “Computer Science as Empirical Inquiry: Symbols and Search,“ Communications of the ACM, 19(3).
A. Turing, 1950, “Computing Machinery and Intelligence," Mind, 59(236).
B. Hayes-Roth, 1995, “Agents on Stage: Advancing the State of the Art of AI,“ Proceeding of IJCAI, (1).
B. Raphael, 1976, The Thinking Computer: Mind Inside Matter, San Francisco: W. H. Freeman.
D. K. Wang et al., 2019, “Human-AI Collaboration in Data Science: Exploring Data Scientists' Perceptions of Automated AI,“ Proceedings of the ACM on Human-Computer Interaction, 3(CSCW).
D. Lazer et al., 2009, “Computational Social Science,“ Science, 323(5915).
D. Lazer et al., 2020, “Computational Social Science: Obstacles and Opportunities,“ Science, 369(6507).
E. Charniak and D. McDermott, 1985, Introduction to Artificial Intelligence, Massachusetts: Addison-Wesley.
E. Rich, 1983, Artificial Intelligence, New York: McGraw-Hill.
H. Kitano, 2016, “Artificial Intelligence to Win the Nobel Prize and Beyond: Creating the Engine for Scientific Discovery,“ AI Magazine, 37(1).
H. C. Wang et al., 2023, “Scientific Discovery in the Age of Artificial Intelligence,“ Nature, 620, 47-60.
J. S. Coleman, 1994, Foundations of Social Theory, Cambridge: Harvard University Press.
J. Haugeland, 1985, Artificial Intelligence: The Very Idea, Cambridge: MIT Press.
J. McCarthy et al., 2006/1955, “A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence,“ AI Magazine, 27(4).
M. Genesereth and N. Nilsson, 1987, Logical Foundations of Artificial Intelligence, Los Altos: Morgan Kaufmann.
M. Minsky, 1985, The Society of Mind, New York: Simon and Schuster.
N. J. Nilsson, 1998, Artificial Intelligence: A New Synthesis, San Francisco: Morgan Kaufmann.
P. Winston, 1992, Artificial Intelligence (3rd edition), New York: Addison-Wesley.
R. Bellman, 1978, An Introduction to Artificial Intelligence: Can Computers Think? San Francisco: Boyd & Fraser Publishing Company.
R. Kurzwell, 1990, Age of Intelligent Machines, Cambridge: MIT Press.
R. Schalkoff, 1990, Artificial Intelligence: An Engineering Approach, New York: McGraw-Hill.
S. Russell and P. Norvig, 2021, Artificial Intelligence: A Modern Approach (4th edition), New York: Pearson.
T. Dean; J. F. Allen and Y. Aloimonos, 1995, Artificial Intelligence: Theory and Practice, New York: Addison-Wesley.
X. Zhang et al., 2023, “Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems,“ arXiv:2307.08423v2 [cs.LG].
Y. Gil et al., 2014, “Amplify Scientific Discovery with Artificial Intelligence,“ Science, 346(6206).
Y. Gil and H. Hirsh, 2012, “Discovery Informatics: AI Opportunities in Scientific Discovery,“ In Discovery Informatics: The Role of AI Research in Innovating Scientific Processes, Palo Alto: AAAI Press.
Y. Shoham, 1993, “Agent-Oriented Programming,“ Artificial Intelligence, 60(1).
Y. J. Xu et al., 2021, “Artificial Intelligence: A Powerful Paradigm for Scientific Research," The Innovation, 2(4).
責(zé) 編∕李思琪