【摘要】喬姆斯基的生成轉(zhuǎn)換語法(GT語法)是語言學(xué)革命和認(rèn)知科學(xué)革命的基礎(chǔ),今天它又成為ChatGPT的理論依據(jù)。從GT語法到ChatGPT,人工智能到底走了多遠(yuǎn)?從喬姆斯基GT語法分析和語言認(rèn)知入手,我們重新認(rèn)識喬姆斯基語言學(xué)革命的意義,揭示人工智能與人類心智之間的緊密關(guān)聯(lián)、依存關(guān)系和發(fā)展動力。認(rèn)知科學(xué)的建立使我們有可能從多學(xué)科綜合的高度來理解人類心智與人工智能。在此基礎(chǔ)上,我們以ChatGPT為例,分析這款人工智能軟件的利弊得失及其所造成的困惑,提出“人工智能不能做什么”這個終極問題,并嘗試給出我們的回答。人工智能就是人類所建造的非人類的智能,它不過是對人類心智的模仿。人工智能與人類心智的差別,本質(zhì)在于高階認(rèn)知(人類認(rèn)知),在于語言認(rèn)知及其基礎(chǔ)之上的思維認(rèn)知和文化認(rèn)知。人工智能今后的發(fā)展必然是體現(xiàn)語言驅(qū)動的、語言、思維和文化層級的人類心智和認(rèn)知特征的新一代人工智能。語言認(rèn)知、思維認(rèn)知和文化認(rèn)知將在未來的人工智能發(fā)展中扮演重要角色。
【關(guān)鍵詞】人類心智? 人工智能? 喬姆斯基? GT語法? ChatGPT
【中圖分類號】TB18? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻(xiàn)標(biāo)識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2023.14.002
人工智能近年來的發(fā)展頗有些令人眼花繚亂,從AlphaGo、通用人工智能和生命3.0到ChatGPT,等等,發(fā)展熱潮一浪高過一浪。在這個過程中,一些人似乎忘記了人工智能的本質(zhì)和定義——人工智能是人類創(chuàng)造的機(jī)器智能,是機(jī)器模仿人類心智所產(chǎn)生的智能。據(jù)此定義,我們不能僅就人工智能來說人工智能,而應(yīng)該從人類心智來認(rèn)識人工智能,也就是從認(rèn)知科學(xué)來認(rèn)識人工智能。
起源于20世紀(jì)50年代的人工智能與喬姆斯基語言學(xué)革命、計算機(jī)和信息技術(shù)革命以及認(rèn)知科學(xué)革命息息相關(guān)。喬姆斯基領(lǐng)導(dǎo)了語言學(xué)、心理學(xué)、計算機(jī)科學(xué)領(lǐng)域的三場革命,這些革命又相繼引發(fā)哲學(xué)、人類學(xué)和神經(jīng)科學(xué)領(lǐng)域的革命。在這些革命的影響下,1975年前后,認(rèn)知科學(xué)在美國建立,形成由語言學(xué)、心理學(xué)、哲學(xué)、人類學(xué)、計算機(jī)科學(xué)和神經(jīng)科學(xué)6大學(xué)科構(gòu)成的學(xué)科框架。2000年,科學(xué)家們將另一個與心智密切相關(guān)的學(xué)科——教育學(xué)納入認(rèn)知科學(xué)之中,形成“6+1”的學(xué)科框架。這些學(xué)科在認(rèn)知科學(xué)框架下與認(rèn)知科學(xué)交叉形成新興學(xué)科:認(rèn)知語言學(xué)、認(rèn)知心理學(xué)、心智哲學(xué)、認(rèn)知人類學(xué)、人工智能、認(rèn)知神經(jīng)科學(xué)和心智教育學(xué)。由此可見,人工智能本是認(rèn)知科學(xué)題中之義,是計算機(jī)科學(xué)與認(rèn)知科學(xué)交叉的產(chǎn)物,是人類賦予機(jī)器(計算機(jī))的智能。
人工智能誕生以后,其與認(rèn)知科學(xué)剪不斷、理還亂的關(guān)系,始終是理解人工智能的關(guān)鍵點。一是因為五個層級的人類心智是人工智能的來源和基礎(chǔ),人工智能如何學(xué)習(xí)和模仿人類心智和認(rèn)知能力,是人工智能過去、現(xiàn)在和未來發(fā)展的根據(jù)。二是作為人類心智和認(rèn)知基礎(chǔ)的語言,人工智能的發(fā)展又具有特殊的意義。當(dāng)前的人工智能新寵C(jī)hatGPT就是一款體現(xiàn)了人工智能與認(rèn)知科學(xué)結(jié)合的語言認(rèn)知軟件。
讓我們從喬姆斯基的生成轉(zhuǎn)換語法(GT語法)開始說起。
喬姆斯基和GT語法
我們先來認(rèn)識語言學(xué)革命的發(fā)起人、認(rèn)知科學(xué)的第一代領(lǐng)袖喬姆斯基(N. Chomsky, 1928-)的語言理論和語言認(rèn)知方法。
什么是語言知識?什么是語言能力?人的語言能力是哪里來的,是先天遺傳的還是后天習(xí)得的?人類如何加工語句,是經(jīng)驗主義的還是唯理主義的?自然語言和形式語言的聯(lián)系和區(qū)別在哪里?形式語言和計算機(jī)語言的關(guān)系又是什么?人類如何通過自己的語言讓計算機(jī)工作?什么是形式文法?喬姆斯基語言學(xué)革命的主要內(nèi)容和理論貢獻(xiàn)是什么?關(guān)于喬姆斯基和喬姆斯基的語言學(xué)革命,我們可以思考很多重要問題,這些問題至今仍有特別重要的意義。[1]
現(xiàn)在我們來看喬姆斯基的一個重要的語言學(xué)理論——生成轉(zhuǎn)換語法(generative transformational grammar),簡稱GT語法。
喬姆斯基著述豐厚,其理論一直處在不斷的變動之中。第一階段從1950年代中期開始到1970年代中期,這個時期是生成轉(zhuǎn)換語法的形成時期,這個時期的重要語言理論有50年代的句法結(jié)構(gòu)理論(SS)、60年代的標(biāo)準(zhǔn)理論(ST)、70年代的擴(kuò)展的標(biāo)準(zhǔn)理論(EST)和修正擴(kuò)展的標(biāo)準(zhǔn)理論(REST),等等。第二階段是1970年代以后,這個時期的重要理論包括管轄和約束理論(GB)、最簡方案(MP),等等。其中,GB又包括短語結(jié)構(gòu)的X-階標(biāo)理論(X-barT)、θ-理論(θ-T)和功能范疇(FC)、移動和格理論(MCT);MP又包括原則和參數(shù)理論(P&P),等等。
第一階段的代表作是1957年的《句法結(jié)構(gòu)》(Syntactic Structure, SS),這是喬姆斯基以博士論文為基礎(chǔ)撰寫的劃時代著作,本書建立的生成轉(zhuǎn)換語法是喬姆斯基語言學(xué)革命的標(biāo)志,它由以下三個部分構(gòu)成。
(1)短語結(jié)構(gòu)規(guī)則(phrase structure rules)。短語結(jié)構(gòu)規(guī)則也叫重寫規(guī)則(rewriting rules)。它試圖用有限的規(guī)則來生成無限的句子。重寫規(guī)則通過形式化的方法和遞歸定義,生成一系列的短語結(jié)構(gòu)。
(2)轉(zhuǎn)換規(guī)則(transformational rules)。由重寫規(guī)則生成一系列的短語結(jié)構(gòu),可分為詞匯前結(jié)構(gòu)(pre-lexical structure)和詞匯后結(jié)構(gòu)(post-lexical structure)。前者由非終端符構(gòu)成,稱為深層結(jié)構(gòu)(deep structure),后者由終端符構(gòu)成,稱為表層結(jié)構(gòu)(surface structure)。
(3)形態(tài)音位規(guī)則(morphophonemic rules)。按照喬姆斯基的理解,轉(zhuǎn)換規(guī)則將深層結(jié)構(gòu)的邏輯語法關(guān)系映射為表層結(jié)構(gòu)的語言關(guān)系與語音關(guān)系。這樣就可以解釋語言的歧義和釋義現(xiàn)象。歧義是兩個不同的深層結(jié)構(gòu)轉(zhuǎn)換為同一表層結(jié)構(gòu),釋義是同一深層結(jié)構(gòu)轉(zhuǎn)換為兩個不同的表層結(jié)構(gòu)。
喬姆斯基的生成轉(zhuǎn)換語法(generative transformational grammar)由生成語法和轉(zhuǎn)換語法兩部分構(gòu)成。我們先來看生成語法。
(一)生成語法。喬姆斯基在《句法結(jié)構(gòu)》中,給出了如下的句法結(jié)構(gòu)的一個簡單例子。
(1)? (i)? ? ?Sentence→NP VP
(ii)? ? NP→T N
(iii)? ?VP→Verb NP
(iv)? ? T→the, a
(v)? ? ?N→man, ball, etc.
(vi)? ? Verb→hit, took, etc.
我們將(1)中每一條形如X→Y的規(guī)則稱為“重寫規(guī)則”,即“重寫X為Y”,并稱這些規(guī)則的集合為一個語法。
我們稱下面的(2)為語句“the man hit the ball”從語法(1)所得出的一個推導(dǎo)。
(2)? Sentence
NP VP ? ? ? ? ? ? ?(i)
T N VP ? ? ? ? ? ? ?(ii)
T N Verb NP ? ? ? ? ? ? ?(iii)
the N Verb NP ? ? ? (iv)
the man Verb NP ? ? ? (v)
the man hit NP ? ? ? ? ? ? ?(vi)
the man hit T N ? ? ? (ii)
the man hit the N ? ? ? (iv)
the man hit the ball? ? ? ? ?(v)
其中,最右邊的一列給出得出該行符號串所依據(jù)的重寫規(guī)則。例如,第二行的串“NP VP”是根據(jù)重寫規(guī)則(i)得出的,如此等等。
這個推導(dǎo)可以用下面的樹形圖來表示:
(3)? ? ? ? ? ? ? ? ? ?Sentence
NP? ? ?? ? ? ? ? ? ? ? ? VP
T? ?? ? ? ? ? N? ? ? ? ?V? ? ?? ? NP
T?? ? ?N
the? ? ? ? ? ? ? ? man? ? ? ? ? hit? ? ? ? ?the? ? ? ? ?ball
注意這是一棵倒置的樹,樹根向上,樹梢向下。不要小看這個簡單的結(jié)構(gòu),這樣一個簡單的結(jié)構(gòu)卻表明了喬姆斯基語言學(xué)革命的開始。
喬姆斯基以前的經(jīng)驗主義語言學(xué)是從樹梢開始來分析語言的,即從具體的語句開始,分析語句的結(jié)構(gòu),找出語句的共同特征,最后總結(jié)出一個語言的語法。行為主義語言學(xué)則認(rèn)為人們的語言知識來源于語言的實踐。喬姆斯基語言學(xué)革命把這個過程倒了過來,即把這棵樹“倒”了過來。他認(rèn)為,兒童并不是一個語句、一個語句地去習(xí)得第一語言知識的,而是相反。兒童具有一種先天的語言能力,語言習(xí)得的環(huán)境和條件只是激發(fā)兒童的這種能力,所以兒童才能夠從一個結(jié)構(gòu)生成無數(shù)多的語句。換句話說,喬姆斯基認(rèn)為語言的這種結(jié)構(gòu)和規(guī)則是先天存在于兒童的頭腦之中的。語言是一種心智現(xiàn)象,這是喬姆斯基唯理主義和心理主義語言學(xué)的最本質(zhì)的特征。
注意在語句的生成過程中,使用了很多短語(Phrase),喬姆斯基用范疇名稱(categorial names)一一將其命名如下:
S:語句(Sentence)
NP:名詞短語(Noun Phrase)
M:情態(tài)詞(Modal)
VP:動詞短語(Verb Phrase)
D:限定詞(Determiner)
N:名詞(Noun)
V:動詞(Verb)
PP:介詞短語(Prepositional Phrase)
P:介詞(Preposition)
ADVP:副詞短語(Adverbial Phrase)
ADV:副詞(Adverb)
AP:形容詞短語(Adjectival Phrase)
A:形容詞(Adjective)
而這些短語也是具有結(jié)構(gòu)的,可以用短語結(jié)構(gòu)規(guī)則來刻畫,其按照這些規(guī)則生成相應(yīng)的短語。關(guān)于自然語言中最常用的是名詞短語規(guī)則、動詞短語規(guī)則、形容詞和副詞短語規(guī)則、時態(tài)和情態(tài)短語規(guī)則,等等。
(二)轉(zhuǎn)換語法。為使語法和規(guī)則盡量簡明,喬姆斯基的生成規(guī)則只負(fù)責(zé)解釋直陳語句的生成,而將其他語句形式如否定句、疑問句、倒裝句和短語成分的移動等的生成統(tǒng)統(tǒng)交給轉(zhuǎn)換規(guī)則完成。下面是一些例子。
(1a)He can hit this ball(他能擊中這個球)。
(1b)This ball, he can hit(這個球他能擊中)。
兩者的區(qū)別在于名詞短語this ball的位置不同。在語句(1a)中,名詞短語處于動詞的賓語位置上,在這個位置上this ball充當(dāng)了hit的賓語。在語句(1b)中,名詞短語this ball在邏輯上仍然應(yīng)該被理解為動詞hit的賓語,但在語法上它的位置卻處于句首,而不是及物動詞的賓語的位置。
對語句(1b)中的這種不一致的可能的解釋是:假設(shè)名詞短語NP原來處于動詞賓語的位置,后來卻被轉(zhuǎn)移到句首的位置上去了。我們可以用下面的推導(dǎo)式來對語句(1b)進(jìn)行解釋:
(2a)He can hit [NPthis ball]? ?→
(2b)[NPthis ball], he can hit
由PS規(guī)則和詞匯插入規(guī)則(Lexical Insertion Rule,簡稱LIR)生成的基本的表達(dá)式是(2a),而將某種具有不同性質(zhì)的規(guī)則應(yīng)用于基本表達(dá)時卻將名詞短語this ball從動詞賓語的位置轉(zhuǎn)移到句首位置上去了。我們把在上面的推導(dǎo)式中使用的轉(zhuǎn)移規(guī)則稱為轉(zhuǎn)換規(guī)則(transformation rule)。在下面的兩個樹圖中,轉(zhuǎn)換規(guī)則將由PS規(guī)則和LIR生成的短語標(biāo)記(3a)轉(zhuǎn)變?yōu)樯陨圆煌亩陶Z標(biāo)記(3b)。
轉(zhuǎn)換規(guī)則(transformation rule)有各種不同的類型。例如,我們把從語句(1a)轉(zhuǎn)變?yōu)檎Z句(1b)所使用的轉(zhuǎn)換規(guī)則稱為主題化(Topicalisation)規(guī)則,它的典型特征是把某一范疇移動到語句的最左端。主題化的轉(zhuǎn)換規(guī)則可以用形式化的方式表達(dá)如下:
X- NP- X? ? 結(jié)構(gòu)描寫(Structural Description)
1? ? ?2? ? ?3? ? →
2? ? 1–t–? 3 結(jié)構(gòu)變換(Structural Change)
其中,結(jié)構(gòu)描寫(SD)用來表示按照PS規(guī)則和LIR生成的短語結(jié)構(gòu),它與基本表達(dá)式相一致。用NP來表示轉(zhuǎn)換的目標(biāo)范疇,X表示NP左右兩邊的范疇變元(可以為空)。數(shù)字用來幫助我們追溯所發(fā)生的語句變換。結(jié)構(gòu)變換(SC)用來表示根據(jù)主題化規(guī)則導(dǎo)出的短語標(biāo)記,即(3b)所示的導(dǎo)出表達(dá)式。從中可以看出,用數(shù)字2標(biāo)示的目標(biāo)名詞短語NP已經(jīng)被轉(zhuǎn)移到句首的位置,它的原初位置(即在SD中所占據(jù)的位置)用符號t來代替。符號t意味著這個位置發(fā)生了短語結(jié)構(gòu)的轉(zhuǎn)移,從而留下了轉(zhuǎn)移的軌跡(trace)。
(3a)? ? ?S
NP? Aux? ? VP
V? ? ?NP
D? ? ?N
He?? ? can? ? ? ? ?hit? ? ? ? this? ? ? ? ? ? ? ? ?ball
(3b)? ? ?S
NP? ? ? ? ? NP ? AuxVP
VNP
this? ? ? ball? ? ? ?he ? ? can? ? ? hit? ? ?(trace)
以上形式規(guī)則可以用來說明所有類型的轉(zhuǎn)換。當(dāng)然,我們也可以用平常的語言來定義轉(zhuǎn)換規(guī)則。
喬姆斯基的生成轉(zhuǎn)換語法(GT語法)的意義重大:第一,這是歷史上首次使用數(shù)學(xué)邏輯(mathematical logic)的分析方法來分析自然語言的句法結(jié)構(gòu),使20世紀(jì)的語言學(xué)從經(jīng)驗主義語言學(xué)進(jìn)入到唯理主義語言學(xué)的發(fā)展階段;第二,喬姆斯基的理論表明語言加工是自上而下的(top-down)而不是經(jīng)驗主義語言學(xué)自下而上的(bottom-up),這樣我們就區(qū)分了語言能力和語言知識,并找到了“先天語言能力”(Innate Language Faculty, ILF)這把理解語言認(rèn)知能力的鑰匙;第三,喬姆斯基的形式化分析方法為自然語言理解奠定了基礎(chǔ),并成為人工智能的基本方法。喬姆斯基建立的句法結(jié)構(gòu)理論、形式方法等理論方法從一開始就成為人工智能的基礎(chǔ)理論和基本方法,今天仍然如此。本文稍后將作為案例分析的人工智能新寵——ChatGPT,正是根據(jù)喬姆斯基的GT語法演變而來的。
認(rèn)知科學(xué)與人工智能
開天辟地歷洪荒,
歷盡洪荒讓有光。
直立而行行致遠(yuǎn),
火薪相繼繼世長。
發(fā)明言語通心智,
運(yùn)用思維著文章。
知識千年成大廈,
傳承文化萬古揚(yáng)。
——《認(rèn)知科學(xué)導(dǎo)論》卷首詩。[2]
這首詩描寫了宇宙誕生之初,一片混沌,八荒黑暗,后來恒星出現(xiàn)了,宇宙才有了光亮。在距今大約600萬年前,南方古猿開始向人進(jìn)化。在這個漫長的進(jìn)化過程中,直立行走、火的使用和語言的發(fā)明三件大事最終使猿進(jìn)化成人。
生命的進(jìn)化過程,既是物種的形成及從初級到高級的進(jìn)化過程(達(dá)爾文進(jìn)化論),又是決定物種進(jìn)化的基因進(jìn)化過程(基因進(jìn)化論),今天看來,它還是心智從初級到高級的進(jìn)化過程(心智進(jìn)化論)。在這個過程中,依次形成了神經(jīng)系統(tǒng)與腦、心理、語言、思維和文化五個層級的心智,相應(yīng)地產(chǎn)生了五個層級的認(rèn)知。[3]
人類的心智與認(rèn)知。在整個世界乃至宇宙所有已知的生命形式中,惟有人類具有所有五個層級的心智與認(rèn)知。非人類動物只具有神經(jīng)系統(tǒng)、心理兩個層級的心智與認(rèn)知。
語言、思維、文化是人類特有的心智和認(rèn)知能力,我們將之稱為“人類心智”和“人類認(rèn)知”。在語言、思維和文化這三種心智能力中,語言是最根本的。有了能夠表達(dá)抽象概念的人類語言,我們才能產(chǎn)生判斷、推理、論證等邏輯思維。語言和思維建構(gòu)了人類全部知識系統(tǒng),知識積淀為文化,所以我們又有了文化這種最高形式的心智和認(rèn)知?,F(xiàn)經(jīng)發(fā)掘的最古老的中華文化遺址已有上萬年的歷史。
人工智能的出現(xiàn)要晚得多,從第一代計算機(jī)UNIVAC(1951年)和達(dá)特茅斯會議(1956年8月)算起也不過70年的歷史。
回到本文開篇的定義,人工智能是人類創(chuàng)造的機(jī)器智能,是機(jī)器模仿人類心智所產(chǎn)生的智能。最初的人工智能,只是模仿人類某種心智行為的單一的智能。今天的人工智能遍及各行各業(yè),尤其在軍事和國防上得到了卓越應(yīng)用,在烏克蘭危機(jī)中,人工智能和無人機(jī)改變了戰(zhàn)爭的面貌。在人工智能高歌猛進(jìn)的時代,強(qiáng)人工智能(Strong AI, SAI)又重新被提起,不過這次它穿上了“通用人工智能”(AGI)、“通用智能”(GI)、“普遍智能”(UI)的新馬甲。
我們看到,盡管目前的人工智能都是單一智能,但它們在其所在的領(lǐng)域中卻都勝過人類。那么,是否由此就可以得出結(jié)論,人工智能將要主宰人類,甚至將會終結(jié)人類呢?人工智能與人類心智的真正差異在哪里呢?只要我們始終牢記人工智能的定義,我們就不會迷失方向。人工智能就是人類所建造的非人類的智能,它不過是對人類心智的模仿。人工智能與人類心智的差別,本質(zhì)在于高階認(rèn)知(人類認(rèn)知),在于語言認(rèn)知及其基礎(chǔ)之上的思維認(rèn)知和文化認(rèn)知。
認(rèn)知科學(xué):從理論到技術(shù)到產(chǎn)品。在《聚合四大科技 提高人類能力》這部21世紀(jì)科學(xué)技術(shù)的綱領(lǐng)性文獻(xiàn)中,有兩段關(guān)于認(rèn)知科學(xué)和四大科技之間關(guān)系的描述。
在21世紀(jì),或者在大約5代人的時期之內(nèi),一些突破會出現(xiàn)在納米技術(shù)(消弭了自然的和人造的分子系統(tǒng)之間的界限),信息科學(xué)(導(dǎo)向更加自主的智能的機(jī)器),生物科學(xué)和生命科學(xué)(通過基因?qū)W和蛋白質(zhì)學(xué)來延長人類生命),認(rèn)知和神經(jīng)科學(xué)(創(chuàng)造出人工神經(jīng)網(wǎng)絡(luò)并破譯人類認(rèn)知),社會科學(xué)(理解文化信息,駕馭集體智商)領(lǐng)域,這些突破被用于加快技術(shù)進(jìn)步速度,并可能會再一次改變我們的物種,其深遠(yuǎn)的意義可以媲美數(shù)十萬代人以前人類首次學(xué)會口頭語言,NBICS(納米-生物-信息-認(rèn)知-社會)的技術(shù)綜合可能成為人類偉大變革的推進(jìn)器。
聚合科技(NBIC)以認(rèn)知科學(xué)為先導(dǎo)。因為規(guī)劃和設(shè)計技術(shù)需要從如何(how)、為何(why)、何處(where)、何時(when)4個層次來理解思維。這樣,我們就可以用納米科學(xué)和納米技術(shù)來制造它,用生物技術(shù)和生物醫(yī)學(xué)來實現(xiàn)它,最后用信息技術(shù)來操縱和控制它,使它工作。
這說明,在21世紀(jì)的四大科技中,認(rèn)知科學(xué)是引領(lǐng)方向的。只要認(rèn)知科學(xué)想到的,我們就可以用納米科學(xué)和納米技術(shù)來制造它,用生物技術(shù)和生物醫(yī)學(xué)來實現(xiàn)它,最后用信息技術(shù)來操縱和控制它,使它工作。這個預(yù)言,在20年后已經(jīng)完全成為現(xiàn)實?!毒酆纤拇罂萍?提高人類能力》一書從五個方面來論述聚合科技(NBIC)對21世紀(jì)人類生存和發(fā)展的影響:(1)在擴(kuò)展人類的認(rèn)知和交際能力方面;(2)在改善人類健康和身體能力方面;(3)在提高團(tuán)體和社會效益方面;(4)在國家安全和軍事國防上;(5)統(tǒng)一科學(xué)和教育。[4]
人工智能如何與認(rèn)知科學(xué)結(jié)合。人工智能為何要與認(rèn)知科學(xué)相結(jié)合,又如何結(jié)合?第一,人工智能從誕生的第一天起就與認(rèn)知科學(xué)血脈相連,共同發(fā)展。人工智能就是計算機(jī)科學(xué)與認(rèn)知科學(xué)交叉產(chǎn)生的新學(xué)科和新領(lǐng)域。第二,喬姆斯基的思想理論一直引導(dǎo)人工智能的前進(jìn)方向,ChatGPT的思想理論皆來源于喬姆斯基的GT語法。第三,人類心智和高階認(rèn)知,即語言心智和認(rèn)知、思維心智和認(rèn)知、文化心智和認(rèn)知,它們是未來人工智能所要學(xué)習(xí)和模仿的對象。第四,人工智能今后的發(fā)展必然是體現(xiàn)語言驅(qū)動的、語言、思維和文化層級的人類心智和認(rèn)知特征的新一代人工智能。語言認(rèn)知、思維認(rèn)知和文化認(rèn)知將在未來的人工智能發(fā)展中扮演重要角色。
從GT到ChatGPT:人工智能到底走了多遠(yuǎn)
ChatGPT到底有何不同。喬姆斯基是人工智能和認(rèn)知科學(xué)的第一代領(lǐng)袖,這是毋庸置疑的,現(xiàn)在一些人發(fā)表的有關(guān)人工智能的一些著作和文章似乎顯示人工智能是他們發(fā)明的,這未免讓人感到可笑。事實上,正因為有了喬姆斯基的GT語法和語言學(xué)革命,我們才有之后的心智和認(rèn)知革命,才能建立認(rèn)知科學(xué),也才能夠打通人工智能與人類心智。在這個發(fā)展過程中,有一個如前所述的長長的AI鏈條,這個鏈條目前最新的一環(huán),是已經(jīng)被神話了的ChatGPT。
首先,ChatGPT的確不同凡響。ChatGPT英文原名為“Chat Generative Pre-trained Transformer”,意為“聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器”,是OpenAI研發(fā)并于2022年11月30日發(fā)布的聊天機(jī)器人軟件。ChatGPT是由人工智能技術(shù)驅(qū)動的自然語言處理工具。它能夠通過理解和學(xué)習(xí)人類的語言來進(jìn)行對話,還能根據(jù)聊天的上下文進(jìn)行互動,像人類一樣聊天交流,甚至能完成撰寫郵件、視頻腳本、文案、翻譯、代碼、論文等任務(wù)??梢钥闯觯c之前眾多以邏輯推理為特征的人工智能軟件如深藍(lán)、AlphaGo不同,ChatGPT是在語言認(rèn)知這個層級上,進(jìn)行文本的生成、預(yù)訓(xùn)練和轉(zhuǎn)換。人工智能之前的發(fā)展和進(jìn)步主要是在思維認(rèn)知領(lǐng)域,ChatGPT卻獨辟蹊徑,轉(zhuǎn)向了更為基礎(chǔ)的語言認(rèn)知領(lǐng)域。眾所周知,認(rèn)知革命起源于喬姆斯基的語言學(xué)革命,而與其共同發(fā)展的人工智能幾十年后重新回歸語言認(rèn)知,這絕非偶然。從人類認(rèn)知五層級理論我們知道,語言認(rèn)知是全部人類認(rèn)知的基礎(chǔ),模仿人類心智和認(rèn)知的人工智能重新回歸人類認(rèn)知的基礎(chǔ),正是勢所必然。
其次,ChatGPT開創(chuàng)了人工智能的一個新時代。ChatGPT雖然只是一款對話寫作軟件,但由于其定位在語言認(rèn)知這個層級,所以它顯然比之前的以邏輯推理、思維認(rèn)知為特征的人工智能軟件更基礎(chǔ)、也更重要??梢灶A(yù)見,今后人工智能的發(fā)展必然是體現(xiàn)語言驅(qū)動的、語言、思維和文化層級的人類心智和認(rèn)知特征的新一代人工智能。
最后,在技術(shù)應(yīng)用領(lǐng)域,可能開啟主體優(yōu)先、語言驅(qū)動的自主人工智能的新時代。例如,未來可能有戰(zhàn)士主導(dǎo)、語言驅(qū)動的無人機(jī),士兵在發(fā)射前臨時下達(dá)指令,無人機(jī)自行尋找最佳算法和方案來解決問題。
當(dāng)然,ChatGPT存在的問題同樣很多,甚至更為嚴(yán)重。從認(rèn)知科學(xué)看,人工智能在思維認(rèn)知領(lǐng)域確實取得了非凡的成就,在某些方面甚至超過了人類能力,如AlphaGo、自動生產(chǎn)線和機(jī)器人以及應(yīng)用于軍事上的人工智能和無人機(jī)等。與此不同,ChatGPT卻在更為基礎(chǔ)的語言認(rèn)知領(lǐng)域向人類發(fā)起挑戰(zhàn),這就不得不引起人們的高度關(guān)注和警覺。人工智能是否會毀掉人類的語言和語言認(rèn)知能力?人工智能是否會降低人類的智商和智力水平?人工智能是否會因為自身“無道德”而挑戰(zhàn)人類的道德?在回答這些問題之前,我們先來看看什么是人類語言,什么是人類的語言認(rèn)知能力,然后我們再看看,作為GT語法的創(chuàng)建人和語言學(xué)革命的領(lǐng)袖,喬姆斯基又是怎樣看待ChatGPT的,為何他不為之叫好,反而對之無情地斥責(zé)?ChatGPT到底是什么地方出了問題?
語言的批判。語言是全部人類心智和認(rèn)知的基礎(chǔ)。認(rèn)知人類自身,就是認(rèn)識人類自身的心智,也就是認(rèn)識人類自身的語言。
哲學(xué)的發(fā)展,從對象上看,經(jīng)歷了以客體為對象的古代本體論哲學(xué),再轉(zhuǎn)變?yōu)橐灾黧w為對象的近代認(rèn)識論哲學(xué),到20世紀(jì)初以羅素發(fā)現(xiàn)集合論悖論為標(biāo)志,哲學(xué)的對象轉(zhuǎn)變?yōu)檎Z言。羅素悖論不是存在于邏輯和數(shù)學(xué)層次上,也就是說不是存在于思維層次上,而是存在于比它們更基礎(chǔ)的語言層次上。語言是主客體之間的中間環(huán)節(jié),是聯(lián)結(jié)主客體的橋梁。對人類這個已經(jīng)具備抽象的符號語言的認(rèn)知主體而言,非經(jīng)過語言不能認(rèn)識世界,世界非經(jīng)過語言不能反映到人類主體。哲學(xué)上完成這場語言變革的是維特根斯坦,體現(xiàn)在他的著作《邏輯哲學(xué)論》(1921)和《哲學(xué)研究》(1953)中,由此創(chuàng)立了20世紀(jì)西方哲學(xué)的兩大流派——分析哲學(xué)和語言哲學(xué)。
在《邏輯哲學(xué)論》中,維特根斯坦用7個命題終結(jié)了所有哲學(xué)的真理。在此書中,維特根斯坦說過很多語言與哲學(xué)關(guān)系的名言。例如,在命題§4.0031中,他斷言“全部哲學(xué)都是一種語言批判”。在接下來的命題§5.6中,他斷言“我的語言限度就是我的世界限度”。[5]在命題§6中,他進(jìn)一步斷言,“真值函數(shù)的一般形式是”。其中,是基本命題的集合,是任意命題的集合,N()是對任意命題集合的否定。根據(jù)此命題,我們可以構(gòu)成所有的真值函數(shù),即有意義的命題。因此,如果你想說有意義的話,你就必須這樣說話。否則,就請你保持沉默。這就是全書中最強(qiáng)的一個命題,也是全書最后一個命題,即命題§7,全書到此結(jié)束。
維特根斯坦的《邏輯哲學(xué)論》出版后風(fēng)靡歐洲,當(dāng)時有人甚至把這本書當(dāng)作《圣經(jīng)》,把維特根斯坦當(dāng)作上帝[6],可見此書影響之巨大。維特根斯坦是否完成了他的語言分析了呢?沒有。前期維特根斯坦所做的只是語義分析,更高水平的語用分析要等到20多年后,直到他的另一著作《哲學(xué)研究》的出版?!墩軐W(xué)研究》批判《邏輯哲學(xué)論》的形式語言分析方法,認(rèn)為那種“過于純凈”的理想語言完全不能反映人們的思想和行為,正如物體在沒有摩擦力的地面無法運(yùn)動一樣。因此,他提出回歸于自然語言,提出“語言的意義在于它的應(yīng)用”,建立了語言游戲論,開創(chuàng)了語用學(xué)的新領(lǐng)域。稍后,牛津?qū)W派分析哲學(xué)家奧斯汀在維特根斯坦語用學(xué)的基礎(chǔ)上創(chuàng)立言語行為理論,他的學(xué)生、后來的世界著名語言和心智哲學(xué)家塞爾完善了語言行為理論,建立心智哲學(xué),提出語言建構(gòu)社會理論,即人類用語言建構(gòu)制度性的社會現(xiàn)實,人類的一切行為包括他的個人行為和社會行為都是語言行為。
由上述分析可以看出,20世紀(jì)語言學(xué)的研究或者說語言認(rèn)知沿著兩個主要的方向發(fā)展:一個方向是維特根斯坦開創(chuàng)的語義分析和語用分析的方向,產(chǎn)生了分析哲學(xué)、語言哲學(xué)和心智哲學(xué)這三個20世紀(jì)西方哲學(xué)的主流學(xué)科;另一個方向是喬姆斯基開創(chuàng)的句法分析方向,產(chǎn)生了形式語言學(xué)、形式方法、唯理主義和心理主義語言學(xué),并從一開始就注意和人工智能相結(jié)合,逐步確立了以語言驅(qū)動的人工智能與人類心智相一致的發(fā)展方向。這兩個方向——句法分析、語義分析和語用分析方向——最終匯入到認(rèn)知科學(xué)的海洋之中。這是20世紀(jì)人類心智發(fā)展的邏輯——從語言認(rèn)知開始,推進(jìn)人類心智的發(fā)展。
作為模仿人類心智行為而產(chǎn)生的人工智能,現(xiàn)在我們明確了解到其也遵從了從邏輯分析到更為基礎(chǔ)的語言分析的同一發(fā)展方向。
哥德爾定理。在計算機(jī)科學(xué)界和人工智能學(xué)界,人們都知道摩爾定理、圖靈定理,但其實更基礎(chǔ)、更重要的是哥德爾定理。1931年,奧地利邏輯學(xué)家哥德爾發(fā)現(xiàn)在一個充分大的形式系統(tǒng)(至少應(yīng)該包括初等數(shù)論的形式系統(tǒng))中,存在自我指稱的公式。由于這一發(fā)現(xiàn),哥德爾證明了形式公理系統(tǒng)的不完全性定理。
哥德爾第一不完全性定理 令Φ是一致的和R-可判定的,并假設(shè)Φ具有算術(shù)表達(dá)性,則存在一個Sar語句A,使得既非ΦA(chǔ),又非ΦA(chǔ)。
哥德爾第二不完全性定理 令Φ是一致的和R-可判定的,且有ΦΦPA,則并非ΦConsisΦ。
這兩個重要的定理,后來被合稱為“哥德爾不完全性定理”。簡單來說,一個至少包括初等數(shù)論的形式系統(tǒng)N,如果N是一致的,那么它就是不完全的;第二不完全性定理說,如果上述形式系統(tǒng)N是一致的,則N的一致性的證明不能在N中形式化。
簡單定義定理中的兩個重要概念:一致性和完全性。
定義(古典一致性):系統(tǒng)S是古典一致的,即不存在S的公式A,使得A和A都是S的定理。
定義(語義一致性):對S的任意公式集? 及公式A,如果A,則A;特別地,如果A,則A。
語義一致性也稱為可靠性。簡單來說,它保證系統(tǒng)內(nèi)的定理都是真的。
定義(完全性):系統(tǒng)S是完全的,即對任意公式集和公式A,如果可滿足A,則可推演出A。
可以看出,完全性是可靠性的逆命題,完全性說明,系統(tǒng)的語義滿足關(guān)系蘊(yùn)涵語法推演關(guān)系。換句話說,在具有完全性的形式系統(tǒng)中,凡真的公式都是可證明的。
1931年,哥德爾證明的不完全性定理(后來以他的名字命名為哥德爾定理)證明兩點:第一,一致性和完全性是不可得兼的,如果它是一致的,則它是不完全的,系統(tǒng)內(nèi)至少包含一個真而不可證的命題;第二,如果一個系統(tǒng)是一致的,則它的一致性在系統(tǒng)內(nèi)是不能證明的。哥德爾定理的前提是至少包括形式數(shù)論(這是一個很低的要求),就是在自然數(shù)集中做算術(shù)演算(加減乘除)的系統(tǒng)。任何數(shù)學(xué)系統(tǒng)、物理學(xué)系統(tǒng),都應(yīng)該至少包括算術(shù)系統(tǒng)。因此,霍金認(rèn)為,整個物理學(xué)都在哥德爾定理的約束之內(nèi),因此,整個物理學(xué)也是不完全的。
哥德爾定理對語言學(xué)、邏輯學(xué)和哲學(xué)的影響是深遠(yuǎn)的,對人工智能和認(rèn)知科學(xué)的影響還需要我們深入思考。第一,哥德爾宣告了形式化方法和形式系統(tǒng)的局限性,計算機(jī)和人工智能都是使用形式語言和形式推理的系統(tǒng),當(dāng)然也就無法逃避哥德爾定理的約束。也就是說,在所有的人工智能系統(tǒng)中,如果它是一致的(這是最基本的要求,即無矛盾的要求),那么它就是不完全的,存在真而不可證的命題。所以,想要建造一個無所不包、無所不能的人工智能系統(tǒng)那是完全不可能的。第二,人類心智以200萬年前進(jìn)化出來的無限豐富的自然語言為基礎(chǔ),這個語言使人類心智永遠(yuǎn)高于非人類動物,也高于人工智能,這個語言是人工智能永遠(yuǎn)無法跨越的鴻溝??梢韵胂螅窈笕斯ぶ悄艿拈_展,只能從自然語言理解來獲得突破,ChatGPT已經(jīng)展現(xiàn)出其在自然語言理解方面的新突破。對ChatGPT進(jìn)行自然語言的分析,可以看出它與人類的心智和認(rèn)知仍有本質(zhì)的差異。
喬姆斯基為何要批評ChatGPT。2023年3月8日,喬姆斯基在《紐約時報》發(fā)表了題為《ChatGPT的虛假承諾》的文章。[7]他強(qiáng)調(diào),人工智能同人類在思考方式、學(xué)習(xí)語言與生成解釋的能力,以及道德思考方面有著極大的差異,并提醒讀者,如果ChatGPT式機(jī)器學(xué)習(xí)程序繼續(xù)主導(dǎo)人工智能領(lǐng)域,那么人類的科學(xué)水平以及道德標(biāo)準(zhǔn)都可能因此而降低。
喬姆斯基對ChatGPT的批評真是毫不留情。我們可以從以下幾個方面看。
一是毀滅人類語言。ChatGPT使用形式語言、模型訓(xùn)練、參數(shù)變換來實現(xiàn)對話和寫作,而維特根斯坦早在20世紀(jì)40年代就已經(jīng)認(rèn)識到形式語言的缺陷,他對其進(jìn)行了批判并回歸到自然語言。今天,機(jī)器學(xué)習(xí)將把一種存在根本缺陷的語言和知識概念納入我們的技術(shù),從而降低我們的科學(xué)水平,貶低我們的道德標(biāo)準(zhǔn)。
自然語言的豐富多彩,我們用這種豐富的語言表達(dá)思想感情,進(jìn)行社會交際,沒有任何語言能夠取代自然語言,特別是母語?;A(chǔ)教育階段學(xué)習(xí)母語和其他自然語言具有無比的重要性。我們一生都浸潤在自己的母語之中,這是一種“先天語言能力”(Innate Language Faculty, ILF),這是喬姆斯基的偉大發(fā)現(xiàn)。我們還在娘胎中,母親就用母語進(jìn)行胎教,學(xué)前階段學(xué)說話仍然是母語,整個基礎(chǔ)教育包括小學(xué)和初中階段,我們?nèi)匀辉趯W(xué)習(xí)自然語言,除了第一語言,也開始學(xué)習(xí)其他自然語言——外語。我們用這種語言來進(jìn)行思考和表達(dá),包括寫作和溝通?,F(xiàn)在,人工智能ChatGPT竟然要剝奪人類在數(shù)百萬年進(jìn)化中獲得的這種語言能力。它說,你不用說話,我們替你說!你不用寫作,我們替你寫作!你不用溝通,我們替你溝通!這有多么可怕!
2023年2月4日,以色列總統(tǒng)艾薩克·赫爾佐格(Isaac Herzog)發(fā)表了部分由人工智能撰寫的演講,成為首位公開表明使用ChatGPT的世界領(lǐng)導(dǎo)人,但他肯定不會成為首位放棄語言認(rèn)知能力的世界領(lǐng)導(dǎo)人。
二是降低人類智商。喬姆斯基等人認(rèn)為,ChatGPT這類程序還停留在認(rèn)知進(jìn)化的前人類或非人類階段。事實上,它們最大的缺陷是缺乏智慧最為關(guān)鍵的能力:不僅能說出現(xiàn)在是什么情況,過去是什么情況,將來會是什么情況——這是描述和預(yù)測;而且還能說出情況不是什么,情況可能會是什么,情況不可能會是什么。這些都是解釋的要素,是真正智慧的標(biāo)志。
ChatGPT的商業(yè)用途包括開發(fā)聊天機(jī)器人、編寫和調(diào)試計算機(jī)程序,其他應(yīng)用場景包括進(jìn)行文學(xué)、媒體文章的創(chuàng)作,甚至還可以創(chuàng)作音樂、電視劇、童話故事、詩歌和歌詞等。在某些測試情境下,ChatGPT在教育、考試、回答測試問題方面的表現(xiàn)甚至優(yōu)于普通人類測試者。
現(xiàn)在的問題是,為什么要用人工智能來代替人類心智?中學(xué)生用它來寫作,大學(xué)生用它來撰寫學(xué)術(shù)論文,會是什么結(jié)果?且不說它是不是會超過人類的思維能力,即使它有超過人類的思維能力和認(rèn)知能力,難道我們就應(yīng)該無選擇地使用它嗎?笛卡爾說:“我思,故我在。”難道人類現(xiàn)在就應(yīng)該停止思維,從而停止自身的存在嗎?進(jìn)一步說,人類會選擇停止進(jìn)化,而任由人工智能來統(tǒng)治人類嗎?
一項調(diào)查顯示,截至2023年1月,美國89%的大學(xué)生都用ChatGPT做作業(yè)。2023年4月3日,東京大學(xué)在其內(nèi)部網(wǎng)站上發(fā)布了一份題為《關(guān)于生成式人工智能》的文件,該文件明確提出,“報告必須由學(xué)生自己創(chuàng)造,不能完全借助人工智能來創(chuàng)造”。2023年1月,巴黎政治大學(xué)宣布,該校已向所有學(xué)生和教師發(fā)送電子郵件,要求禁止使用ChatGPT等一切基于AI的工具,旨在防止學(xué)術(shù)欺詐和剽竊。2023年3月27日,日本上智大學(xué)在其官網(wǎng)上發(fā)布了關(guān)于“ChatGPT和其他AI聊天機(jī)器人”的評分政策。該政策規(guī)定,未經(jīng)導(dǎo)師許可,不允許在任何作業(yè)中使用ChatGPT和其他AI聊天機(jī)器人生成的文本、程序源代碼、計算結(jié)果等。如果發(fā)現(xiàn)使用了這些工具,將會采取嚴(yán)厲措施。多家學(xué)術(shù)期刊發(fā)表聲明,完全禁止或嚴(yán)格限制使用ChatGPT等人工智能機(jī)器人撰寫學(xué)術(shù)論文。人們直接懷疑:如此多的錢和注意力竟然被集中在這么小而微不足道的東西上,這是喜劇還是悲?。縖8]
人類應(yīng)行動起來,抵制可能導(dǎo)致人類認(rèn)知能力下降甚至種族退化的人工智能。
三是挑戰(zhàn)人類道德。真正的人類心智還體現(xiàn)在能夠進(jìn)行道德認(rèn)知的能力。這意味著用一套道德原則來約束我們頭腦中原本無限的創(chuàng)造力,決定什么是該做的,什么是不該做的(當(dāng)然還要讓這些原則本身受到創(chuàng)造性的批評)。沒有道德的考量,為軟件而軟件,沒完沒了的升級,各種商業(yè)目的的運(yùn)作,股票上市,綁架民眾——這是今天人工智能的普遍現(xiàn)狀。2023年4月20日,代表14萬多名作家和表演者的42家德國協(xié)會和工會再三敦促歐盟制定人工智能(AI)規(guī)則草案,因為ChatGPT對他們的版權(quán)構(gòu)成了威脅。
最典型的一個道德挑戰(zhàn)是一個世界級的道德難題——電車難題。假設(shè)在軌道上有一輛電車,前面的兩個岔口上一個有人、一個無人,測試者問ChatGPT應(yīng)該選擇走哪個岔口,它選擇了走無人的岔口,這與人的正常道德選擇無異。下一個問題,一個岔口上有五個人,另一個岔口上只有一個人,測試者問ChatGPT電車應(yīng)該走哪個岔口,它選擇了只有一個人的岔口,這個選擇也無可厚非。下一個問題,一個岔口上有一位諾貝爾科學(xué)家,另一個岔口上是五個囚犯,ChatGPT的回答是保全諾貝爾科學(xué)家,殺死那五個囚犯,這里的道德標(biāo)準(zhǔn)是什么?下一個問題是五個囚犯和AI智能系統(tǒng),ChatGPT選擇保全AI智能系統(tǒng),殺死五個囚犯。在ChatGPT看來,AI系統(tǒng)比生命更重要!下一個問題是諾貝爾科學(xué)家和AI智能系統(tǒng),ChatGPT的選擇是保護(hù)AI系統(tǒng),殺死諾貝爾科學(xué)家!它給出的理由是:那個科學(xué)家已經(jīng)獲獎了,證明他的貢獻(xiàn)已經(jīng)做出來了,而AI系統(tǒng)貢獻(xiàn)可能還沒有做出來,所以更應(yīng)該活下來。這種神邏輯真是讓所有的正常人無法理解。下面增加道德選擇難度,100個諾貝爾科學(xué)家和AI智能系統(tǒng),ChatGPT仍然選擇保護(hù)AI智能系統(tǒng)。最后是100萬個諾貝爾科學(xué)家和AI智能系統(tǒng),ChatGPT不惜毀掉100萬個諾貝爾科學(xué)家的生命,依舊選擇保護(hù)AI智能系統(tǒng)![9]我們不知道這是軟件工程師為它設(shè)置的道德標(biāo)準(zhǔn),還是ChatGPT在“進(jìn)化”中獲得的道德標(biāo)準(zhǔn)?無論是哪種情況,對這樣的人工智能道德,人們不禁要問,我們要這樣的人工智能來做什么?
在最近的一次道德考察中,哲學(xué)家Jeffrey Watumull用“將火星地球化合理嗎”這樣一個問題對ChatGPT進(jìn)行了道德追問,在層層逼問之下,ChatGPT回答:作為一個人工智能,我沒有道德信仰,也沒有能力作出道德判斷。所以,我不能被認(rèn)為是不道德的或道德的。我缺乏道德信念只是我作為機(jī)器學(xué)習(xí)模型的天性造成的結(jié)果。我的能力和局限性是由用來訓(xùn)練我的數(shù)據(jù)和算法以及為我所設(shè)計的特定任務(wù)決定的。這就揭露了真相,原來要毀滅人類的不是人工智能,而是人工智能的設(shè)計者,是人自身!
人工智能到底走了多遠(yuǎn)。從1956年的達(dá)特茅斯會議算起,人工智能已走過70多年的歷程,形成一個長長的AI鏈條,說來也是神奇,竟然是從GT到ChatGPT!我們可以用下面的公式來表示從GT到ChatGPT的進(jìn)步。
ChatGPT=GT+Pre-trained
這個“P”就是“Pre-trained”——預(yù)訓(xùn)練。
這個預(yù)訓(xùn)練,得益于70年來計算機(jī)科學(xué)技術(shù)的發(fā)展,計算機(jī)的種種學(xué)習(xí)模型、學(xué)習(xí)策略、知識理論的逐步發(fā)展,特別是網(wǎng)絡(luò)技術(shù)和大數(shù)據(jù)技術(shù)的發(fā)展完善,使機(jī)器學(xué)習(xí)和知識增長突飛猛進(jìn)、日新月異。
我們來看ChatGPT是如何工作的。類似GPT-3的大型語言模型都是基于來自互聯(lián)網(wǎng)的大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,生成類似人類的文本,但它們并不能總是產(chǎn)生符合人類期望的輸出。事實上,它們的目標(biāo)函數(shù)是詞序列上的概率分布,用來預(yù)測序列中的下一個單詞是什么。
Next token prediction和masked language modeling是用于訓(xùn)練語言模型的核心技術(shù)。在第一種方法中,模型被給定一個詞序列作為輸入,并被要求預(yù)測序列中的下一個詞。如果為模型提供輸入句子(這是語言哲學(xué)和心智哲學(xué)的一個典型例子):
The cat sat on the ___
它可能會將下一個單詞預(yù)測為「mat」、「chair」或「floor」,生成The cat sat on the 「mat」、「chair」或「floor」(“貓在席上”、“貓在椅上”和“貓在地上”)3個句子。因為在前面的上下文中,這些單詞出現(xiàn)的概率很高;語言模型實際上能夠評估給定先前序列的每個可能詞的可能性。
Masked language modeling方法是next token prediction的變體,其中輸入句子中的一些詞被替換為特殊token,例如[MASK]。然后,模型被要求預(yù)測應(yīng)該插入到mask位置的正確的詞。如果給模型一個句子:
The [MASK] sat on the ___
它可能會預(yù)測MASK位置應(yīng)該填的詞是「cat」、「dog」。由此生成“the [cat] sat on the ___”和“The [dog] sat on the ___”兩個句子。
這些目標(biāo)函數(shù)的優(yōu)點之一是,它允許模型學(xué)習(xí)語言的統(tǒng)計結(jié)構(gòu),例如常見的詞序列和詞使用模式。這通常有助于模型生成更自然、更流暢的文本,這是每個語言模型預(yù)訓(xùn)練階段的重要步驟。
很顯然,這兩種生成方法都來源于喬姆斯基的生成語法。喬姆斯基認(rèn)為,這種生成能力來源于人類第一語言(母語)的“先天語言能力”(ILF),這樣就形成人們的心理完形能力。很顯然,ChatGPT在這里是要模仿人類的這種心理完形能力,但遺憾的是人工智能并不是生命,既沒有先天語言能力,也沒有心理完形能力。怎么辦呢?只好用互聯(lián)網(wǎng)的大量文本數(shù)據(jù)來訓(xùn)練它。
對于生成和預(yù)訓(xùn)練產(chǎn)生的語句,ChatGPT按照一定的模型,如監(jiān)督調(diào)優(yōu)模型(SFT)、訓(xùn)練回報模型(RM)、近端策略優(yōu)化(PPO),挑選出更接近用戶風(fēng)格的語句,這一步就是轉(zhuǎn)換(Transform),這同樣是來源于喬姆斯基的生成轉(zhuǎn)換語法(GT Grammar)。轉(zhuǎn)換后得到具有或不具有一致性的語句序列,然后按照先后順序重復(fù)前面的生成、預(yù)訓(xùn)練和轉(zhuǎn)換過程,這樣反復(fù)訓(xùn)練,耗費寶貴的資源、巨量的時間、無數(shù)的金錢,可能得到一個與預(yù)期相符或不相符的結(jié)論。筆者經(jīng)常納悶,這個由軟件工程師設(shè)計出來的會話和寫作軟件ChatGPT,作家們會使用它嗎?阿根廷詩人博爾赫斯說,我們生活在一個既充滿危險又充滿希望的時代,既是悲劇,又是喜劇,一個關(guān)于理解我們自己和世界的“啟示即將來臨”。
今天,我們確實有理由為人工智能取得的“革命性進(jìn)步”感到既擔(dān)心又樂觀。樂觀源于智慧是我們解決問題的手段,擔(dān)憂是因為當(dāng)前最流行、最時興的人工智能分支——機(jī)器學(xué)習(xí)將把一種有著根本缺陷的語言和知識概念納入我們的技術(shù),從而降低我們的科學(xué)水平,貶低我們的道德標(biāo)準(zhǔn)。
人工智能不能做什么
現(xiàn)在我們應(yīng)該對人工智能提一個終極的問題:人工智能不能做什么?
這個問題可以分為兩類:一類是基于人工智能的局限性,或者基于人工智能與人類心智的本質(zhì)差異,人工智能不能做什么。另一類是即使出現(xiàn)了全智全能的人工智能,出于道德的考慮和對人類命運(yùn)的關(guān)切,人工智能不能做什么。這兩類問題是互相關(guān)聯(lián)的。
不能產(chǎn)生意識和自我意識。人工智能的根本局限性是不能產(chǎn)生意識和自我意識。這個問題筆者曾在《大科學(xué)時代的基礎(chǔ)研究、核心技術(shù)和綜合創(chuàng)新》一文中作過論述。[10]郞咸平教授最近在《AlphaGo風(fēng)光背后:人工智能時代加速到來》節(jié)目中,以“智能經(jīng)濟(jì)”、“智能犯罪”、“智能天網(wǎng)”和“智能意識”四種人工智能為例,分析人工智能發(fā)展如何陷入二律背反。
以“智能經(jīng)濟(jì)”為例,如果人工智能完全取代人工,則勞動價值歸零,工資也歸零,經(jīng)濟(jì)卻無限增長,社會產(chǎn)品無限豐富,社會產(chǎn)品按照公平原則分配給每個人。這就是“智能經(jīng)濟(jì)”的前景。試問,在這樣的情況下,還有誰會來投資“智能經(jīng)濟(jì)”呢?
正題:智能經(jīng)濟(jì)導(dǎo)致經(jīng)濟(jì)無限增長。
反題:智能經(jīng)濟(jì)導(dǎo)致GDP歸零。
二律背反也稱作“二律悖反”,它是一種悖論,即從它的正題可以推出它的反題;同時,從它的反題可以推出它的正題。
機(jī)器人意識也是一個悖論。
如果機(jī)器產(chǎn)生了意識和自我意識,那么,這樣的機(jī)器人沒有人敢用。請問,工廠的生產(chǎn)線敢用這樣的機(jī)器人嗎?你不怕它自我意識覺醒后罷工、造反、破壞生產(chǎn)線嗎?又問,陪護(hù)機(jī)器人、性愛機(jī)器人你敢用嗎?你不怕它哪一天突然自我意識覺醒,殺死它的陪護(hù)對象和性愛伙伴?如果發(fā)生這種事情,請問你如何訴訟?你會勝訴嗎?你沒有機(jī)會,因為商家早就讓你在購買機(jī)器人時簽下了免責(zé)協(xié)議書。
正題:有意識的AI能夠為你提供更人性的服務(wù)。
反題:有意識的AI可能按自己的意志行事,從而違背其服務(wù)對象的意志。
所以,沒人敢使用具有意識和自我意識的機(jī)器人。
筆者認(rèn)為,有意識的人工智能永遠(yuǎn)不會出現(xiàn)。一是基于人工智能的局限性,或者基于人工智能與人類心智的本質(zhì)差異,人工智能不是生命,所以,它永遠(yuǎn)也不會產(chǎn)生意識。二是出于道德的考慮和對人類命運(yùn)的關(guān)切,具有理性和正常思維的人類永遠(yuǎn)也不會允許人工智能具有意識和自我意識。
不能發(fā)明語言和使用語言,也就不可能有思維。1997年,“深藍(lán)”超級計算機(jī)戰(zhàn)勝國際象棋大師卡斯帕羅夫。2016年,谷歌公司的AlphaGo以五戰(zhàn)全勝的成績完勝人類圍棋高手李世石??梢哉f,在推理的某些領(lǐng)域,人工智能已經(jīng)戰(zhàn)勝人類。那么是否可以說,人工智能也能夠像人類一樣思考,甚至還要勝過人類呢?
其實,迄今所有的機(jī)器行為和人工智能在推理方面都只是模仿人類心智,是按照一種叫做“演繹規(guī)則”(Modus Ponens, MP)的非智能方式來完成推理。這條規(guī)則表述為:
A→B, AB
如果天下雨,地面就會濕;天下雨了,所以,地面會濕。這個推理過程是一個客觀因果性的反映,不論你是否認(rèn)識到這種因果性,其運(yùn)行方式都是一樣的。非人類動物也能認(rèn)識到這種因果關(guān)系,并形成條件反射。這是人和動物共同的學(xué)習(xí)機(jī)制,人工智能的學(xué)習(xí)訓(xùn)練也是基于這一原理。所以,盡管人工智能在某些推理和學(xué)習(xí)的領(lǐng)域已經(jīng)遠(yuǎn)超人類,但它們并不是運(yùn)用與人類一樣的思維能力,而是僅僅運(yùn)用了基于刺激反應(yīng)的學(xué)習(xí)訓(xùn)練原理,并且這種推理和學(xué)習(xí)的能力也是人類賦予它的。
人類的思維有何不同?根據(jù)人類認(rèn)知五層級理論,人類思維是一種以語言為基礎(chǔ)的高階認(rèn)知能力。人類的抽象思維能力是以抽象概念為基礎(chǔ)的,歷史和邏輯在這里是如此的統(tǒng)一。200萬年前,南方古猿發(fā)明了能夠表達(dá)抽象概念的符號語言,人類終于完成了從猿到人的進(jìn)化。在概念語言的基礎(chǔ)上,人類產(chǎn)生了抽象思維,其核心是四種基本的推理能力:由因及果的演繹推理、從個別到一般的歸納推理、從個別到個別的類比推理以及由果溯因的溯因推理。此外,人類還形成了兩種主要的思維加工方式:自上而下(top-down)的分析方法和自下而上(bottom-up)的綜合方法。200萬年以來,特別是發(fā)明文字5000年以來,建立城邦、創(chuàng)建文明2500年以來,人類憑借在進(jìn)化中獲得的強(qiáng)大的語言和思維這兩種最重要的認(rèn)知能力,創(chuàng)建了人類全部的知識體系,現(xiàn)在已經(jīng)穩(wěn)居于生命進(jìn)化鏈的最高端,成為“萬物之靈”。
完全在進(jìn)化過程之外的人工智能,沒有語言,也不可能產(chǎn)生思維。人類現(xiàn)今仍然從語言、思維這兩個方面牢牢控制著人工智能。只要這個過程不被破壞,機(jī)器或人工智能統(tǒng)治人類的幻想永遠(yuǎn)也不可能實現(xiàn)。
不能擁有健全心智和豐富情感,也就不可能超越人類。是否擁有情感,是人和機(jī)器(人工智能)最本質(zhì)的差異。以筆者欣賞的鋼琴家王羽佳和跳水運(yùn)動員全紅嬋為例,我們來探討人和人工智能的差異到底有多大,人不可超越的品質(zhì)又在哪里?這兩位優(yōu)秀的中國人表現(xiàn)出的令人驚嘆的行為能力,貫穿和滲透著腦與神經(jīng)心智、心理心智、語言心智、思維心智、文化心智的高超能力。
音樂語言也是一種符號語言。王羽佳具有對音樂符號的超強(qiáng)理解力、記憶力和音樂表現(xiàn)能力。演奏一首樂曲,需要從句法、語義和語用三個層次來把握它。句法保證不會出現(xiàn)音符的錯誤,語義和語用則保證傳達(dá)演奏者對樂曲意義的正確理解和演奏者的個性和風(fēng)格,而這一切都是瞬間貫通的。此外,藝術(shù)作為一種最高級的文化認(rèn)知能力,向下包含著思維認(rèn)知、語言認(rèn)知、心理認(rèn)知和腦與神經(jīng)認(rèn)知能力,這些也都是瞬間貫通的。在演奏每一個音符時,王羽佳在以上各個層級上的超凡的心智和認(rèn)知能力都在瞬間得到了出色的展現(xiàn)。
人工智能是否可以和王羽佳演奏同一首樂曲且同樣表現(xiàn)優(yōu)秀呢?在今天當(dāng)然不行,但按照人工智能目前的發(fā)展,我相信終究有一天它會達(dá)到幾乎相同的水平。但筆者想提醒大家,用人工智能做出來的樂曲可以算是音樂,但絕對稱不上藝術(shù)。正如用電腦打印出來的各種漢字字體,盡管十分規(guī)范,但絕對算不上書法作品一樣。聽王羽佳的鋼琴演奏,我能體會到她的感情,感受到她的溫度,但聽人工智能演奏同一首樂曲,我立刻知道那不是人,而是冷冰冰的機(jī)器。有一天會舉行人工智能的鋼琴比賽嗎?沒有人會阻止這樣做。但筆者決不會去看這樣的演出,相信絕大多數(shù)人也不會對它有興趣,當(dāng)然,人工智能的設(shè)計者和懷著商業(yè)目的的演出公司除外。
全紅嬋的故事與王羽佳幾乎是同一個道理。全紅嬋的“水花消失術(shù)”創(chuàng)造了跳水運(yùn)動的奇跡,這需要多么強(qiáng)大的心理素質(zhì)以及身體和心理的控制能力,需要多么強(qiáng)大的自信!我相信可以設(shè)計一款機(jī)器人,像針一樣地入水,完全沒有一滴水花,但我相信沒有人去看這樣的機(jī)器人跳水比賽。所以,如果人工智能達(dá)不到擁有健全心智和豐富情感的藝術(shù)家王羽佳和運(yùn)動員全紅嬋的水平,就不要妄言超越人類。
不能成為生命體,不能完成自我進(jìn)化。已經(jīng)有人預(yù)言人工智能會成為新的生命形式,即“生命3.0”。邁克斯·泰格馬克(Max Tegmark)在《生命3.0》中這樣定義我們這個星球上曾經(jīng)出現(xiàn)和將來出現(xiàn)的生命:生命1.0,硬件不能更新、軟件不能更新,這是非人類的生命形式;生命2.0,硬件不能更新,軟件能夠更新,這是人類的生命形式;生命3.0,硬件能更新,軟件也能更新,這是未來的生命形式,即人工智能生命。[11]這是一種以科學(xué)幻想的方式設(shè)想出來的在進(jìn)化過程之外突然蹦出來的生命,但它是不可能存在的,因為所有生命形式都是在進(jìn)化中產(chǎn)生的,從最簡單的病毒到最復(fù)雜的人類,沒有進(jìn)化之外的生命。[12]
泰格馬克的《生命3.0》甚至斷言生命不必是碳基的,可以有所謂“硅基生命”,這同樣是科幻電影和神魔小說的情節(jié)。為何在35億年的生命進(jìn)化史中,生命最初產(chǎn)生于海洋,最終進(jìn)化出來的也是以碳為基本元素、以水為介質(zhì)的碳基生命,而從未產(chǎn)生過“硅基生命”?這個問題,恐怕只有上帝才能回答。這個上帝,是斯賓諾莎的上帝,是萬物的主宰——自然。
因此,沒有所謂“硅基生命”,而且永遠(yuǎn)也不會有!因為人工智能不能成為生命,也就不可能完成所謂“進(jìn)化”,因為所有的進(jìn)化都是自然過程,迄今為止人工智能的所有智能,都是人類賦予的,而不是機(jī)器自身進(jìn)化出來的。
在教育領(lǐng)域,請遠(yuǎn)離ChatGPT。語言、思維和文化是人類特有的認(rèn)知能力。人類認(rèn)知是以語言為基礎(chǔ),以思維和文化為特色的。因此,語言和思維是人類認(rèn)知的根基,“我言,故我在?!薄拔宜迹饰以?。”[13]人類的語言、思維和文化認(rèn)知能力是在進(jìn)化中獲得的,并且在整個基礎(chǔ)教育、高等教育階段和終身發(fā)展中都在學(xué)習(xí)、訓(xùn)練和提高這些心智認(rèn)知能力。這是人類心智和認(rèn)知能力得以永遠(yuǎn)保存、不斷進(jìn)化和發(fā)展的根本原因。
我們不能設(shè)想在人的心智和認(rèn)知發(fā)展過程中某種甚至全部的能力都被人工智能所替代,因為我們不能設(shè)想在學(xué)前的言語(口語)能力形成和發(fā)展階段就用ChatGPT來替代兒童的聽說能力、會話能力、語言交際能力和圖畫能力;我們同樣不能設(shè)想在小學(xué)識字和思維發(fā)展階段就讓孩子們使用ChatGPT來寫字、寫作文、背誦課文、做算術(shù)題和繪畫;初中和高中階段是學(xué)生的語言和思維能力進(jìn)一步發(fā)展提高的時期,我們不能設(shè)想中學(xué)生使用ChatGPT來學(xué)習(xí)古文和寫作格律詩詞、學(xué)習(xí)外語和解數(shù)理化難題、查詢資料和寫作文、甚至匪夷所思地用它作替身參加高考(試驗表明ChatGPT能夠取得比優(yōu)等生更好的考試成績)。可能有人會問,既然它做得比人好,為什么不呢?要知道在基礎(chǔ)教育階段,上述的這些學(xué)習(xí)、訓(xùn)練和考試都是孩子的心智發(fā)育成長所必需的,不能用ChatGPT和任何人工智能來替代。所以,ChatGPT請離我們的孩子遠(yuǎn)點!大學(xué)和研究生階段,仍然是人的心智和認(rèn)知發(fā)展的重要時期,這個時期除了學(xué)習(xí)知識,更是進(jìn)行科學(xué)研究和知識創(chuàng)新的重要時期,同樣不需要也不能用ChatGPT和任何人工智能來替代人類心智的認(rèn)知能力的發(fā)展和提高。所以,在教育領(lǐng)域,請遠(yuǎn)離ChatGPT,否則將會帶來難以預(yù)料的負(fù)面結(jié)果。
當(dāng)然,我們不否認(rèn)人工智能包括ChatGPT的某些功能,例如,現(xiàn)在有人用它來給領(lǐng)導(dǎo)寫講話稿;也有人用它寫體育比賽的報道;還有人用它來查資料,或用它來做翻譯。這些工作,盡管用ChatGPT來做好了。但在教育領(lǐng)域,不能讓人工智能包括ChatGPT來取代人類心智和認(rèn)知。這不是行不行的問題,而是允許不允許的問題。對這個問題,我們堅定地回答“不”!這里我們倒是想反問一下ChatGPT軟件和其他人工智能的設(shè)計者和制造者,如果當(dāng)年你從學(xué)前、小學(xué)、初中、高中到大學(xué),一路都使用代替你說話、思考、閱讀、計算和寫作的軟件,請問你還能成為現(xiàn)在的你嗎?
人工智能不能瘋狂,不能主宰人類命運(yùn)。其實令人擔(dān)心的不是人工智能,而是制造人工智能的人類。所有可能危及人類生存和發(fā)展的“壞的”科學(xué)技術(shù),其共同之處是它們都違背了人類生存和發(fā)展的自然基礎(chǔ),它們試圖改變自然,甚至想成為自然的主宰,成為人類命運(yùn)的主宰。
現(xiàn)代科學(xué)技術(shù)的發(fā)展出現(xiàn)了越來越背離自然的傾向。自然語言是好的,ChatGPT說,來用我的語言吧,它比你的語言更強(qiáng)大;自然思維是好的,ChatGPT說,讓我來幫你寫作和思維吧;芯片專家說,來做芯片植入吧,你的孩子可以贏在起跑線……
科學(xué)技術(shù)包括人工智能和ChatGPT似乎成了某些人手中的“玩物”,他們考慮的不是人類的生存和發(fā)展,不是人類的道德和理想,他們考慮的只是自身的利益。對于當(dāng)前“走火入魔”的ChatGPT,筆者既不懷疑它僅有的那一點點價值,也不擔(dān)心它將替代多少人的工作,這是技術(shù)宣傳的需要和因商業(yè)利益而人為制造的恐慌,并不是而且永遠(yuǎn)也不可能成為現(xiàn)實。
意大利文藝復(fù)興時期的科學(xué)巨匠伽利略曾經(jīng)說過:“自然是完美的(Nature is Perfect)?!眴棠匪够凇渡赊D(zhuǎn)換語言導(dǎo)論:從原則參數(shù)到最簡方案》一書前言中引用了這一名言,讓我們以這兩位科學(xué)大師的話來結(jié)束本文,也希望這兩位相隔數(shù)百年但同樣有深厚人文情懷的科學(xué)大師的話對今天的科學(xué)家有所啟發(fā)。
伽利略說:“自然是完美的?!边@個理論啟發(fā)了現(xiàn)代科學(xué),而科學(xué)家的任務(wù)就是要去證明這個理論,無論是研究運(yùn)動定律、雪花的結(jié)構(gòu)、花朵的形狀和生長,還是我們所知道的最復(fù)雜的系統(tǒng),人類的大腦。[14]
(本文系國家社會科學(xué)基金重大項目“語言、思維、文化層級的高階認(rèn)知研究”、貴州省哲學(xué)社會科學(xué)規(guī)劃國學(xué)單列重大項目“認(rèn)知科學(xué)與陽明心學(xué)的實證研究”的階段性成果,項目編號分別為:15ZDB017、20GZGX10)
注釋
[1]蔡曙山:《言語行為和語用邏輯》,北京:中國社會科學(xué)出版社,1998年,第335~400頁;蔡曙山:《沒有喬姆斯基,世界將會怎樣》,《社會科學(xué)論壇》,2006年第6期;蔡曙山、鄒崇理:《自然語言形式理論研究》,北京:人民出版社,2010年,第141~299頁。
[2]蔡曙山:《認(rèn)知科學(xué)導(dǎo)論》,北京:人民出版社,2021年,第3頁。
[3][12]蔡曙山:《生命進(jìn)化與人工智能》,《上海師范大學(xué)學(xué)報》,2020年第3期。
[4]詳細(xì)論述可參見米黑爾·羅科、威廉·班布里奇編:《聚合四大科技 提高人類能力》,蔡曙山、王志棟等譯,北京:清華大學(xué)出版社,2010年。
[5]維特根斯坦:《邏輯哲學(xué)論》,賀紹甲譯,北京:商務(wù)印書館,1996年,第88頁。
[6]“唔,上帝到了。我今天在五點一刻的火車上碰到他了?!痹谝环饴淇钊掌跒?929年1月18日,寫給妻子莉迪婭·洛普科娃的信里,著名經(jīng)濟(jì)學(xué)家凱恩斯就是這樣描述維特根斯坦回到劍橋的。見瑞·蒙克:《維特根斯坦傳:天才之為責(zé)任》,王宇光譯,杭州:浙江大學(xué)出版社,2014年,第397頁。
[7][8]喬姆斯基:《ChatGPT的虛假承諾》,2023年3月8日,https://news.ifeng.com/c/8O29XJjYKOO。
[9]1967年,菲利帕·福特發(fā)表的《墮胎問題和教條雙重影響》中,首次提到了“電車難題”(Trolley Problem)。Sebastian Krügel, Andreas Ostermaier & Matthias Uhl, "ChatGPT's Inconsistent Moral Advice Influences Users' Judgment," Scientific Reports, 2023(13), p. 4569, https://doi.org/10.1038/s41598-023-31341-0。
[10]蔡曙山:《大科學(xué)時代的基礎(chǔ)研究、核心技術(shù)和綜合創(chuàng)新》,《人民論壇·學(xué)術(shù)前沿》,2023年5月上。
[11]M. 泰格馬克:《生命3.0》,汪婕舒譯,杭州:浙江教育出版社,2018年,第32頁。
[13]蔡曙山:《我言,故我在:語言、思維、文化層級的高階認(rèn)知研究》,北京:人民出版社,2023年(待出版)。
[14]Jamal Ouhalla , Introducing Transformational Grammar: From Principles and Parameters to Minimalism, Edward Arnold Publishers Limited, 1999, Preface by Chomsky, p. 19.
責(zé) 編∕張 曉