龐鋼明 王聃鋒
山姆·奧特曼(左二)正從日常職責(zé)中抽身出來專注于“OpenAl”的研發(fā),這是一家他與特斯拉創(chuàng)始人埃隆·馬斯克(左一)共同創(chuàng)辦的非營利性人工智能研究組織。
截止到2023年1月,ChatGPT月活躍用戶數(shù)量迅速飆升至1億,平均每天約有1300萬用戶訪問ChatGPT網(wǎng)站。目前用戶數(shù)量仍在持續(xù)增長,ChatGPT成為互聯(lián)網(wǎng)歷史上用戶數(shù)量增長最快的應(yīng)用?!癘penAI公司”總部位于舊金山,最早由特斯拉的馬斯克等投資者在2015年共同創(chuàng)立,公司建立的目標(biāo)是“開發(fā)造福全人類的人工智能工具”,目前由微軟持股。
ChatGPT脫胎于2018首次發(fā)布的生成式預(yù)訓(xùn)練轉(zhuǎn)換模型(即Generative Pre-training Transformer項(xiàng)目,縮寫為GPT)。先后經(jīng)歷過GPT-2(2019年),GPT-3(2020年)多次的技術(shù)迭代,而GPT-4預(yù)計(jì)將于2023年年底發(fā)布,現(xiàn)有的ChatGPT則是基于現(xiàn)階段最新版本的GPT-3.5研發(fā)的。
手機(jī)版“Chat Bot”正在與使用者聊天。
目前“OpenAI公司”并未公開ChatGPT的技術(shù)細(xì)節(jié)。但從過往公開發(fā)表的文獻(xiàn)推測,其主要使用了“強(qiáng)化學(xué)習(xí)”的AI技術(shù):首先搜集、整理、構(gòu)建超大規(guī)模的樣本數(shù)據(jù)集,包含公開網(wǎng)頁、書籍、報(bào)紙等文本資料。工程師用樣本數(shù)據(jù)來“喂養(yǎng)”一個(gè)處在“嬰兒期”的AI模型,得到預(yù)訓(xùn)練的AI模型,類似于“孩童期”。工程師隨后對它進(jìn)行強(qiáng)化訓(xùn)練——由人類親自對它生成的答案進(jìn)行打分,打分高則“獎(jiǎng)勵(lì)”它,打分低則“懲罰”它。通過不斷的訓(xùn)練學(xué)習(xí),它的表現(xiàn)越來越接近人類。值得一提的是,這個(gè)打分的過程需要耗費(fèi)大量的人力,為此OpenAI雇傭了大量的廉價(jià)肯尼亞工人,時(shí)薪低至2美元,這也遭到了眾多媒體的抨擊。
但不難看出,ChatGPT在底層技術(shù)原理上并沒有根本性的突破,更多地體現(xiàn)在“超大規(guī)模取勝”上。這也意味著它需要超大規(guī)模的算力、人力、電力資源的支撐。早在2020年5月發(fā)布的GPT-3算法模型的參數(shù)量就達(dá)到了驚人的1750億條,訓(xùn)練迭代一次的資金成本高達(dá)1000萬美元。相比之下,谷歌開發(fā)的圍棋對弈算法“AlphaGO”從零“學(xué)會”下棋,就經(jīng)歷了成千上萬次訓(xùn)練的迭代,但因?yàn)槌笠?guī)模的ChatGPT“學(xué)習(xí)”的成本過于高昂,所以即便在訓(xùn)練時(shí)發(fā)現(xiàn)了它的某個(gè)錯(cuò)誤,工程師也不會就這一個(gè)錯(cuò)誤去重新訓(xùn)練它。從規(guī)模到做法以及迭代費(fèi)用上,ChatGPT真的堪稱“前無古人”。
ChatGPT幾乎是一位全能的“助手”,使用它也非常簡單,輸入一個(gè)問題,它就能根據(jù)你的要求給出答案。用戶既可以和它進(jìn)行簡單日常對話:你今天的心情如何?也可以常識問答:中秋節(jié)是哪一天?或者知識問答:牛頓第二定律涵義是什么?文本改寫:給出一段徐志摩的詩歌,把它改寫成“歡樂”風(fēng)格的文體,等等。除此之外,它還能根據(jù)上下文意思,進(jìn)行閱讀理解、邏輯推理、糾錯(cuò)改正等。無論是工程、科學(xué)、商業(yè)、歷史等專業(yè)領(lǐng)域的問題,還是體育、文學(xué)、文化、藝術(shù)等貼近日常生活的問題,ChatGPT都能給出非常準(zhǔn)確和引人入勝的回答,而且生成的回答中語法和句法錯(cuò)誤很少,書面結(jié)構(gòu)邏輯清晰,甚至ChatGPT能夠承認(rèn)自己回答的錯(cuò)誤,指出用戶提問中的細(xì)微錯(cuò)誤,對話能力超乎大眾“心理預(yù)期”。具體而言它可以成為人類的寫作、編程等工作的“全能”小助手。
2023年2月以色列總統(tǒng)艾薩克·赫爾佐格在一個(gè)網(wǎng)絡(luò)安全會議上致辭時(shí)便使用了ChatGPT創(chuàng)作的部分演講稿。他演講稿中的一句“警言”——“讓我們不要忘記,是我們的人性讓我們真正與眾不同?!闭窃醋运駽hatGPT提出問題的回答——“寫一段關(guān)于人類在超人類科技世界中所扮演角色的勵(lì)志名言”。
ChatGPT能夠以B級成績通過美國賓夕法尼亞大學(xué)沃頓商學(xué)院MBA的期末考試,以C+成績通過明尼蘇達(dá)大學(xué)四門課程的研究生考試,甚至通過了美國執(zhí)業(yè)醫(yī)師資格考試。根據(jù)沃頓商學(xué)院一項(xiàng)針對4497名學(xué)生的匿名調(diào)查,約有17%的學(xué)生承認(rèn)他們使用了ChatGPT來輔助完成作業(yè),5%的學(xué)生則承認(rèn)他們直接使用了ChatGPT生成的回答。北密歇根大學(xué)的哲學(xué)教授安東尼,在為自己任教的一門世界宗教課程的學(xué)生論文評分時(shí),發(fā)現(xiàn)里面得分最高的居然是由ChatGPT創(chuàng)作的。盡管少部分教授認(rèn)為將ChatGPT融入到教學(xué)中能夠相得益彰,但更多的老師認(rèn)為這與“抄襲”無異。在老師們看來,學(xué)生無需思考便能得出研究結(jié)果,會扼殺學(xué)生的創(chuàng)造力、想象力等。許多美國中小學(xué)校與高校都禁止學(xué)生使用ChatGPT完成作業(yè),一些學(xué)校甚至取消了課后作業(yè),改為隨堂測試、手寫作業(yè)或者口試等方式。華盛頓大學(xué)等高校也開始著手修訂關(guān)于學(xué)術(shù)誠信的新政策,將“使用生成式AI”定義為“剽竊”。
由哈佛醫(yī)學(xué)院作為共同完成單位發(fā)表的一篇論文《ChatGPT在人工智能輔助醫(yī)學(xué)教育上的應(yīng)用潛力》,則首次將ChatGPT作為了共同署名的作者之一,并聲明ChatGPT對該論文的寫作做出了貢獻(xiàn)。但ChatGPT“創(chuàng)作”生成的文章并非總是“盡如人意”,存在觀點(diǎn)不可信、事實(shí)性錯(cuò)誤、數(shù)據(jù)錯(cuò)誤、數(shù)據(jù)來源不合規(guī)、版權(quán)糾紛等問題,甚至?xí)耙槐菊?jīng)地胡說八道”?!蹲匀弧贰犊茖W(xué)》等頂級學(xué)術(shù)期刊認(rèn)為AI無法對其生成的文章負(fù)責(zé),要求作者不能使用AI生成論文,也不允許將ChatGPT列為署名作者。國際機(jī)器學(xué)習(xí)會議也要求論文中不能包含由類似ChatGPT工具生成的文字。國內(nèi)《暨南學(xué)報(bào)(哲學(xué)社會科學(xué)版)》也聲明隱瞞ChatGPT使用情況將被退稿或撤稿。
ChatGPT也可與用戶結(jié)對編程,結(jié)對編程是指兩個(gè)程序員在一個(gè)計(jì)算機(jī)上共同工作,一個(gè)人輸入代碼,而另一個(gè)人審查他輸入的每一行代碼,這是一種商業(yè)軟件公司推崇的軟件開發(fā)的高效方式。而ChatGPT既能扮演“駕駛員”角色,生成用戶需求的代碼,也能與用戶互換角色,扮演“觀察員”角色,審查用戶提交的代碼是否存在錯(cuò)誤等。向ChatGPT輸入“用Python語言(一種編程語言)生成俄羅斯方塊游戲代碼”,它便可使用Pyhton編程語言生成完整的俄羅斯方塊游戲源代碼。用戶運(yùn)行游戲代碼后若出現(xiàn)錯(cuò)誤,可將錯(cuò)誤信息再次“反饋”給ChatGPT,ChatGPT會提示用戶需修正哪些代碼片段。但要知道的是,這里的錯(cuò)誤既可能是因?yàn)橛脩糗浻布吞柌町悘亩霈F(xiàn)錯(cuò)誤,也可能是ChatGPT生成的代碼本身就帶有錯(cuò)誤。
一些技術(shù)能力較低的黑客也正在利用該功能生成惡意代碼等黑客軟件。以色列的信息安全研究機(jī)構(gòu)“Check Point”發(fā)布的研究報(bào)告表明,他們在暗網(wǎng)中發(fā)現(xiàn)了大量利用ChatGPT工具生成的黑客軟件工具,“菜鳥黑客”在ChatGPT的幫助下也能輕易掌握原本技術(shù)門檻較高的網(wǎng)絡(luò)攻擊、網(wǎng)絡(luò)竊密等黑客技術(shù)。但ChatGPT對于算法構(gòu)架設(shè)計(jì)等技術(shù)難度較高的問題就表現(xiàn)得“力不從心”了,生成的代碼也并不完美??偠灾珻hatGPT現(xiàn)階段擅長針對計(jì)算機(jī)軟件開發(fā)領(lǐng)域的基礎(chǔ)問題,生成商用成熟的代碼片段,能夠在一定程度上幫助“新手”學(xué)習(xí)編程,取代一些低階的軟件開發(fā)工作。
AI作畫系統(tǒng)為世界名畫《戴珍珠耳環(huán)的少女》畫出了人物手臂和房間的背景陳設(shè)。
2020年3月日本漫畫周刊《Morning》上刊登了AI仿制的手冢治蟲作品《Paidon》,這也是世界上第一部由AI參與制作的漫畫。
2015 年, 谷歌開源了用來分類和整理圖像的AI程序“ D e e p -Dream”?!癉eepDream”的開源除了幫助我們深入了解深度學(xué)習(xí)的工作原理外,還能生成一些奇特、頗具藝術(shù)感的圖像。
2021年二次元漫畫風(fēng)格遷移工具“AnimeGAN”發(fā)布了其二代版本,更新后支持了風(fēng)景照片和風(fēng)景視頻的三種動漫化風(fēng)格(分別是宮崎駿、新海誠和金敏),視覺效果更佳。
ChatGPT作為AI技術(shù)中自然語言處理方向發(fā)展比較成熟的項(xiàng)目,也可以和其他架構(gòu)的人工智能系統(tǒng)相結(jié)合,在更多領(lǐng)域的應(yīng)用場景中發(fā)揮作用。如“語音識別AI、聊天AI、模擬人聲AI”和ChatGPT結(jié)合后,會達(dá)到意想不到的體驗(yàn)感受:當(dāng)用戶撥打電話,“語音識別AI”系統(tǒng)將通話語音識別成為文本,輸入到ChatGPT平臺中,將它生成的答案文本,通過“模擬人聲AI”轉(zhuǎn)換生成模擬真實(shí)人聲的聲音片段,這個(gè)過程完全依靠計(jì)算機(jī)軟件代碼自動完成,用戶根本無法察覺他們正在與AI通話。
“OpenAI公司”此前發(fā)布了一個(gè)名叫“DALL·E2”的AI作畫系統(tǒng),這個(gè)系統(tǒng)可以根據(jù)文本內(nèi)容生成圖像,如果將這類AI作畫系統(tǒng)與ChatGPT相結(jié)合, ChatGPT優(yōu)異的上下文理解能力,有助于AI作畫系統(tǒng)更好地理解用戶意圖,從而生成更符合用戶心意的AI繪圖作品。但這種耦合的方式引發(fā)了一些擔(dān)憂。美國貝爾弗科學(xué)與研究中心聲稱ChatGPT會“劫持民主”:別有用心的人可以利用它對每天的新聞快訊、博客條目和社交媒體的帖子發(fā)表數(shù)百萬次的評論,從而影響大眾的判斷和社會輿論,而且手段非常隱蔽。
使用人工智能制作視頻動畫, 可以有多種不同風(fēng)格。
輸入一張手繪簡圖(左),通過圖像合成系統(tǒng),可以生成一張?zhí)摂M的照片圖像(右)。
同時(shí),ChatGPT最值得關(guān)注的商業(yè)化路徑便是將它嵌入到搜索引擎中去。2023年2月微軟宣布將ChatGPT技術(shù)嵌入到自家搜索引擎“必應(yīng)”中,并展示了嵌入ChatGPT的搜索引擎將如何運(yùn)行:將傳統(tǒng)搜索引擎的搜索結(jié)果與ChatGPT對搜索結(jié)果的注釋并排顯示,用戶也可以與得到ChatGPT技術(shù)加持的“必應(yīng)聊天機(jī)器人”對話。微軟的“Edge瀏覽器”在嵌入ChatGPT之后,也增加了“聊天”與“轉(zhuǎn)寫”功能——用戶可以將這兩個(gè)功能設(shè)置在側(cè)邊欄中,“聊天功能”可以讓用戶提問關(guān)于正在查看的網(wǎng)頁或文檔的問題,而“轉(zhuǎn)寫功能”就是提供寫作助手之類的功能。
搜索引擎在嵌入ChatGPT后能夠提高用戶獲取有用信息的效率。當(dāng)輸入“發(fā)燒該吃什么藥?”時(shí),傳統(tǒng)搜索引擎會給出大量網(wǎng)頁鏈接,用戶需逐個(gè)點(diǎn)擊網(wǎng)頁鏈接直至得到所需的有用信息。而在ChatGPT技術(shù)的加持下,用戶則直接得到“一般需要阿匹斯林類藥物,但需在醫(yī)生的建議下服用藥物。”這個(gè)有用信息。因?yàn)镃hatGPT強(qiáng)大的上下文本理解能力,所以能夠比傳統(tǒng)搜索引擎更加有效地理解用戶意圖,輔助篩選搜索引擎給出的搜索結(jié)果,刪減無效信息,提高信息匹配度,節(jié)約了用戶的時(shí)間成本,從而提高了用戶的使用體驗(yàn)。但是,有些證券市場分析師不看好這個(gè)商業(yè)化路徑,證券公司摩根士丹利認(rèn)為,要消費(fèi)者改變搜索和瀏覽的習(xí)慣本身困難重重,而且商業(yè)利益模式的改變更加困難,例如廣告費(fèi)用。
綜合而言,如此高度自動化的ChatGPT若能投入商用,勢必會取代或者優(yōu)化大量重復(fù)、機(jī)械的文字類工作。如語音/文字客服、大規(guī)模數(shù)據(jù)統(tǒng)計(jì)分析、消息類新聞寫作等等,但ChatGPT并不能完全取代人類工作,而是在一定程度上提高人們的工作效率,減少人為差錯(cuò),豐富學(xué)習(xí)手段等等。律師、醫(yī)生、學(xué)生、科研人員等職業(yè)將會因此而受益,因此“OpenAI公司”將ChatGPT平臺描述為一種旨在補(bǔ)充人類而不是取代人類的工具。
ChatGPT的火熱是多方因素綜合作用的結(jié)果。首先,ChatGPT的出色表現(xiàn)足夠驚艷,這反映了“OpenAI公司”深厚的技術(shù)能力。但出色表現(xiàn)并不意味著ChatGPT必然爆火,前代“GPT-3”問世時(shí)也驚艷了眾多工程技術(shù)人員,但“GPT-3”對普通用戶并不友好,使用難度較高,必須具備一定技術(shù)基礎(chǔ)的計(jì)算機(jī)工程師才能駕馭。相比之下,ChatGPT入門門檻低,無需具備較高的教育文化背景就能“傻瓜式”地與其對話,受眾面較廣是爆火的原因之一。同時(shí)“OpenAI公司”使用內(nèi)容過濾器技術(shù),有效規(guī)避了道德、宗教等敏感話題,普遍用戶根本無法誘導(dǎo)它“作惡”,媒體公共輿論壓力大幅度減少,保證了其能夠持續(xù)運(yùn)營、繼續(xù)擴(kuò)充用戶。
其次,用戶與ChatGPT進(jìn)行對話,就是上文提及的“打分”過程。“OpenAI公司”需要通過大量用戶的使用記錄,構(gòu)建更加接近大眾認(rèn)知的超大規(guī)模樣本的數(shù)據(jù)集,用作下一步的算法模型訓(xùn)練,這也是“OpenAI公司”和微軟公司不遺余力地推廣ChatGPT的原因之一。
再者,“OpenAI公司”與資本市場需要相互成就。一方面ChatGPT如此超大規(guī)模的算法模型成本高昂,需要市場投入資金。而另一方面,投資市場需要新的商業(yè)項(xiàng)目作為資金的流動出口,以尋求新的經(jīng)濟(jì)增長點(diǎn);最后,ChatGPT觸發(fā)了人類價(jià)值的焦慮。近年來“AlphaGo”“GPT-3”“DALL-E2”等爆款A(yù)I頻出,它們的問世都能引發(fā)一輪“打工人”的恐慌,不斷沖擊人們對以往AI的預(yù)期認(rèn)知,引發(fā)了大眾對自我價(jià)值認(rèn)知和生產(chǎn)方式轉(zhuǎn)變的廣泛討論。
《百駿圖》
《漢宮春曉圖》
《千里江山圖》局部。
中國畫很難畫,但通過AI的修復(fù)及重新繪制,能夠生成可輸出的高分辨率圖像。這UVQ2VKXMhTW8lX7qy8m1ig==項(xiàng)技術(shù)可以用在老舊照片、藝術(shù)品修復(fù)及圖像內(nèi)容數(shù)字化等領(lǐng)域。
但ChatGPT離大規(guī)模商業(yè)應(yīng)用仍然“為時(shí)尚早”。即使微軟已將ChatGPT技術(shù)嵌入到自家商業(yè)應(yīng)用必應(yīng)搜索引擎中,但這種嵌入并不是完美的有機(jī)結(jié)合。用作ChatGPT訓(xùn)練的數(shù)據(jù)集僅更新到2021年,意味著它并不知道當(dāng)下發(fā)生的時(shí)事,更無法對新聞做出評論,時(shí)效性較強(qiáng)的新聞寫作無法勝任。例如它并不知道2022年美國中期選舉的結(jié)果。
從技術(shù)原理的角度看,要解決ChatGPT“知識庫”陳舊的問題,則必須從零開始訓(xùn)練“學(xué)習(xí)”,而無法單獨(dú)增加某個(gè)領(lǐng)域的知識,面對更大規(guī)模的互聯(lián)網(wǎng)信息,ChatGPT若要實(shí)時(shí)抓取互聯(lián)網(wǎng)知識并實(shí)時(shí)訓(xùn)練更新迭代,無論是從技術(shù)難度還是資金規(guī)模都難以想象,這也注定它無法作為搜索引擎使用。更為重要的是ChatGPT的底層AI技術(shù)原理并無根本性的進(jìn)步,曾經(jīng)“智障”AI普遍存在的問題ChatGPT也同樣存在。
例如算法“黑盒”問題。由于AI技術(shù)本身的復(fù)雜性以及媒體機(jī)構(gòu)、技術(shù)公司的排他性商業(yè)政策,算法猶如一個(gè)未知的“黑盒”,用戶并不清楚算法設(shè)計(jì)的目標(biāo)和意圖。設(shè)計(jì)開發(fā)者也會因?yàn)樗惴ㄒ?guī)則不斷的改變疊加,而無法對算法的底層原理做出現(xiàn)有問題內(nèi)容的解釋;以及算法偏見問題。這是指AI對某些事物并不能做出客觀評價(jià),也是因?yàn)锳I的底層算法造成的,如果用大量“戰(zhàn)爭無罪”的數(shù)據(jù)訓(xùn)練它,那么AI就會得出“戰(zhàn)爭無罪”的結(jié)論;還有懂“計(jì)算”不懂“算計(jì)”的問題,AI也不具備人類通常具備的邏輯引申等能力;魯棒性問題,也就是算法運(yùn)行是否絕對可靠等問題。因此,ChatGPT需要進(jìn)行持續(xù)優(yōu)化算法,降低規(guī)模,才能走向大規(guī)模商業(yè)化,真正“造福全人類”。
19世紀(jì),英國取得工業(yè)革命的巨大成功,機(jī)器制造大量取代人工勞動,蒸汽機(jī)技術(shù)加持的紡織機(jī)生產(chǎn)效率驚人,大量紡織工人下崗,引發(fā)大眾對機(jī)器的恐慌,大量英國紡織工人闖入紡織工廠破壞搗毀機(jī)器,最后英國政府不得不派出軍隊(duì)進(jìn)行鎮(zhèn)壓,此為“盧德運(yùn)動”。
毋庸置疑,以ChatGPT為代表的人工智能技術(shù)假以時(shí)日勢必會取得巨大進(jìn)步,和工業(yè)革命時(shí)期機(jī)器“消滅”眾多體力勞動崗位一樣,人工智能也勢必會取代落后于時(shí)代的眾多勞動方式甚至勞動崗位,很可能會讓許多人失業(yè)。但我們也應(yīng)該積極地看到,工業(yè)革命淘汰落后生產(chǎn)力的同時(shí),也誕生了更多先進(jìn)的技術(shù)崗位。
再回看工業(yè)革命的時(shí)代,因?yàn)榭涨敖夥诺纳a(chǎn)力,創(chuàng)造了巨大財(cái)富,人們也逐漸認(rèn)識到破壞機(jī)器本身并不能阻止時(shí)代洪流滾滾向前。主動適應(yīng)時(shí)代的人類,自身勞動技能和生產(chǎn)能力也同樣得到了長足進(jìn)步,思想精神文明也隨之極大地豐富起來,經(jīng)濟(jì)發(fā)展邁入了持續(xù)至今的繁榮時(shí)期。為此,不斷學(xué)習(xí),才能真正告別ChatGPT帶來的失業(yè)焦慮,告別“盧德運(yùn)動”。
(責(zé)編:南名俊岳)