一凡
ChatGPT是一個生成式AI軟件,即內(nèi)容生成器,它無法憑空生成或制造產(chǎn)品,而是通過人類向它提供的材料、信息、文獻、文體等進行深度學習,模擬人類做出回答。因此,本質(zhì)上,它是一個自然語言處理流程,每次處理用戶的需求都有一些基本的步聚。
首先,ChatGPT會進行語言識別。ChatGPT是一款面向世界各國的AI軟件,因此要先識別用戶使用的語言,才能進行回應。隨后,要進行情感分析處理,ChatGPT會對用戶輸入的信息進行多維度分析,如果不符合國際主流認可的社會倫理,它會自動拒絕回答相關問題。此后,ChatGPT會提取提問的信息,包括用戶輸入的關鍵信息以及與問題相關的人名、地名、行業(yè)和專業(yè)術語等。
接下來,要進行修正和文本分類。修正是對用戶輸入的信息予以審核和糾錯,如修改錯別字;文本分類是對用戶輸入的信息進行分類,根據(jù)分類結果,使用相關搜索軟件獲取信息。更重要的是下一步,即全文搜索處理。ChatGPT基于“自然語言+搜索引擎”的架構,因此,需要從用戶輸入的信息中進一步提取關鍵特征,去搜索相關索引,得到想要的答案。
最后,ChatGPT會生成文本。它會從搜索得到的多種結果中選擇最符合用戶需求的那個,生成對應的文本內(nèi)容。當然,這個文本內(nèi)容的答案還要進一步轉換成適合問答的形式,如用戶熟悉的自然對話形式。如果用戶需要論文或調(diào)查報告等其他文本,ChatGPT則會轉換為該類文章的格式和風格,甚至會列出參考文獻和致謝。
現(xiàn)在,之所以ChatGPT被認為是非常強大和“神奇”的AI軟件系統(tǒng),一是有萬億級的數(shù)據(jù)投入;二是利用了自然語言處理技術(NLP)跨越式的發(fā)展,即“大模型”的上下文學習。通過向大模型“喂入”一個提示(prompt),并選擇性地加入少量任務的樣板,大模型就可以預測下一詞的形式,自動生成相關答案。
因此,ChatGPT對自然語言的理解已經(jīng)開始接近人類。它處理句子時,會通過訓練參數(shù)“理解”句子中哪些詞之間存在關系,哪些詞是同義詞或反義詞。這說明,ChatGPT已經(jīng)深入?yún)⑴c到人類自然語言體系中。
由于這些原因,ChatGPT不僅能與人們實時聊天,還能幫助人甚至替代人做很多事情。例如,它可以幫助用戶寫各類文字材料,包括報告、論文,各種題材的文章、詩歌;它還可以在短時間內(nèi)提供大量信息、回答大量問題,既快又準又好。不過,也有一些ChatGPT生成的文本質(zhì)量并不盡如人意,需要修改、補充和潤色。
由于ChatGPT擁有一系列強大的功能,文化、教育和科技界人士紛紛對此表示擔憂。首先,ChatGPT的強大、豐富、快速和簡便可能會使相當多的人失業(yè),包括中學老師、大學老師、作家、詩人、記者等;其次,ChatGPT的廣泛應用可能助長更多人(如大學生和教師)偷懶?;?、作弊剽竊。
據(jù)說,現(xiàn)在有89%的美國大學生使用ChatGPT完成作業(yè),而且成績不錯。美國北密歇根大學哲學教授奧曼在2023年1月底評出了一篇“全班最好的論文”,這篇論文探討了有關罩袍禁令的道德問題,教授認為該論文段落簡潔、用例恰當、論據(jù)嚴謹。不過,在奧曼教授的追問下,提交論文的學生承認自己是利用ChatGPT完成的論文。
美國明尼蘇達大學法學院和賓夕法尼亞大學沃頓商學院的教授測試ChatGPT“應考”不同課程的考試題目,結果它在法學院的4個學科考試中獲得C+;在商學院的MBA學科考試中獲得B~B-的成績,這些成績算是中等或良好。更令人震驚的是,在美國最難考的美國醫(yī)師執(zhí)照考試中,ChatGPT取得的成績非常接近通過標準。對于人類學生而言,要通過美國醫(yī)師執(zhí)照考試,一般需要在醫(yī)學院學習五年并有兩年以上的臨床實習經(jīng)歷。
此情此景令教育界憂心忡忡。2023年1月27日,法國一流大學巴黎政治學院向全體師生發(fā)送電子郵件,宣布禁止使用ChatGPT,以防欺詐和抄襲。具體要求為,禁止學生使用該軟件制作任何書面作業(yè)或演講稿;只能在有特定課程目的或在課程導師的監(jiān)督下,學生才可借助ChatGPT完成學習任務。如被發(fā)現(xiàn)未按規(guī)定使用ChatGPT,學生將面臨被開除的處罰。
美國的華盛頓大學和佛蒙特大學正著手修訂其學術誠信政策,將“AI生成”納入“剽竊”的范圍內(nèi)。美國紐約州的水牛城大學和南卡羅來納州的弗曼大學表示,計劃在必修課程中加入有關針對AI工具的討論,強化新生對學術誠信等概念的認識。
如果說ChatGPT的出現(xiàn)是與互聯(lián)網(wǎng)和個人電腦的誕生并駕齊驅的里程碑及信息時代的重要分水嶺,那么對待它的態(tài)度和行為,也將成為信息時代的另一個分水嶺。
ChatGPT來了,禁用它還是擁抱它呢?
與其禁止,不如擁抱。在這個分水嶺上,我們應當思考如何有效地使用ChatGPT,利用其長處,避免其短處,不能抱得太緊,也不能棄之不用,甚至禁用。
要擁抱ChatGPT,首先應當了解和評估它在人類科研、教育和文化中的作用。ChatGPT的最大作用不是創(chuàng)新,而是能提供某一領域內(nèi)極為豐富的基礎知識和研究現(xiàn)狀,讓人們知道哪些知識和成果已經(jīng)被創(chuàng)造和生產(chǎn),哪些是需要繼續(xù)努力探索和解決的問題。
正是在這個基礎上,ChatGPT可能會淘汰一批人,清理學術泡沫。這對于文科類的學術研究影響極大。一般而言,文科的論文有比較類似的格式,如都有題目、摘要、目錄、正文、參考文獻、致謝,在內(nèi)容安排上也有不少相似之處,如基本都按照問題提出、文獻綜述、本文觀點、論據(jù)羅列、討論、結論等順序安排內(nèi)容。
ChatGPT可以寫出大量的、在內(nèi)容上看起來并不雷同的文章,因為它經(jīng)過深度學習,掌握了海量的數(shù)據(jù)、案例、人物、故事和大量的寫作方式和風格。因此,如果讓ChatGPT寫文章,可以替代大量的文科論文以及少部分理工科論文。這也正是讓相當多的人擔憂的地方。
盡管ChatGPT可以模擬生成很多文章,但很難替代那些有創(chuàng)意或有全新觀點的文章,更無法替代那些需要實驗數(shù)據(jù)才能完成的理工科論文。因此,ChatGPT在學術上的重要作用是,可以檢驗出什么是有價值的、社會需要的、有創(chuàng)新的真學術、好文章。
其次,ChatGPT可以把更多的教育工作者解放出來,甚至創(chuàng)造出更好的教育效果。孔子曰:“學而不厭,誨人不倦?!焙蟀刖淦鋵嵤轻槍逃撸◣熼L)的。相當多的教師對于好學、聰明的學生是既喜歡又樂于施教的,但是對于那些反應有些慢、理解力有些差的學生就會顯得不耐煩。在學生多次請教而又不理解學習中的問題時,教師就會失去耐心,甚至不愿繼續(xù)指導學生。
這是一個人性的弱點,但是ChatGPT完全可以解決這個問題。只要有手機或電腦,就可以拜ChatGPT為師,有不懂的地方可以反復請教ChatGPT,它絕不會不耐煩,也不會推脫沒時間,更不會嘲笑學生。無論是通識教育中的問題,還是專業(yè)課程的內(nèi)容,ChatGPT都能做到反復解釋,不厭其煩。
ChatGPT在教育中還有其他優(yōu)勢,比如,可以幫助教師節(jié)省備課時間;它有時會提供錯誤答案,可以成為學生批判性思維訓練的素材。教師還可以利用ChatGPT培養(yǎng)學生對信息的分辨、思考和查證能力。
不過,緊密擁抱ChatGPT也有弊病,如讓學生養(yǎng)成對AI工具的依賴,助長抄襲作弊等陋習;作業(yè)和論文無法反映學生真正的知識水平;難以培養(yǎng)學生的批判性思維和解決問題的能力。
然而,這些情況主要出現(xiàn)在學生完成作業(yè)和寫論文的過程中。因此,在教育領域使用ChatGPT,應當制定一些規(guī)則。如在閉卷考試中不準帶手機、不準帶參考書和紙質(zhì)資料、不準用電腦,自然也不能使用ChatGPT。對于完成日常的學科作業(yè)、期末論文、畢業(yè)論文,則不應禁止學生借助ChatGPT答疑解惑、查找資料。如果能熟練使用ChatGPT,學生可以快速了解某一項研究進展到了什么階段,有哪些成果,需要從哪些地方入手。這對理工科學生和文科學生來說差別不大。但是,對于可能用ChatGPT生成論文的文科而言,采取一定的審核方法區(qū)分人工論文和AI論文是很有必要的。
上文提到的發(fā)現(xiàn)學生用ChatGPT寫論文的奧曼教授也調(diào)整了他的教學計劃。他要求學生在課堂上只能使用帶有監(jiān)控和限制功能的瀏覽器撰寫論文初稿,而且要求學生對后來的每一次修改做出合理解釋。奧曼教授還表示,未來可能不再讓學生寫論文,而以其他方式考核學生的學習成績。同時,奧曼教授認為,學生使用ChatGPT完成論文是違紀的,使用AI生成的論文會成為紀律處分的證據(jù),但如何定義“AI剽竊”則是一個新難題。
其實,ChatGPT的設計者也注意到了這個問題。2023年2月1日,OpenAI公司推出一款AI文本分類器,用于輔助辨別文本的作者是人類還是AI軟件。這實際上是以AI對付AI。該軟件評估文本后會給出5種分類:非常不可能、不太可能、不清楚、可能、非??赡?,是AI生成。但是,使用這種AI文本分類器有一些限制,要求至少輸入1000個字符,大約150~250個單詞。
不過,這種檢測工具目前只有26%的準確率,而且在檢測大于1000個字符的英文文本時效果更好,檢測其他語言時表現(xiàn)要差得多,有時還會把人和AI搞混。如知名AI專家拉斯卡用莎士比亞的《麥克白》第一頁的內(nèi)容做測試,發(fā)現(xiàn)AI文本分類器將其誤判為“很可能是AI生成的”。
這意味著,以AI對付AI還需要改進。美國普林斯頓大學計算機科學專業(yè)的加拿大華裔學生愛德華·田研發(fā)了一款名為GPTZero的程序,可檢測文本內(nèi)容是否由ChatGPT生成。GPTZero于2023年1月2日問世,利用兩個指標衡量某段文本是否由AI生成,即困惑度和突發(fā)性。困惑度用于衡量文本的復雜性,困惑度越高,越有可能是人寫的;突發(fā)性用于衡量文本句式結構的變化程度,AI生成的句子更統(tǒng)一,而人類更傾向混合使用長短句。
總之,人們應當擁抱和利用ChatGPT,充分利用ChatGPT的長處,限制其短處。ChatGPT既無法產(chǎn)生獨特的想法和創(chuàng)意,也無法提供人類在人際交往中獲得的情緒體驗,如傾聽、理解和關愛,而且ChatGPT還會犯各種錯誤,更不能進行全面的思考和分析。我們沒有理由過度擔心ChatGPT ,因為它和其他現(xiàn)有的AI軟件無法完全替代人類。