劉哲宇
人工智能正在把我們帶入一個新紀元,2022年底推出的ChatGPT 一夜爆火,成為人類歷史上使用人數(shù)增長最快的應用,進入2023年,ChatGPT從科技圈“出圈”,引燃了社交媒體。微軟CEO納德拉甚至認為對于知識型工作者來說,這無疑是一場新的“工業(yè)革命”。
當今,人工智能已不陌生,人們習慣在生活中多個領(lǐng)域依賴人工智能,那么ChatGPT為何能如此火爆?很可能是因為它“說話”的方式, ChatGPT為何具有很強的自然語言處理能力,即“理解人們所說的話”。過去,電腦和手機里的計算單元并不能直接理解漢語、英語,或者任何自然語言,整個數(shù)據(jù)的世界都需要大量程序員來搭建需求和程序之間的橋梁,把人類想要完成的任務(wù)轉(zhuǎn)化成機器所能理解的代碼。而今天,你只需要像與人聊天一樣,一問一答,即可輕松實現(xiàn)與人工智能的交流。
有人把ChatGPT比作互聯(lián)網(wǎng)的“有損壓縮”——在開發(fā)過程中,它大量學習開發(fā)人員“投喂”的各種知識,隨著訓練量越來越大,它從不同文字的出現(xiàn)頻率中總結(jié)出了規(guī)律,相當于獲得了一個互聯(lián)網(wǎng)信息的壓縮版本,信息有所損失,但是足以應付一般的對話交流。隨著硬件算力的不斷提升,訓練數(shù)據(jù)量的進一步增加,人工智能總有一天能窮盡互聯(lián)網(wǎng)上所有的人類知識,久而久之,它將變得比絕大多數(shù)人都聰明。
以ChatGPT為代表的新一代人工智能的一大突破,是從“判讀式”發(fā)展為“生成式”?!叭斯ぶ悄苌蓛?nèi)容” (Artificial Intelligence Generated Content,AIGC)的概念開始得到認可。它既區(qū)別于之前的用戶生產(chǎn)內(nèi)容 (UGC) ,也不同于更早期的專業(yè)機構(gòu)生產(chǎn)內(nèi)容 (PGC)??梢赃@樣理解:最早只有報刊、雜志等專業(yè)機構(gòu)才能發(fā)布新聞、傳播資訊,是PGC,隨著互聯(lián)網(wǎng)時代的來臨,每個人只要注冊賬號,自己就能成為自媒體,在社交網(wǎng)絡(luò)中成為信息傳播樞紐,即UGC;而今天,人工智能將可以搜集資訊,進行一定程度的事實甄別,并總結(jié)成合理清晰的資訊進行傳播。
筆者試著將不久前剛結(jié)束的第二十一屆中國(上海)國際眼鏡業(yè)展覽會上光學儀器設(shè)備廠商的新品資料和宣發(fā)內(nèi)容進行了搜羅整理,“投喂”給了ChatGPT,并試著問它當前的發(fā)展趨勢是什么,ChatGPT如此回答(見下圖)。
可以看出,其回答仍然有著許多原始資料的行文風格和語言習慣,但已很好地起到了傳播資訊和信息的作用。這只是用了短短十分鐘整理資料后投給ChatGPT的結(jié)果,它的聰明程度、完成任務(wù)的質(zhì)量,跟人類輸入的資料和提示詞(Prompt)有很大關(guān)系,如果你想它為你的新產(chǎn)品寫一段廣告語、為你的總結(jié)報告制作一個PPT、為你的培訓課程更新一個新的大綱,只要你問得夠清楚、夠巧妙,ChatGPT都能做到。
人工智能技術(shù)對于眼科及眼視光行業(yè)來說早已成為常規(guī)生產(chǎn)力的組成部分。例如,眼底照相機可以拍攝眼底視網(wǎng)膜血管,通過判讀照片,眼科醫(yī)生能發(fā)現(xiàn)高度近視、青光眼、高血壓、糖尿病等的前兆和風險,及時預警和干預。然而分析眼底照相機照片需要時間,人工智能就能在這一領(lǐng)域發(fā)揮功效。眼科行業(yè)已有十分成熟的AI輔助眼底照片判讀方案,可以通過大數(shù)據(jù)累積,即告訴AI,健康的眼底長什么樣,不健康的眼底長什么樣,哪種情況的眼底照片對應哪些風險,AI便能以數(shù)百倍于人類的速度判讀眼底照片,對于其中的近視及眼底病征兆進行預警,已成為眼科醫(yī)生和視光師們的好幫手。
但這只是單一的、封閉的運用場景,本質(zhì)上仍然是在提高速度,而非顛覆模式。創(chuàng)新工場董事長兼CEO李開復就曾說,過去的人工智能技術(shù)的一大瓶頸,正是其使用和優(yōu)化都是割裂的,過去的人工智能可以輔助駕駛、識別人臉,甚至可以推薦更符合你興趣的抖音視頻,但每個應用都像是一座孤島,并沒有形成聯(lián)動。而ChatGPT等新一代人工智能的大語言模型,既讓機器理解人類語言成為可能,也為不同應用場景的聯(lián)動提供了平臺。
人類擅長的想象方式是一元的線性增長,即變得更快、更多,但憑借強大的語義理解能力,最新發(fā)布的GPT-4能做的遠比更快地辨識眼底相片多,它可以跳出一問一答的模式,真正理解人類的意圖,并被接入各種系統(tǒng)之中去處理信息并做出決策。
試想,我們將大量兒童青少年的屈光發(fā)育檔案“投喂”給人工智能,通過大量數(shù)據(jù)的訓練,它便可以總結(jié)出年齡、遺傳、屈光度、眼軸,乃至身高、體重、地域之間的動態(tài)關(guān)系,給出更準確的預測和預警。它看過比經(jīng)驗最豐富的視光師還要多幾個數(shù)量級的案例,掃一眼數(shù)據(jù),就能從幾百個有著類似情況的孩子身上得出未來可能的發(fā)展結(jié)果。從眾多近視防控產(chǎn)品中選擇合適的,甚至是生成一整套多產(chǎn)品、多手段搭配的解決方案,對于它來說也不在話下,它甚至還可以在使用過程中對孩子和家長進行指導,并實時觀察和修正解決方案。而要實現(xiàn)以上這一切,家長和孩子并不需要會編程、寫代碼,只需要在“聊天”中提供孩子的數(shù)據(jù)即可。
當然,筆者最為關(guān)心的還是人工智能能否獨立完成驗光,獨立完成驗光意味著形成了基本的眼健康篩查閉環(huán),讓真正的“管家式”或“顧問式”的眼健康人工智能助手成為可能。這一點在目前“一問一答”式的ChatGPT上肯定無法實現(xiàn),它會告訴你,它只是一個模型,并沒有操控專業(yè)儀器設(shè)備的能力。
筆者就此采訪了一位眼鏡零售門店的視光師,他表示,現(xiàn)階段的驗光儀器設(shè)備相較于過去的手動版本已有了長足的進步,如果能夠開放接口給人工智能,自動化并不困難,并且一般意義上的“驗光”并不復雜。以眼鏡零售店的日常場景為例,如果只是為了給一般近視人群配鏡,而不需要任何疑難雜癥的篩查,人工智能完全可以勝任。但難的地方不是驗光本身,而是如何通過語音或者文字提示與被測者交流,相互理解想法,讓其配合進行驗光。目前相關(guān)的配合測試還都在成年人身上進行,成年人的理解能力和依從性都更強,要給兒童青少年進行篩查和驗光便顯得困難許多。
這位視光師也許不知道,以ChatGPT為代表的生成式AI,最直觀的應用場景就是聊天,以及由此衍生的客服及專業(yè)咨詢。所以筆者認為,隨著人工智能越來越懂得與人交流,甚至擅長扮演特定角色與人交流,以及當前眼視光儀器設(shè)備的智能化和集成度不斷提高,AI驗光將很有可能實現(xiàn)。
目前ChatGPT也存在一些比較明顯的缺陷,比如其數(shù)據(jù)來源還停留在它最后一次接受訓練的時候,即2021年9月左右,對于此后的世界所知甚少。其次它的思維方式并不像人類一樣線性,而更像是對于大量數(shù)據(jù)的提煉,當數(shù)據(jù)來源存在謬誤時,ChatGPT就有可能給出錯誤的信息,或者在信息來源不全的情況下運用算法去進行“聯(lián)想”,在人類看來,這就是“胡編亂造”。當輸出結(jié)果涉及眼科診療、出具處方時,事實性的錯誤將非常致命,將對眼科醫(yī)生和視光師的判斷造成干預。所幸人工智能的訓練速度遠超人類想象,就在本文寫作過程中,OpenAI發(fā)布的GPT-4和新版的ChatGPT,改善了信息源不全的情況下的可信度。
除此以外,前文提到了人工智能完成任務(wù)的效果與人類給到的提示詞(Prompt)關(guān)系很大。Prompt,直譯為“提示”或“驅(qū)使”,在機器學習和自然語言理解中,它通常以文本的形式被輸入到訓練好的模型中,使其執(zhí)行任務(wù)、輸出內(nèi)容。比如,“用隨和、可愛的語氣與小朋友溝通,讓它們配合你進行眼部檢查”,或是“根據(jù)以下資料,預測案例中被測者未來2年的近視發(fā)展情況”“生成一張產(chǎn)品海報,包括以下內(nèi)容”,都是Prompt的一種。
對于醫(yī)療場景中,因人工智能的不準確性所致的風險,ChatGPT自己也有清晰的認知,并給出了建議
在自然語言人工智能的時代,Prompt的重要性堪比代碼,熟練使用Prompt語句,可以讓AI畫出與畢加索、梵高一樣風格的原創(chuàng)畫作,可以讓AI寫出海明威口吻的小說,或者譜出莫扎特風格的樂曲,也可以讓它設(shè)計一套包含多個參數(shù)、多臺設(shè)備,可長期追蹤和互動的眼健康系統(tǒng)。Prompt工程師正在成為一個新興的職業(yè)。如果我們想要借助人工智能來幫助眼視光行業(yè),就需要既懂得調(diào)教人工智能,又懂得眼視光專業(yè)知識的人才,或者是能夠同時理解雙方,扮演需求轉(zhuǎn)譯橋梁的人。最理想的狀態(tài)是,經(jīng)過充分調(diào)教的人工智能,將成為老師,為眼視光人才培養(yǎng)帶來巨大幫助。有人說當今比拼的是信息檢索的理解能力,而未來比拼的可能就是最大化利用人工智能的能力。頂端人工智能人才正在涌入金融、互聯(lián)網(wǎng)等行業(yè),眼視光行業(yè)想要培養(yǎng)出既懂專業(yè),又懂機器的人工智能型人才,筆者認為至少還需要5家以上的行業(yè)巨頭持續(xù)性投入以及2年乃至更長的時間。
眼鏡行業(yè)的從業(yè)者將不會被人工智能所替代,而且我們一定能借助人工智能,讓眼視光行業(yè)變得比想象中還要好很多倍。