摘 要:知識(shí)封裝技術(shù)的發(fā)展推動(dòng)了出版形態(tài)的更新,從數(shù)據(jù)庫(kù)技術(shù)、搜索引擎再到大語(yǔ)言模型技術(shù),知識(shí)表示、提取、生成和傳播的方式不斷演化。生成式AI可對(duì)各類數(shù)據(jù)文本進(jìn)行學(xué)習(xí)并推理預(yù)測(cè),進(jìn)而生成知識(shí)性內(nèi)容輸出。一方面,生成式AI技術(shù)因其知識(shí)生成的潛在效果而被普遍用于知識(shí)封裝產(chǎn)品之中;另一方面,也必須關(guān)注生成式AI可能帶來(lái)的一些問(wèn)題,如數(shù)據(jù)可耗盡性、輸入依賴性、不平等性、解釋性不足及穩(wěn)健性不足等。生成式AI通過(guò)對(duì)話式知識(shí)提取、多模態(tài)知識(shí)表達(dá)和知識(shí)智能體等方式,正在深層重塑知識(shí)傳播形態(tài),理解其演進(jìn)特征將有助于更好地駕馭這一新型知識(shí)系統(tǒng)。
關(guān)鍵詞:生成式AI;知識(shí)封裝;出版形態(tài);知識(shí)傳播;大語(yǔ)言模型
DOI:10.3969/j.issn.2097-1869.2024.02.011 文獻(xiàn)標(biāo)識(shí)碼:A
著錄格式:易龍.生成式AI驅(qū)動(dòng)下的知識(shí)封裝與知識(shí)傳播新形態(tài)研究[J].數(shù)字出版研究,2024,3(2):84-93.
*基金項(xiàng)目:2023年度湖南省教育廳科學(xué)研究?jī)?yōu)秀青年項(xiàng)目“生成式人工智能背景下的知識(shí)封裝與傳播形態(tài)研究”(項(xiàng)目編號(hào):23B0019)。
出版活動(dòng)包含了知識(shí)封裝(Packaging)和知識(shí)傳播(Dissemination)這兩個(gè)重要并置功能。知識(shí)封裝貫穿紙質(zhì)出版到AI出版的各個(gè)發(fā)展階段。紙質(zhì)出版和電子出版階段,更多地將封裝視為出版物固態(tài)化的過(guò)程或狀態(tài)。張志強(qiáng)等[1]區(qū)分了網(wǎng)絡(luò)型出版物和封裝型出版物,強(qiáng)調(diào)了兩者之間存在的差異。徐麗芳[2]通過(guò)辨析數(shù)字出版與電子出版、網(wǎng)絡(luò)出版,指出了封裝型載體變化導(dǎo)致的概念趨同。隨著出版形態(tài)的進(jìn)一步演化,封裝被賦予了更多內(nèi)涵。張新雯等[3]探討了將資源封裝成不同產(chǎn)品形態(tài)結(jié)構(gòu)的可能性。馮宏聲等[4]認(rèn)為在數(shù)字出版語(yǔ)境里,“容器”并非物理形態(tài)的介質(zhì),而是“以數(shù)字形態(tài)封裝內(nèi)容的符號(hào)”。周葆華[5]認(rèn)為,人類傳統(tǒng)的知識(shí)媒介由專家系統(tǒng)生產(chǎn)和把關(guān),知識(shí)生產(chǎn)遵循特定的專業(yè)法則和審核標(biāo)準(zhǔn),凝結(jié)成確定的知識(shí)產(chǎn)品形態(tài),保存于固定的“本質(zhì)性資料庫(kù)”中。常江等[6]提到,在數(shù)字媒介邏輯的支配下,整個(gè)出版業(yè)的“操作系統(tǒng)”完全被打開(kāi)了,各種類型的出版物與其說(shuō)是某一知識(shí)產(chǎn)品的最終形態(tài),不如說(shuō)是流行性、網(wǎng)絡(luò)化的知識(shí)生產(chǎn)過(guò)程中的某一個(gè)“凝固的瞬間”,是用戶生活經(jīng)驗(yàn)與知識(shí)獲取實(shí)踐的一個(gè)語(yǔ)境化的交叉點(diǎn)。綜合以上觀點(diǎn),不難發(fā)現(xiàn),學(xué)者大多認(rèn)同封裝是將知識(shí)凝結(jié)固定的技術(shù)實(shí)現(xiàn)和形態(tài)結(jié)構(gòu)的塑造過(guò)程。
進(jìn)入智能出版階段,知識(shí)的封裝與傳播實(shí)現(xiàn)了功能同步。生成式AI技術(shù)展現(xiàn)了其在大規(guī)模知識(shí)挖掘、組織、表示與傳播方面的能力,推動(dòng)了出版新形態(tài)和新業(yè)態(tài)的不斷涌現(xiàn)。生成式AI作為一種AI技術(shù),能夠通過(guò)學(xué)習(xí)已有數(shù)據(jù)集生成新的文本、聲音、圖形、視頻、虛擬現(xiàn)實(shí)等多模態(tài)內(nèi)容。方卿等[7]從出版作為一個(gè)以知識(shí)內(nèi)容選擇、傳播、傳承為內(nèi)在追求的內(nèi)容產(chǎn)業(yè)出發(fā),指出“類人”的智能和出版的系統(tǒng)化封裝與傳播,使得人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)產(chǎn)生巨大的影響力和破壞力。劉珍等[8]指出AI的內(nèi)容生成功能和出版行業(yè)的深度融合將實(shí)現(xiàn)知識(shí)封裝過(guò)程中的全流程互動(dòng)性和個(gè)性化,并更好地整合多模態(tài)的出版內(nèi)容,實(shí)現(xiàn)更完整、優(yōu)質(zhì)的內(nèi)容出版??紤]到出版業(yè)知識(shí)組織的核心功能與生成式AI封裝知識(shí)的內(nèi)在勾連,可以將知識(shí)封裝視為基于用戶信息使用行為習(xí)慣,利用不同的媒介技術(shù)系統(tǒng)對(duì)知識(shí)內(nèi)容進(jìn)行產(chǎn)品化組織并為用戶提供知識(shí)服務(wù)的實(shí)現(xiàn)形式[9]。出版是知識(shí)密集型、智力密集型的行業(yè),也是對(duì)媒介技術(shù)敏感的行業(yè)。出版業(yè)圍繞知識(shí)的組織不斷地革新媒介應(yīng)用方式和出版物封裝形態(tài),以求更好地進(jìn)行知識(shí)傳播。生成式AI表現(xiàn)出的知識(shí)生成和處理能力,對(duì)出版業(yè)的核心能力帶來(lái)了直接的沖擊。為了應(yīng)對(duì),部分出版機(jī)構(gòu)積極擁抱生成式AI以提升競(jìng)爭(zhēng)力??紤]到生成式AI應(yīng)用所需要的開(kāi)發(fā)能力、算力成本和數(shù)據(jù)資源,出版行業(yè)鮮少能夠直接開(kāi)發(fā)通用大語(yǔ)言模型,故將生成式AI技術(shù)與出版業(yè)態(tài)相結(jié)合成為主流路徑,應(yīng)用場(chǎng)景選擇和產(chǎn)品形態(tài)設(shè)計(jì)成為出版智能化過(guò)程中需優(yōu)先考慮的因素。出版業(yè)擁有優(yōu)質(zhì)內(nèi)容和數(shù)據(jù)供給,生成式AI則是數(shù)據(jù)和知識(shí)挖掘的先進(jìn)技術(shù),兩者能有效結(jié)合的關(guān)鍵在于能夠產(chǎn)生符合新技術(shù)條件下用戶使用行為習(xí)慣的出版產(chǎn)品形態(tài)。因此,考慮著眼于產(chǎn)品化的知識(shí)封裝和著眼于用戶接受的知識(shí)傳播是需要重點(diǎn)討論的問(wèn)題。
1 封裝技術(shù)對(duì)出版形態(tài)的形塑
媒介技術(shù)固有的物質(zhì)結(jié)構(gòu)及與生俱來(lái)的對(duì)信息符號(hào)的重構(gòu)力量,使其對(duì)傳播形態(tài)發(fā)揮著重要的限定性作用,一旦與內(nèi)容結(jié)合便可固化為特定的出版物形態(tài)。封裝不總是意味著出版內(nèi)容物的凝固和編輯開(kāi)放性的終結(jié),相反,通過(guò)梳理封裝技術(shù)與出版形態(tài)的關(guān)系可以發(fā)現(xiàn),與以完成態(tài)為目標(biāo)的出版物封裝技術(shù)不同,生成式AI技術(shù)對(duì)知識(shí)的封裝是在與用戶共生的知識(shí)交互中完成的,是一種更關(guān)注個(gè)性化知識(shí)獲取的封裝方式。
1.1 封裝技術(shù)與內(nèi)容物的組合共同塑造了出版形態(tài)
出版是文化傳承、知識(shí)傳播和信息傳遞的重要方式,而這些目標(biāo)的實(shí)現(xiàn)離不開(kāi)出版物這一重要載體,因此文化、知識(shí)、信息的封裝方式在一定程度上決定了出版價(jià)值的實(shí)現(xiàn)。對(duì)文化、知識(shí)和信息的封裝方式,是根據(jù)不同的出版目標(biāo)選擇特定內(nèi)容組織方式形成不同出版物形態(tài)的過(guò)程。數(shù)據(jù)庫(kù)和大數(shù)據(jù)技術(shù)的發(fā)展,加上數(shù)據(jù)作為重要生產(chǎn)要素發(fā)揮的經(jīng)濟(jì)社會(huì)價(jià)值,使得數(shù)據(jù)這一知識(shí)來(lái)源的初始形態(tài)成為相對(duì)獨(dú)立的一種內(nèi)容物,發(fā)展為數(shù)據(jù)出版形態(tài)。組織理論家羅素·艾可夫(Russell L. Ackoff)最早提出了“數(shù)據(jù)—信息—知識(shí)—智慧”層次結(jié)構(gòu),揭示了知識(shí)的本質(zhì),成為知識(shí)組織理論的重要基礎(chǔ)[10]。數(shù)據(jù)庫(kù)技術(shù)(包括大數(shù)據(jù)技術(shù))、搜索引擎技術(shù)、大模型技術(shù)三類知識(shí)封裝技術(shù)與知識(shí)的層次結(jié)構(gòu)模型相結(jié)合,產(chǎn)生了數(shù)據(jù)出版、信息檢索、知識(shí)服務(wù)等各類出版形態(tài)的發(fā)展。
1.1.1 數(shù)據(jù)庫(kù)技術(shù)與數(shù)據(jù)封裝
數(shù)據(jù)封裝的目標(biāo)是提供一定規(guī)模數(shù)據(jù)集的存儲(chǔ)、查詢和分析,追求存儲(chǔ)記錄和檢索利用價(jià)值,并不直接提供知識(shí)挖掘和深入見(jiàn)解,涉及數(shù)據(jù)庫(kù)及大數(shù)據(jù)技術(shù)。早期的知識(shí)以高度結(jié)構(gòu)化的方式進(jìn)行存儲(chǔ),通過(guò)關(guān)系型數(shù)據(jù)的方式來(lái)表示人類知識(shí),通過(guò)數(shù)據(jù)庫(kù)語(yǔ)言來(lái)檢索、訪問(wèn)、調(diào)用知識(shí),具備較高的使用門檻。后來(lái)則出現(xiàn)了專門存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫(kù)技術(shù),通過(guò)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等技術(shù)可用于處理使用非結(jié)構(gòu)化數(shù)據(jù)。
1.1.2 搜索引擎技術(shù)與信息封裝
以滿足資訊獲取等淺閱讀需求為目標(biāo)的封裝形態(tài),是知識(shí)封裝的初級(jí)加工形態(tài),往往知識(shí)密度低、技術(shù)復(fù)雜度低、折舊速度快。隨著因特網(wǎng)的誕生,大量的碎片化知識(shí)分布在不同的網(wǎng)站中,搜索引擎成為獲取知識(shí)的關(guān)鍵技術(shù)。關(guān)鍵詞輸入作為提取知識(shí)的基本使用方式,基本為單向操作。通用搜索引擎以滿足信息需求為主要目標(biāo),知識(shí)結(jié)構(gòu)化程度較低。搜索引擎通過(guò)互聯(lián)網(wǎng)頁(yè)面信息的抓取、索引及排序算法等技術(shù)對(duì)信息進(jìn)行封裝,并以關(guān)鍵詞匹配響應(yīng)信息需求。信息封裝的主要目標(biāo)是消除不確定性,因此以事實(shí)性內(nèi)容提供為主要方式,早期搜索引擎索引的信息來(lái)源類型包括在線新聞、社交媒體文章、電子書籍等,本身通常不被視為一種數(shù)字出版形態(tài)。但是,搜索引擎作為一種信息封裝方式,為互聯(lián)網(wǎng)用戶提供了一種統(tǒng)一的信息或知識(shí)獲取的交互界面和訪問(wèn)入口,其作為信息提取與表示的主要方式,具備強(qiáng)大的控制信息流動(dòng)的權(quán)力,信息索引和頁(yè)面排序算法等則是這種信息分配權(quán)力的具體實(shí)現(xiàn)。
1.1.3 大語(yǔ)言模型與知識(shí)封裝
大語(yǔ)言模型(Large Language Model,LLM)是生成式AI的重要類型,主要用于自然語(yǔ)言的理解和生成任務(wù)。大語(yǔ)言模型以從信息和數(shù)據(jù)中提煉結(jié)構(gòu)化認(rèn)知為目標(biāo),可提供有組織和可解釋的信息,需要AI、深度學(xué)習(xí)等技術(shù)輔助實(shí)現(xiàn)知識(shí)挖掘的功能,通常具備良好的穩(wěn)定性和較長(zhǎng)期的價(jià)值。大模型時(shí)代首次以最自然的方式使用人類知識(shí),通過(guò)對(duì)話即可提取知識(shí),知識(shí)的組織圍繞人類提示詞而進(jìn)行預(yù)測(cè)式生成,知識(shí)傳遞在對(duì)話協(xié)同中完成。
考慮到三種封裝方式各有其優(yōu)缺點(diǎn)(見(jiàn)表1),未來(lái)封裝技術(shù)的發(fā)展有可能融合數(shù)據(jù)庫(kù)技術(shù)、搜索引擎技術(shù)、大語(yǔ)言模型技術(shù)三者的優(yōu)勢(shì),以保證知識(shí)封裝在知識(shí)時(shí)效性、密度、精確度、準(zhǔn)確度等方面的可靠性,并減少機(jī)器幻覺(jué)和信息偏見(jiàn)所帶來(lái)的危害。
1.2 基于生成式AI技術(shù)的知識(shí)封裝產(chǎn)品
生成式AI技術(shù)的出現(xiàn),推動(dòng)出版行業(yè)應(yīng)用AI從傳統(tǒng)的知識(shí)挖掘升級(jí)為知識(shí)生成。知識(shí)模型基于大模型的訓(xùn)練機(jī)制,可以在某種意義上認(rèn)為大模型學(xué)到了人類知識(shí),并通過(guò)生成模式實(shí)現(xiàn)知識(shí)的重新表達(dá)和傳播。因此,可以說(shuō)大模型即出版,大模型是集成性的、新形態(tài)的出版物[11]。從公開(kāi)數(shù)據(jù)來(lái)看(見(jiàn)表2),開(kāi)發(fā)相應(yīng)產(chǎn)品、工具或平臺(tái)是出版機(jī)構(gòu)應(yīng)用生成式AI的主要方式。通過(guò)對(duì)現(xiàn)有部分出版機(jī)構(gòu)的生成式AI產(chǎn)品的定位、功能和發(fā)展目標(biāo)等方面的梳理,發(fā)現(xiàn)現(xiàn)階段出版相關(guān)企業(yè)的生成式AI產(chǎn)品部署主要用于增強(qiáng)傳統(tǒng)優(yōu)勢(shì)業(yè)務(wù)板塊,進(jìn)一步服務(wù)核心客戶,最終提升企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力。在金融、法律、科研等知識(shí)密集型行業(yè)及新聞等信息密集型行業(yè),生成式AI得到了廣泛應(yīng)用。
2 生成式AI知識(shí)封裝及知識(shí)處理方式
傳統(tǒng)數(shù)字出版一般采用元數(shù)據(jù)封裝模式,通過(guò)統(tǒng)一的制作規(guī)格保證出版物的交付質(zhì)量,產(chǎn)品具備很高的標(biāo)準(zhǔn)化程度和結(jié)構(gòu)穩(wěn)定性,給知識(shí)的組織、檢索、存儲(chǔ)和利用帶來(lái)了很大的便利。生成式AI封裝模式則依賴于提示詞,通過(guò)單次或多輪對(duì)話提取知識(shí),知識(shí)的組織圍繞人類提示詞而進(jìn)行預(yù)測(cè)式提供。因此其相對(duì)元數(shù)據(jù)封裝模式而言是非標(biāo)準(zhǔn)化封裝,其形態(tài)因提示詞而異,具備知識(shí)供給的靈活性,是一種個(gè)性化的知識(shí)供給模式,需要人機(jī)協(xié)同才能共同完成知識(shí)的生產(chǎn)與獲取。元數(shù)據(jù)封裝模式和生成式封裝模式,在知識(shí)交付方式、封裝形態(tài)等方面都存在差異(見(jiàn)表3)。
2.1 生成式AI知識(shí)封裝特性
2.1.1 數(shù)據(jù)可耗盡性:大語(yǔ)言模型數(shù)據(jù)需求增長(zhǎng)快而高質(zhì)量語(yǔ)料有限
大語(yǔ)言模型對(duì)人類所有可獲得的、可數(shù)據(jù)化的知識(shí)進(jìn)行封裝,使其具有知識(shí)存儲(chǔ)方面的完備性,并且?guī)缀醪淮嬖谥R(shí)上的盲區(qū)和短板。按照計(jì)算機(jī)專家陸奇博士的觀點(diǎn),它幾乎封裝了全世界所有的知識(shí),內(nèi)嵌了足夠的學(xué)習(xí)能力和推理能力[12]。ChatGPT在不同版本中接入了GPT-3.5和GPT-4兩個(gè)模型:前者的參數(shù)數(shù)量達(dá)1 750億,訓(xùn)練集的token數(shù)量達(dá)4 990億,其數(shù)據(jù)源來(lái)自Common Crawl數(shù)據(jù)庫(kù)、WebText數(shù)據(jù)集、英文維基百科、書籍期刊,其中僅蘊(yùn)含在書刊內(nèi)的知識(shí)就已超出一般個(gè)人的知識(shí)水平[13]。按照目前大模型的發(fā)展速度,很有可能在不遠(yuǎn)的將來(lái)耗盡現(xiàn)有可獲得的高質(zhì)量文本。由于知識(shí)生成的效果依賴于訓(xùn)練所使用的數(shù)據(jù)集,一旦包含了人類存量知識(shí)的高質(zhì)量語(yǔ)料被學(xué)習(xí)完畢,大模型的知識(shí)邊界便會(huì)暴露出來(lái)。
2.1.2 輸入依賴性:提示詞和知識(shí)輸出之間的聯(lián)動(dòng)
應(yīng)用生成式AI產(chǎn)品進(jìn)行知識(shí)輸出和提取,嚴(yán)重依賴于提示詞的質(zhì)量及其使用方式??梢酝ㄟ^(guò)一個(gè)提示詞實(shí)驗(yàn)來(lái)觀察提示詞與知識(shí)輸出的關(guān)聯(lián)。通過(guò)讓ChatGPT就一個(gè)主題進(jìn)行提問(wèn)并作答,建立問(wèn)題與輸出之間的問(wèn)題序列。例如,給出的提示詞如下:“請(qǐng)就‘?dāng)?shù)字出版這一主題給出5個(gè)問(wèn)題,要求這5個(gè)問(wèn)題是同一個(gè)問(wèn)題按抽象程度分為具體、稍微抽象、一般抽象、高度抽象、最高抽象5個(gè)層級(jí)逐級(jí)遞增的不同表達(dá);給出參考答案;并請(qǐng)對(duì)你自己回答的每道題依次進(jìn)行評(píng)價(jià)。”ChatGPT輸出的結(jié)果整理后見(jiàn)表4,當(dāng)提示詞的抽象層級(jí)不斷提升時(shí),答案的抽象程度也隨之提升,知識(shí)密度相應(yīng)增加。
2.1.3 不平等性:算法的放大器效應(yīng)強(qiáng)化了提示詞輸入者之間的既有“知溝”
一方面,生成式AI是新“知溝”產(chǎn)生的主要推動(dòng)力量。由于知識(shí)的易獲得性,盡管目前還不可靠,生成式AI仍然一度被認(rèn)為是知識(shí)普惠的代表性技術(shù)。但事實(shí)可能正好相反,受限于用戶認(rèn)知水平、經(jīng)濟(jì)狀況、地區(qū)分布、大模型存在的偏好迎合傾向等諸多因素,使得生成式AI并不能帶來(lái)信息和知識(shí)平權(quán),甚至在一定程度上會(huì)放大兩者之間的差異,造成知識(shí)獲取的“剪刀差”?,F(xiàn)以“剪刀模型”(見(jiàn)圖1)假設(shè)來(lái)描述生成式AI應(yīng)用過(guò)程中所存在的個(gè)體間知識(shí)獲取差異:由于并非每個(gè)人都能平等地接入和使用大語(yǔ)言模型,造成了大模型采納過(guò)程的進(jìn)度差異,最先使用大模型技術(shù)的用戶更有可能獲得技術(shù)帶來(lái)的知識(shí)獲取便利,因而可以更早積累知識(shí),并受惠于此。對(duì)大模型技術(shù)的理解差異、語(yǔ)言表達(dá)水平、認(rèn)知水平差異等也造成了輸入提示詞水平的差異,這導(dǎo)致了知識(shí)生成結(jié)果的差異。對(duì)輸出結(jié)果的使用評(píng)價(jià)能力則進(jìn)一步導(dǎo)致了后續(xù)影響,例如在知識(shí)驗(yàn)證、偏見(jiàn)防范等方面進(jìn)一步造成了不平衡。大模型技術(shù)有時(shí)并不是解決知識(shí)平權(quán)問(wèn)題的良方,相反它會(huì)放大原本存在的個(gè)體間知識(shí)獲取方面的不平等問(wèn)題,即個(gè)體間固有條件差異越大,經(jīng)過(guò)大模型的放大后,其導(dǎo)致的知識(shí)獲取效果差異也越大。人類的提示詞輸入細(xì)微差異經(jīng)過(guò)Transformer模型放大后,機(jī)器會(huì)給出不同水平的輸出。
另一方面,英語(yǔ)知識(shí)生產(chǎn)的中心地位被強(qiáng)化。當(dāng)前大模型數(shù)據(jù)集主要為英文,其他語(yǔ)料則相對(duì)偏少。中國(guó)工程院院士高文曾公開(kāi)表示,全球通用50億大模型數(shù)據(jù)訓(xùn)練集里,中文語(yǔ)料占比僅為1.3%[14]。這種源自語(yǔ)料層面的不平等,對(duì)文化安全等層面也將帶來(lái)深刻影響。哈爾濱工業(yè)大學(xué)長(zhǎng)聘教授劉挺認(rèn)為,語(yǔ)言成為輿論戰(zhàn)武器,而今的大模型能夠自動(dòng)回答問(wèn)題、發(fā)表評(píng)論、撰寫文章,使語(yǔ)言武器自動(dòng)化了,其帶來(lái)的風(fēng)險(xiǎn)難以估量[15]。另外,牛津大學(xué)的一項(xiàng)研究表明,由于開(kāi)放AI(OpenAI)等服務(wù)所采用的服務(wù)器成本衡量和計(jì)費(fèi)的方式,英語(yǔ)輸入和輸出的費(fèi)用要比其他語(yǔ)言低得多,其中簡(jiǎn)體中文的費(fèi)用大約是英語(yǔ)的2倍,西班牙語(yǔ)是英語(yǔ)的1.5倍,而緬甸的撣語(yǔ)(Shan)則是英語(yǔ)的15倍[16]。
2.1.4 弱可解釋性:智能涌現(xiàn)決定AI可預(yù)見(jiàn)性較弱
“涌現(xiàn)”(Emergence)一詞的概念是由劉易斯(George Henry Lewes)于1875年在《生命與心靈問(wèn)題》(Problems of Life and Mind)著作中首次提出的。心理學(xué)家勞埃德·摩根(C. Lloyd Morgan)指出,類似的概念在邏輯學(xué)家密爾(J. S. Mill)和心理學(xué)家文特(W. Wundt)的理論中也能找到,他們普遍認(rèn)同涌現(xiàn)是對(duì)無(wú)法從構(gòu)成先前狀態(tài)的元素中預(yù)測(cè)出來(lái)的新現(xiàn)象的描述?!坝楷F(xiàn)”不同于“結(jié)果”,它通常無(wú)法根據(jù)現(xiàn)有元素進(jìn)行預(yù)測(cè),是一種突現(xiàn),這些對(duì)涌現(xiàn)的定義與現(xiàn)代的定義和討論非常接近[17]。
ChatGPT之類的大語(yǔ)言模型被認(rèn)為具備一定的涌現(xiàn)特征,也是機(jī)器智能的重要標(biāo)志。但也有研究認(rèn)為,大模型所謂的涌現(xiàn)能力是由于研究者選擇的度量標(biāo)準(zhǔn)而產(chǎn)生的,而不是模型行為在規(guī)模擴(kuò)展中發(fā)生了根本變化。所謂的涌現(xiàn)能力會(huì)隨著不同的度量或更好的統(tǒng)計(jì)學(xué)而消失,并且可能不是縮放AI模型的基本屬性[18]。智能涌現(xiàn)一方面導(dǎo)致了AI生成知識(shí)的可解釋性弱,進(jìn)而降低了機(jī)器生成內(nèi)容的可信度;但另一方面也可能是知識(shí)發(fā)現(xiàn)與知識(shí)創(chuàng)新的源泉。
考慮到機(jī)器輸出知識(shí)的精確性和穩(wěn)定性直接關(guān)乎出版行業(yè)對(duì)其生成內(nèi)容的采納程度,因此必須解決機(jī)器生成知識(shí)的可驗(yàn)證、可預(yù)見(jiàn)及可靠性。出版行業(yè)是具有高質(zhì)量標(biāo)準(zhǔn)要求的知識(shí)處理行業(yè),只有經(jīng)過(guò)嚴(yán)格編校程序的知識(shí)才能最終面向公眾進(jìn)行發(fā)布。
2.1.5 弱穩(wěn)健性:知識(shí)輸出結(jié)果的可靠性受制于模型幻覺(jué)程度
大模型輸出的幻覺(jué)(Hallucination)問(wèn)題和穩(wěn)健性(又稱魯棒性)是影響AI生成知識(shí)可靠性中的重要影響因素,也是目前阻礙其在出版領(lǐng)域廣泛應(yīng)用的原因之一,尚未找到徹底解決機(jī)器幻覺(jué)以提升知識(shí)系統(tǒng)穩(wěn)健性的方法。因此,大模型應(yīng)用于知識(shí)生成,需要經(jīng)過(guò)人工環(huán)節(jié)進(jìn)行驗(yàn)證才可用于發(fā)布。大模型幻覺(jué)可分為事實(shí)性幻覺(jué)(Factuality Hallucination)和忠實(shí)性幻覺(jué)(Faithfulness Hallucination)兩類,前者指模型生成內(nèi)容與可驗(yàn)證的現(xiàn)實(shí)世界事實(shí)之間的不一致,后者指生成內(nèi)容與用戶指令或輸入提供的上下文的偏離,以及生成內(nèi)容本身的自洽性。大模型幻覺(jué)來(lái)自預(yù)訓(xùn)練數(shù)據(jù)中的錯(cuò)誤信息和偏見(jiàn),本身的知識(shí)邊界也導(dǎo)致存在領(lǐng)域知識(shí)缺陷和過(guò)時(shí)的事實(shí)知識(shí)[19]。
大模型的幻覺(jué)問(wèn)題與其模擬大腦的學(xué)習(xí)模式也有關(guān)系。心理學(xué)的研究揭示了大腦具備兩類思考系統(tǒng),即系統(tǒng)1和系統(tǒng)2?!半p過(guò)程理論(Dual Process Theory)”也指出了大腦存在兩個(gè)思考系統(tǒng),最早由心理學(xué)家基思·斯坦諾維奇(Keith Stanovich)和理查德·韋斯特(Richard F. West)率先提出[20],后來(lái)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主丹尼爾·卡內(nèi)曼在其著作《思考,快與慢》(Thinking, Fast and Slow)對(duì)其進(jìn)一步闡發(fā)。系統(tǒng)1的運(yùn)行是無(wú)意識(shí)且快速的,不怎么費(fèi)腦力,沒(méi)有感覺(jué),完全處于自主控制狀態(tài)。系統(tǒng)2將注意力轉(zhuǎn)移到需要費(fèi)腦力的大腦活動(dòng)上來(lái),例如復(fù)雜的運(yùn)算[21]。系統(tǒng)1依賴情感、記憶和經(jīng)驗(yàn)對(duì)外界做出迅速判斷,但也容易“上當(dāng)”并產(chǎn)生錯(cuò)覺(jué)。大模型的幻覺(jué)問(wèn)題的產(chǎn)生與其所采取的自監(jiān)督學(xué)習(xí)進(jìn)行預(yù)訓(xùn)練的技術(shù)路徑有關(guān),后者接近大腦系統(tǒng)1的學(xué)習(xí)模式。麻省理工學(xué)院綜合計(jì)算神經(jīng)科學(xué)(ICoN)中心的研究人員發(fā)現(xiàn),當(dāng)他們使用特定類型的自我監(jiān)督學(xué)習(xí)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時(shí),所得模型生成的活動(dòng)模式與執(zhí)行相同任務(wù)的動(dòng)物大腦中看到的活動(dòng)模式非常相似[22]。解決大模型幻覺(jué)問(wèn)題的厚望被寄予在大模型和知識(shí)圖譜技術(shù)的協(xié)同發(fā)展上,知識(shí)圖譜技術(shù)被認(rèn)為是建立可解釋的AI的重要路徑,與大模型技術(shù)具有很好的互補(bǔ)性,正如大腦的兩個(gè)系統(tǒng)相互補(bǔ)充一樣。
2.2 大模型知識(shí)處理方式
人腦通過(guò)從環(huán)境中習(xí)得、加工和生成信息,最終將其作為適應(yīng)環(huán)境的一種方式。在這個(gè)過(guò)程中,人作為目標(biāo),而知識(shí)則成為實(shí)現(xiàn)這一目標(biāo)的手段。大腦的生物神經(jīng)網(wǎng)絡(luò)自帶編解碼能力,大腦既是知識(shí)的生產(chǎn)者也是知識(shí)的獲取者。大模型則借助機(jī)器神經(jīng)網(wǎng)絡(luò)將知識(shí)輸出作為目標(biāo),以人類反饋?zhàn)鳛樵鰪?qiáng)機(jī)器知識(shí)能力的手段。知識(shí)生產(chǎn)就是模型應(yīng)用和結(jié)果調(diào)取的過(guò)程。大模型基于自注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)模型處理人類發(fā)布的存量文本并進(jìn)行知識(shí)發(fā)現(xiàn)與生成,其對(duì)齊能力、泛化能力和更新能力仍然存在一定局限性(見(jiàn)表5)。
3 生成式AI賦能的知識(shí)傳播新形態(tài)
知識(shí)封裝更多是從媒介技術(shù)對(duì)出版產(chǎn)品帶來(lái)的影響出發(fā)考慮生成式AI出版產(chǎn)品的新形態(tài)和新業(yè)態(tài),而知識(shí)傳播更多從用戶知識(shí)獲取的視角來(lái)考慮在生成式AI技術(shù)中介下所形成的用戶獲取知識(shí)和媒介知識(shí)供給的新變化。考慮到OpenAI在產(chǎn)品化方面的豐富經(jīng)驗(yàn)及其帶來(lái)的示范效應(yīng)將波及各行各業(yè),其中也包括出版業(yè)。其已開(kāi)發(fā)的ChatGPT、Sora及正在開(kāi)發(fā)的智能體(AI Agents)等產(chǎn)品類型將預(yù)示著未來(lái)生成式AI應(yīng)用于知識(shí)傳播場(chǎng)景的三個(gè)重要方向,分別是對(duì)話式知識(shí)服務(wù)產(chǎn)品、多模態(tài)知識(shí)大模型及知識(shí)智能體。
3.1 信息交互方式:基于對(duì)話的知識(shí)提取
像ChatGPT之類的生成式AI產(chǎn)品是以對(duì)話形式封裝的信息和知識(shí)系統(tǒng),自然語(yǔ)言成為人機(jī)知識(shí)互動(dòng)的基礎(chǔ),人機(jī)交流始于提示詞(Prompt),終于答案輸出(Output)。類人對(duì)話能力的背后是大模型對(duì)海量文本語(yǔ)料的學(xué)習(xí),包括語(yǔ)言學(xué)知識(shí)和世界性知識(shí)。將大模型視為知識(shí)庫(kù),人類通過(guò)設(shè)計(jì)提示詞,可以很好地提取其中蘊(yùn)含的豐富知識(shí)。有學(xué)者認(rèn)為,AI產(chǎn)品ChatGPT作為數(shù)字智能界面,絕不僅是提供了一個(gè)“類人性”對(duì)話主體,而是實(shí)現(xiàn)了超大語(yǔ)言模型系統(tǒng)與人類感官系統(tǒng)史無(wú)前例的交互,這是一個(gè)嶄新的交互界面,也是一種新型主體樣態(tài),ChatGPT“類人性”形式表面所隱藏的,是超越人類的新型認(rèn)知系統(tǒng)[23]。
在AI對(duì)話式生成系統(tǒng)誕生前,傳統(tǒng)的人機(jī)交互界面大多是圖形用戶界面(Graphical User Interface,GUI),雖然圖形界面設(shè)計(jì)一直強(qiáng)調(diào)用戶體驗(yàn)優(yōu)化,但依然不如自然語(yǔ)言使用來(lái)得直接和普遍。生成式AI采取自然用戶界面(Natural User Interface,NUI),不需要借助圖形交互工具和行為便能夠應(yīng)對(duì)廣泛的知識(shí)交互場(chǎng)景??紤]到自然語(yǔ)言本身可能存在的表達(dá)局限性,目前并不能完全替代圖形交互。“交流的無(wú)奈”“一圖勝千言”現(xiàn)象的存在更是提醒人們不要把通過(guò)自然用戶界面進(jìn)行信息交互看成萬(wàn)能的交流方式。通過(guò)自然用戶界面能夠從大模型中提取知識(shí),意味著大模型被封裝為一種動(dòng)態(tài)供給的知識(shí)庫(kù),知識(shí)主要以文本形式加以存儲(chǔ)。
3.2 多模態(tài)知識(shí)傳播:知識(shí)虛擬可視化與多模態(tài)表示
比斯克(Yonatan Bisk)等[24]曾構(gòu)建了一個(gè)“世界范圍(World Scope)”五層次模型來(lái)表示自然語(yǔ)言處理所需要的不同文本來(lái)源,分別是小規(guī)模語(yǔ)料庫(kù)(世界1)、互聯(lián)網(wǎng)文本(世界2)、多模態(tài)文本(世界3)、具身(世界4)、社交互動(dòng)(世界5),我們正處在世界2向世界3轉(zhuǎn)換的進(jìn)程中,未來(lái)將進(jìn)一步發(fā)展到世界4和世界5。在世界3中,知識(shí)以多模態(tài)的形式生成、傳播和獲取。多模態(tài)生成式AI將加速虛擬出版時(shí)代的到來(lái),知識(shí)的空間可視化表達(dá)、知識(shí)的演化仿真設(shè)計(jì)和知識(shí)的多模態(tài)獲取將成為知識(shí)傳播形態(tài)創(chuàng)新的方向。虛擬化技術(shù)賦能的知識(shí)空間化存儲(chǔ)、空間化計(jì)算和空間化表達(dá),成為多模態(tài)知識(shí)傳播未來(lái)發(fā)展的重要方向。數(shù)字博物館、多模態(tài)計(jì)算[25]及新形態(tài)出版物成為未來(lái)知識(shí)多模態(tài)組織和多模態(tài)傳播的重要形態(tài)。生成式AI技術(shù)與虛擬現(xiàn)實(shí)技術(shù)將進(jìn)一步融合推動(dòng)虛擬內(nèi)容智能生成。
3.3 知識(shí)智能體:從被動(dòng)應(yīng)答到自主行動(dòng)
如果說(shuō)對(duì)話式生成還停留在人機(jī)知識(shí)交流的層面,那么基于大模型的AI智能體(Agents)則超越對(duì)話,目標(biāo)進(jìn)一步指向機(jī)器決策乃至自主行動(dòng),即具身智能(Embodied Artificial Intelligence)。AI智能體將大模型作為大腦,通過(guò)信息交互來(lái)感知外界變化,最終作出自主行動(dòng),實(shí)現(xiàn)特定的任務(wù)。智能體這一概念起源于哲學(xué),其根源可追溯到亞里士多德和休謨等思想家,它描述了擁有欲望、信仰、意圖和采取行動(dòng)能力的實(shí)體。在AI研究領(lǐng)域,智能體是用來(lái)描述展示智能行為并具有自主性、反應(yīng)性、主動(dòng)性和社會(huì)能力等特質(zhì)的實(shí)體,AI智能體通常被認(rèn)為是實(shí)現(xiàn)通用AI(Artificial General Intelligence,AGI)的重要步驟[26]。OpenAI公司AI應(yīng)用研究主管翁麗蓮(Lilian Weng)在一篇關(guān)于AI智能體的網(wǎng)絡(luò)文章中提出了基于大模型構(gòu)建自主智能體的應(yīng)用框架:智能體包括LLM、記憶(Memory)、規(guī)劃技能(Planning)和工具使用(Tool Use)等要素,其中大模型是智能體的大腦,其他是關(guān)鍵的組成部分[27]。大模型未來(lái)將逐漸向大腦功能逼近,在虛擬環(huán)境中成長(zhǎng)并與現(xiàn)實(shí)環(huán)境交互,成為自主適應(yīng)復(fù)雜環(huán)境甚至自主行動(dòng)的智能體。未來(lái)的知識(shí)智能體將可能以自主方式開(kāi)展知識(shí)傳播活動(dòng),進(jìn)而改變?nèi)祟惖闹R(shí)交流方式。
4 結(jié)語(yǔ)
生成式AI是一種知識(shí)封裝技術(shù),它以全面性的知識(shí)占有、自然的人機(jī)交流模式和強(qiáng)大的知識(shí)推理能力改變著人類知識(shí)傳播的形態(tài),將人類帶進(jìn)了生成式傳播的時(shí)代。以知識(shí)傳遞為重要使命的出版業(yè),將不可避免地遭受生成式AI技術(shù)帶來(lái)的沖擊。積極探索生成式AI背景下的新出版方式和新傳播形態(tài),不斷改進(jìn)知識(shí)生產(chǎn)與傳播效果,將為出版業(yè)轉(zhuǎn)型升級(jí)帶來(lái)歷史性重要機(jī)遇。
作者簡(jiǎn)介
易龍,男,博士,中南大學(xué)人文學(xué)院傳媒系主任,副教授。研究方向:數(shù)字出版、智能傳播。
參考文獻(xiàn)
[1]張志強(qiáng),唐舸.網(wǎng)絡(luò)出版研究綜述[J].出版科學(xué),2002(S1):66-73.
[2]徐麗芳.數(shù)字出版:概念與形態(tài)[J].出版發(fā)行研究,2005(7):5-12.
[3]張新雯,陳丹.微版權(quán)概念生成的語(yǔ)境分析及其商業(yè)模式探究[J].出版發(fā)行研究,2016(3):30-32.
[4]馮宏聲,王樞.變革與重塑:出版業(yè)與AI共創(chuàng)未來(lái)[J].數(shù)字出版研究,2023,2(4):1-7.
[5]周葆華.或然率資料庫(kù):作為知識(shí)新媒介的生成智能ChatGPT[J].現(xiàn)代出版,2023(2):21-32.
[6]常江,朱思?jí)?作為知識(shí)生產(chǎn)的數(shù)字出版:媒介邏輯與文化生態(tài)[J].現(xiàn)代出版,2021(5):19-24.
[7]方卿,丁靖佳.AI生成內(nèi)容(AIGC)的三個(gè)出版學(xué)議題[J].出版科學(xué),2023,31(2):5-10.
[8]劉珍,趙云澤.技術(shù)邏輯、實(shí)現(xiàn)方式與現(xiàn)實(shí)邊界:生成式AI對(duì)出版業(yè)的深層影響[J].中國(guó)出版,2023(15):11-16.
[9]易龍.從數(shù)字出版到智能出版:知識(shí)封裝方式的演進(jìn)[J].出版科學(xué),2023,31(1):81-90.
[10]ACKOFF R L. From data to wisdom[J]. Journal of Applied Systems Analysis,1989,16(1):3-9.
[11]毛文濤.出版的當(dāng)下與未來(lái)[J].出版與印刷,2023(6):26-31.
[12]邵文,方曉.陸奇最新演講審定版:大模型帶來(lái)的新范式和新機(jī)會(huì)[EB/OL].(2023-05-13)[2024-01-20].https://www.thepaper.cn/newsDetail_forward_23057456.
[13]陳昌鳳,黃陽(yáng)坤.ChatGPT的知識(shí)功能與人類的知識(shí)危機(jī)[J].現(xiàn)代出版,2023(6):10-18.
[14]羅云鵬.大模型發(fā)展亟需高質(zhì)量“教材”相伴[N].科技日?qǐng)?bào),2024-01-15(06).
[15]劉挺.從ChatGPT談大語(yǔ)言模型及其應(yīng)用[J].語(yǔ)言戰(zhàn)略研究,2023,8(5):14-18.
[16]PETROV A, LA MALFA E, TORR P, et al. Language model tokenizers introduce unfairness between languages[EB/OL]. (2023-10-20)[2024-04-09]. https://arxiv.org/ftp/arxiv/papers/2305/2305.15425.pdf.
[17]EMMECHE C, K?PPE S, STJERNFELT F.Explaining emergence: Towards an ontology of levels[J].Journal for General Philosophy of Science,1997(28):83-117.
[18]SCHAEFFER R, MIRANDA B, KOYEJO S. Are emergent abilities of large language models a mirage?[EB/OL].(2023-05-22)[2024-04-09]. https://arxiv.org/pdf/2304.15004.pdf.
[19]HUANG L, YU W, MA W, et al. A survey on hallucination in large language models: Principles, taxonomy, challenges, and open questions[EB/OL].(2023-11-09)[2024-04-09]. https://arxiv.org/pdf/2311.05232.pdf.
[20]STANOVICH K E, WEST R F. Advancing the rationality debate[J]. Behavioral and brain sciences,2000,23(5):701-717.
[21]丹尼爾·卡尼曼.思考,快與慢[M].胡曉姣,李愛(ài)民,何夢(mèng)瑩,譯.北京:中信出版社,2012:5.
[22]TRAFTON A. The brain may learn about the world the same way some computational models do[EB/OL]. (2023-10-30) [2024-01-28]. https://news.mit.edu/2023/brain-self-supervised-computational-models-1030.
[23]孫瑋,程陶然.AI界面:系統(tǒng)交互的革新[J].新聞?dòng)浾撸?023(8):3-12,61.
[24]BISK Y, HOLTZMAN A, THOMASON J, et al. Experience grounds language[EB/OL].(2020-11-01)[2024-04-09].https://arxiv.org/pdf/2004.10151.pdf.
[25]周葆華,吳雨晴.超越單一模態(tài):多模態(tài)計(jì)算傳播研究的進(jìn)展與前瞻[J].傳媒觀察,2024(1):16-27.
[26]XI Z, CHEN W, GUO X, et al. The rise and potential of large language model based agents: A survey[EB/OL].(2023-09-19)[2024-04-09]. https://arxiv.org/pdf/2309.07864.pdf.
[27]WENG L. LLM powered autonomous agents[EB/OL].(2023-06-23)[2024-01-26].https://lilianweng.github.io/posts/2023-06-23-agent.
Research on New Forms of Knowledge Packaging and Dissemination Driven by Generative Artificial Intelligence
YI Long
School of Humanities, Central South University, 410012, Changsha, China
Abstract: Development of knowledge packaging technology has driven the renewal of publishing forms. Ways in which knowledge is represented, extracted, generated and disseminated continue to evolve from database and search engine technologies to large language model technology. Generative artificial intelligence (GAI) can learn from various data texts and make inferential predictions, thereby outputting knowledge-based content. On the one hand, GAI is widely used in knowledge-packaging products due to its potential for knowledge generation; on the other hand, issues such as data exhaustibility, input dependency, inequality, weak interpretability, and weak robustness highlight the need to pay attention to the potential consequences of GAI. It is profoundly reshaping knowledge dissemination form through dialogical knowledge extraction, multimodal knowledge expression and knowledge agents. Understanding its evolutionary characteristics may lend a hand to better navigate this new type of knowledge system.
Keywords: Generative artificial intelligence; Knowledge packaging; Publishing form; Knowledge dissemination; Large language model