●胡安琪
蘇州科技大學(xué)圖書館,蘇州,215009
2017 年,微軟人工智能少女“小冰”完成了世界首部完全由人工智能創(chuàng)作的詩集《陽光失了玻璃窗》。 2018 年,世界上首個由人工智能創(chuàng)作的肖像畫《埃德蒙·貝拉米》在佳士得拍賣行以43.25 萬美元成交,成為第一幅被拍賣的人工智能藝術(shù)品[1]。 2022 年, OpenAI 的大型語言生成模型ChatGPT 在各大領(lǐng)域掀起熱潮,自公開試用以來,其用戶規(guī)模在兩個月內(nèi)破億,其具有高情商多輪對話和自動生成圖片、文本、代碼、音視頻等能力,深受用戶喜愛。 ChatGPT 的火爆出圈也引起學(xué)界對人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)的高度關(guān)注。 2022 年9 月,中國信息通信研究院發(fā)布了《人工智能生成內(nèi)容(AIGC)白皮書(2022 年)》,其中對AIGC 進行了定義,即AIGC 既是從內(nèi)容生產(chǎn)者角度進行分類的一類內(nèi)容,又是一種內(nèi)容生產(chǎn)方式,還是用于內(nèi)容自動化生成的一類技術(shù)集合[2]。 AIGC 技術(shù)實現(xiàn)了低成本的自動化內(nèi)容生產(chǎn),這一內(nèi)容生產(chǎn)方式的轉(zhuǎn)變將重塑內(nèi)容生產(chǎn)供給行業(yè),推動行業(yè)邁向新臺階。
目前,圖書館的內(nèi)容生產(chǎn)模式仍以專業(yè)生產(chǎn)內(nèi)容(Professional Generated Content,PGC)和用戶生產(chǎn)內(nèi)容(User Generated Content,UGC)為主,這兩種內(nèi)容生產(chǎn)模式的效率并不高且人機交互的智能性不強,從而導(dǎo)致用戶體驗不佳。 AIGC 的出現(xiàn)與發(fā)展,將推動圖書館內(nèi)容生產(chǎn)模式的變革,實現(xiàn)“PGC+UGC”向“PGC+UGC+AIGC”轉(zhuǎn)變。 同時,在國家積極推進全國智慧圖書館體系建設(shè)的背景下,AIGC 的發(fā)展也為智慧圖書館建設(shè)帶來了巨大的機遇。 隨著AIGC 技術(shù)的不斷成熟和應(yīng)用場景的大規(guī)模普及,以及圖書館智能化要求的提高,未來AIGC 在智慧圖書館內(nèi)容生產(chǎn)中的比重將大幅提升。
現(xiàn)代圖書館正在經(jīng)歷從數(shù)字圖書館向智慧圖書館的變革,人工智能技術(shù)的出現(xiàn)與優(yōu)化加速了這一進程,同時也推動了圖書館內(nèi)容生產(chǎn)模式由“PGC”向“PGC+UGC”再向“PGC+UGC+AIGC”演化。
PGC 是數(shù)字圖書館建設(shè)初期的主要內(nèi)容生產(chǎn)模式,此時的互聯(lián)網(wǎng)是靜態(tài)互聯(lián)網(wǎng),其資源組織方式還是經(jīng)典的目錄式分類[3],內(nèi)容的創(chuàng)建及發(fā)布權(quán)主要在專業(yè)人員手中,他們借助鼠標(biāo)、鍵盤等傳統(tǒng)輸入設(shè)備生產(chǎn)內(nèi)容,用戶只能通過圖書館官方網(wǎng)頁瀏覽內(nèi)容,無法參與到內(nèi)容的生產(chǎn)過程中。 該模式生產(chǎn)的內(nèi)容具有較強的專業(yè)性,因而生產(chǎn)的內(nèi)容質(zhì)量較高,但其內(nèi)容生產(chǎn)規(guī)模有限,內(nèi)容生產(chǎn)成本會隨著內(nèi)容生產(chǎn)量的增加而不斷提升[4]。
數(shù)字圖書館向智慧圖書館過渡的主要內(nèi)容生產(chǎn)模式是UGC,但這并不意味著對PGC 的摒棄,而是二者的疊加,即“UGC+PGC”。 在圖書館轉(zhuǎn)型發(fā)展的過渡時期,移動互聯(lián)網(wǎng)、社交媒體等平臺大量涌現(xiàn)[5],內(nèi)容生成及發(fā)布權(quán)由專家讓渡給用戶,用戶通過語音操作、隔空手勢識別等方式生產(chǎn)錄入內(nèi)容,成為內(nèi)容生產(chǎn)的中堅力量。 用戶從自身需求出發(fā)生產(chǎn)內(nèi)容,內(nèi)容呈現(xiàn)出個性化、多元化等特征,并借助平臺推薦系統(tǒng)觸達具有類似需求的用戶。 該模式生產(chǎn)的內(nèi)容呈現(xiàn)規(guī)?;卣?在很大程度上豐富了圖書館的資源,但其背后存在內(nèi)容質(zhì)量參差不齊的問題,用戶的內(nèi)容生產(chǎn)很難在保證內(nèi)容質(zhì)量和原創(chuàng)性的情況下兼顧更新頻率。 因此,此種內(nèi)容生產(chǎn)模式引發(fā)的效率問題亟待解決。
AIGC 將成為智慧圖書館時代標(biāo)志性的內(nèi)容生產(chǎn)模式,在智慧圖書館發(fā)展階段,內(nèi)容生產(chǎn)模式轉(zhuǎn)變?yōu)椤癙GC+UGC+AIGC”。 AIGC 是利用人工智能技術(shù)驅(qū)動機器創(chuàng)作內(nèi)容,目前主要用于生成文本、圖像、音頻、視頻等模態(tài)的信息。 早期的AIGC 基于小模型展開,為了與特定場景任務(wù)相匹配,這類模型需要特殊的標(biāo)注數(shù)據(jù)訓(xùn)練,因此,該模型通用性較差,無法任意遷移。 2014 年,生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)誕生,使AIGC 轉(zhuǎn)向大模型領(lǐng)域,在大數(shù)據(jù)、大算力與強算法的支撐下,AIGC實現(xiàn)了各種模態(tài)內(nèi)容的生成。 2022 年11 月,OpenAI 發(fā)布了ChatGPT,以此為代表的大模型AIGC 能夠以對話的方式,在理解用戶問題和上下文語境的基礎(chǔ)上滿足用戶多樣化的信息需求,并且可以在提問和回答的交互中通過基于強人工反饋的自主學(xué)習(xí)完成與用戶的共同進步[6]。 AIGC 具有內(nèi)容生產(chǎn)規(guī)模大、質(zhì)量高、單位成本低的優(yōu)勢,將成為智慧圖書館的主要內(nèi)容生產(chǎn)模式。 未來,隨著AIGC模型的迭代更新,智慧圖書館內(nèi)容將不斷創(chuàng)新和發(fā)展。
目前,AIGC 能夠?qū)崿F(xiàn)文本、圖像、音頻、視頻等不同模態(tài)數(shù)據(jù)的生成與相互轉(zhuǎn)換,將其應(yīng)用于智慧圖書館建設(shè),自然離不開底層支撐技術(shù)。 其中,計算機視覺技術(shù)、自然語言處理技術(shù)、多模態(tài)大模型技術(shù)作為AIGC 的關(guān)鍵技術(shù)支撐,將推動智慧圖書館海量數(shù)字內(nèi)容的孿生、編輯和創(chuàng)作[7]。
智慧圖書館數(shù)字孿生是指將現(xiàn)實圖書館中的物理屬性(如物體的大小、形狀、顏色等)和社會屬性(如主體行為、主體間關(guān)系等)進行數(shù)字化,建立從現(xiàn)實圖書館到虛擬圖書館的映射。 智慧圖書館數(shù)字孿生需要運用計算機視覺技術(shù)中的智能增強和智能轉(zhuǎn)譯技術(shù)。 智慧圖書館在數(shù)據(jù)內(nèi)容采集、存儲、傳輸過程中可能會出現(xiàn)數(shù)據(jù)缺失、損壞等現(xiàn)象,運用智能增強技術(shù)可以消除上述問題,將原有的低質(zhì)量原始數(shù)據(jù)經(jīng)過增強后生成高質(zhì)量數(shù)字內(nèi)容,使現(xiàn)實中的數(shù)據(jù)內(nèi)容在虛擬世界中完成數(shù)字孿生并重構(gòu)完整的客觀世界。 相比于智能增強技術(shù),智能轉(zhuǎn)譯技術(shù)更加注重不同模態(tài)數(shù)字內(nèi)容間的相互理解、融合和轉(zhuǎn)換。 在智慧圖書館建設(shè)進程中產(chǎn)生了大量文本、圖像、音頻、視頻等多模態(tài)數(shù)據(jù),為了與某些特定的服務(wù)場景相適應(yīng),需要進行大量的數(shù)據(jù)內(nèi)容轉(zhuǎn)換。 例如,利用智能轉(zhuǎn)譯技術(shù)將語音信息進行字幕合成,依據(jù)文本內(nèi)容進行語音轉(zhuǎn)換,甚至是將給定的圖像、視頻轉(zhuǎn)換成文本、語音等[8]。
智慧圖書館內(nèi)容編輯旨在對虛擬世界進行編輯,從而直接對物理世界產(chǎn)生作用,實現(xiàn)實時反饋和互動。 智慧圖書館內(nèi)容編輯需要運用到自然語言處理技術(shù)中的語義理解技術(shù)和屬性控制技術(shù)。 語義理解技術(shù)是對數(shù)字內(nèi)容進行編輯的基礎(chǔ),智慧圖書館包含的數(shù)字內(nèi)容大多以多模態(tài)形式呈現(xiàn),且內(nèi)容由多種不同的語義信息組成,早期的語義理解技術(shù)無法處理語義糾纏問題,隨著自然語言處理技術(shù)的進一步發(fā)展,基于生成模型的可解耦語義學(xué)習(xí)技術(shù)誕生,通過理解并學(xué)習(xí)不同語義成分的變化,可解耦語義學(xué)習(xí)技術(shù)對數(shù)據(jù)內(nèi)容有更深刻的理解。 在語義理解技術(shù)的基礎(chǔ)上,數(shù)字內(nèi)容的智能屬性控制技術(shù)將直接根據(jù)用戶給定的屬性,對原有數(shù)字內(nèi)容進行修改、編輯。 屬性控制技術(shù)可以被運用于智能圖像編輯、文本改寫、智能調(diào)音等工作任務(wù)中,從而提高智慧圖書館數(shù)字內(nèi)容的創(chuàng)作效率。
智慧圖書館內(nèi)容創(chuàng)作可以分為基于模仿的創(chuàng)作和基于概念的創(chuàng)作。 基于模仿的創(chuàng)作需要人工智能模型先觀察人類的作品,通過學(xué)習(xí)這類作品的外部特征和內(nèi)在特征,然后進行模仿式的創(chuàng)作。 2018年,世界上首個出售的人工智能藝術(shù)品就是人工智能模型基于模仿創(chuàng)作的佳品。 基于概念的創(chuàng)作不再是簡單地對某一類型的作品進行觀察和模仿,而是致力于在海量數(shù)據(jù)中學(xué)習(xí)抽象的概念,進而通過對不同概念的組合進行全新創(chuàng)作。 基于概念的創(chuàng)作需要依賴算法模型對多模態(tài)數(shù)據(jù)進行理解、融合及生成,多模態(tài)大模型技術(shù)的迭代升級為智慧圖書館基于概念的創(chuàng)作帶來了極大的發(fā)揮空間。 多模態(tài)大模型技術(shù)主要用于尋找不同模態(tài)數(shù)據(jù)間的對應(yīng)關(guān)系以及實現(xiàn)不同模態(tài)數(shù)據(jù)間的相互轉(zhuǎn)化和生成。 基于多模態(tài)大模型技術(shù),AIGC 具備了更加接近人類的創(chuàng)作能力。 例如,近期火爆的ChatGPT,在極大程度上繁榮了內(nèi)容市場,在內(nèi)容創(chuàng)作領(lǐng)域發(fā)揮了巨大價值。
AIGC 正越來越多地參與數(shù)字內(nèi)容的創(chuàng)意生產(chǎn)工作,以人機協(xié)同的方式釋放價值,成為新一代互聯(lián)網(wǎng)的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施。 智慧圖書館建設(shè)的重點目標(biāo)是為廣大用戶群體提供智慧化服務(wù),AIGC 在底層技術(shù)支撐下將推動智慧圖書館跨越式發(fā)展,同時呈現(xiàn)出用戶體驗升級、內(nèi)容生產(chǎn)效率高、個性化特征顯著、雙向?qū)崟r交互增強等內(nèi)在特征。
區(qū)塊鏈、人工智能、虛擬現(xiàn)實、5G/6G 等技術(shù)的迅猛發(fā)展,推動智慧圖書館向元宇宙空間延伸,實現(xiàn)“在線”向“在場”轉(zhuǎn)變,AIGC 將成為打造圖書館虛擬世界的重要基石。 AIGC 除了能夠生產(chǎn)文本、圖片、音頻、視頻等二維內(nèi)容,還能結(jié)合虛擬現(xiàn)實技術(shù)生產(chǎn)三維的立體物、場景及數(shù)字人。 在AIGC 技術(shù)的支撐下,用戶能夠在虛擬場館中體驗各種文化活動,用手觸摸三維立體書籍、文化藝術(shù)品等,還能與各類用戶的虛擬化身進行實時交互,包括對話、握手、共同合作完成某項任務(wù)等,當(dāng)用戶的視覺、聽覺、觸覺、嗅覺、味覺等多感官交織在一起時,用戶體驗將產(chǎn)生跨越式提升。
AIGC 賦能智慧圖書館建設(shè)的一個顯著特征是內(nèi)容生產(chǎn)效率大幅度提高。 相較于PGC 和UGC,AIGC 可以在很短時間內(nèi)生成大量數(shù)字內(nèi)容,使其服務(wù)于智慧圖書館建設(shè)。 隨著多模態(tài)大模型的不斷優(yōu)化,AIGC 能夠從大量數(shù)據(jù)中學(xué)習(xí)并識別人類無法發(fā)現(xiàn)的復(fù)雜內(nèi)容。 因此,未來AIGC 可能在內(nèi)容生成質(zhì)量上超越人類。 此外,AIGC 還具有規(guī)模遞減優(yōu)勢,即隨著AIGC 生產(chǎn)內(nèi)容規(guī)模的擴大,單位內(nèi)容產(chǎn)生的邊際成本趨近于零。 此外,AIGC 賦能下的人機協(xié)同生產(chǎn)模式能夠釋放工作人員的時間和精力,將部分程序化任務(wù)交由人工智能完成,工作人員則能夠?qū)⒏嗑W⒂诜?wù)形式及內(nèi)容的深度創(chuàng)新,從而不斷提高內(nèi)容生產(chǎn)效率。
以ChatGPT 為代表的AIGC 模型擁有對話情境理解能力,該能力能夠依據(jù)用戶的歷史對話信息理解用戶實際知識需求,并結(jié)合當(dāng)前學(xué)習(xí)內(nèi)容,為用戶提供個性化學(xué)習(xí)支持[9-10]。 同時,AIGC 還能夠通過多輪對話發(fā)現(xiàn)用戶對某些內(nèi)容的錯誤理解,進而及時糾正,為用戶提供符合其年齡、身份的個性化內(nèi)容。 此外,AIGC 技術(shù)還能夠與云計算、大數(shù)據(jù)等技術(shù)緊密結(jié)合,全面記錄用戶的個人身份信息、借閱信息及搜索信息,并不斷模仿人腦的思維方式進行自主學(xué)習(xí)[11],主動分析用戶的多樣化信息需求,提取關(guān)鍵信息,從而為用戶進行個性化服務(wù)推薦[12],實現(xiàn)內(nèi)容服務(wù)的精準(zhǔn)觸達。
從人工智能的實踐成果來看,目前,AI 交互類產(chǎn)品種類很多,但早期的AI 交互類產(chǎn)品大多以“語義預(yù)定義型”規(guī)則為主,這些AI 交互類產(chǎn)品可以輔助用戶進行交互行為,但它們是基于用戶的習(xí)慣性行為需求而產(chǎn)生的,因此,不會對用戶交互行為生態(tài)產(chǎn)生重要影響。 而內(nèi)容生成式AI 產(chǎn)品聚焦于“語義生成型”規(guī)則,在尊重用戶習(xí)慣性交互行為的前提下,又具有一定的行為方式引導(dǎo)性,進而從根本上重塑了用戶交互行為的生態(tài)結(jié)構(gòu)[13]。 ChatGPT 聊天機器人模型是內(nèi)容生成式AI 的代表性產(chǎn)品,其能夠?qū)W習(xí)并理解人類語言,與用戶進行自然、連貫的多輪對話[14],能夠?qū)τ脩籼岢龅膯栴}產(chǎn)生質(zhì)疑,并為用戶提供多種解決方案。 當(dāng)智慧圖書館引入AIGC類產(chǎn)品,用戶與機器、環(huán)境的交互模式將發(fā)生重大轉(zhuǎn)變,交互的即時性和高效性將顯著提升。
目前,人工智能時代已經(jīng)到來,智慧圖書館必須緊緊抓住AIGC 的時代機遇。 在計算機視覺、自然語言處理、多模態(tài)大模型等底層技術(shù)的支撐下,將用戶體驗升級、內(nèi)容生產(chǎn)效率高、個性化特征顯著、雙向?qū)崟r交互增強等內(nèi)在特征作為AIGC 與智慧圖書館融合發(fā)展的運行邏輯,積極探索AIGC 賦能下的智慧圖書館建設(shè)場景與應(yīng)用,從而推動智慧圖書館內(nèi)容生態(tài)螺旋式上升發(fā)展。
智慧圖書館時代也是“模型”主導(dǎo)內(nèi)容生成的時代,以人為主的知識生產(chǎn)將被以機器為主的內(nèi)容生產(chǎn)取代。 因此,智慧圖書館可以利用AIGC 技術(shù)打造全新的智慧生產(chǎn)系統(tǒng)。 智慧圖書館的智慧生產(chǎn)系統(tǒng)包括兩大部分:一是原有館藏資源的數(shù)字孿生,即將AIGC 與計算機圖形學(xué)、區(qū)塊鏈等技術(shù)相結(jié)合,將智慧圖書館館藏資源以數(shù)字孿生的形式進行復(fù)刻,實現(xiàn)實體館藏數(shù)字化。 通過這種方式,將會實現(xiàn)館藏資源在虛擬空間的永續(xù)保存。 二是原生數(shù)字資源生產(chǎn),AIGC 技術(shù)支撐下的原生數(shù)字資源生產(chǎn)需要依靠多模態(tài)通用大模型、強算力和大規(guī)模訓(xùn)練數(shù)據(jù),而圖書館是數(shù)據(jù)內(nèi)容的聚集地,除了擁有書目、論文、專利等文獻資源數(shù)據(jù)和用戶個人資料、閱讀行為等用戶數(shù)據(jù)[15],還包括各種傳感器動態(tài)實時捕捉的智慧圖書館環(huán)境狀態(tài)數(shù)據(jù)[16],這些數(shù)據(jù)將融入AIGC 的整體架構(gòu)中,成為預(yù)訓(xùn)練數(shù)據(jù)的一部分。AIGC 賦能下的智慧圖書館不僅可以大規(guī)模生產(chǎn)出文本、圖片、音頻、視頻等內(nèi)容,還能進一步生產(chǎn)出3D 物品、虛擬場景、數(shù)字人等內(nèi)容,并實現(xiàn)多模態(tài)數(shù)據(jù)內(nèi)容的轉(zhuǎn)換生成。 2022 年9 月,谷歌發(fā)布了文本生成3D 模型工具DreamFusion,同年12 月,英偉達在NeurIPS 上展示了AIGC 模型GET3D,該模型具備生成具有顯示紋理的3D 網(wǎng)格的能力,可根據(jù)2D圖像快速合成3D 物體,這2 個模型在生成速度和分辨率上都在不斷升級,智慧圖書館可以借助此類工具重塑圖書館內(nèi)容生態(tài),拓寬現(xiàn)實世界和虛擬世界的邊界,為用戶提供虛實融合的沉浸式體驗。
在數(shù)字圖書館信息檢索過程中,用戶需要對檢索詞的組合進行反復(fù)試驗和修正才能檢索出所需答案,如果想要進行更加精準(zhǔn)的檢索,還需要具備一定的檢索技能和知識,因而大多數(shù)用戶的檢索效率不高。 當(dāng)AIGC 技術(shù)及其代表性產(chǎn)品出現(xiàn)后,智慧圖書館可以借此打造智慧化檢索系統(tǒng),實現(xiàn)“生成式檢索”,該系統(tǒng)以自然語言處理、機器學(xué)習(xí)、計算機視覺、人機交互、數(shù)據(jù)挖掘等技術(shù)為支撐[17],檢索依托的終端設(shè)備可以是手機、平板、穿戴設(shè)備等。 當(dāng)用戶輸入文本、圖像、音頻、視頻等多模態(tài)自然語言查詢請求時,系統(tǒng)首先將用戶的多模態(tài)自然語言轉(zhuǎn)換成特定的知識表達形式,并利用AI 的內(nèi)容理解、知識學(xué)習(xí)、計算推理等技術(shù)[18]以可視化方式向用戶輸出個性化、智慧化的答案。
數(shù)字圖書館信息內(nèi)容傳播主要依靠的是館員,但此種傳播模式在服務(wù)時間、服務(wù)內(nèi)容和服務(wù)質(zhì)量上不可控[19]。 隨著人工智能技術(shù)的普及和發(fā)展,圖書館陸續(xù)開發(fā)了各類機器人承擔(dān)信息傳播任務(wù)。 例如,清華大學(xué)圖書館開發(fā)了基于AI 標(biāo)記語言的機器人“小圖”,上海交通大學(xué)圖書館開發(fā)了基于MSN的聊天機器人“小交”[20],但此類型的機器人目前還無法處理復(fù)雜的用戶需求。 ChatGPT 的火爆出圈使GPT 技術(shù)被高度關(guān)注,智慧圖書館可以將GPT 技術(shù)與機器人技術(shù)進行有效結(jié)合,開發(fā)更適合特定服務(wù)場景的智能聊天機器人,構(gòu)建智慧圖書館的智慧傳播系統(tǒng)。 在該系統(tǒng)中,用戶可以運用自然語言與系統(tǒng)進行交流,系統(tǒng)可以有效識別用戶聲音、表情、行為及所處環(huán)境[21],通過語義分析、機器學(xué)習(xí)和計算機視覺等技術(shù),準(zhǔn)確理解用戶意圖,快速搜索與用戶最為匹配的信息,并根據(jù)語料庫中的知識計算出最佳答案,將答案進行智慧化推送。 同時,該系統(tǒng)還能夠在多輪人機交互過程中不斷優(yōu)化模型,以更加智慧化的形式為用戶提供知識服務(wù)。
AIGC 可以輔助智慧圖書館創(chuàng)建智慧化學(xué)習(xí)評估系統(tǒng)[22],在學(xué)習(xí)開始前,人工智能系統(tǒng)可以針對用戶以可視化的形式生成用戶自身情況分析報告,讓用戶明晰自身原有的知識結(jié)構(gòu),從而選擇合適的學(xué)習(xí)方向。 在學(xué)習(xí)過程中,人工智能系統(tǒng)將實時收集用戶在整個學(xué)習(xí)過程中的數(shù)據(jù),包括表情數(shù)據(jù)、動作數(shù)據(jù)、心理變化數(shù)據(jù)、生理反應(yīng)數(shù)據(jù)等,針對這些結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),運用大數(shù)據(jù)分析技術(shù)、數(shù)據(jù)挖掘技術(shù)進行關(guān)聯(lián)規(guī)則分析、回歸分析、聚類分析[23],形成智能化評估報告,并通過云服務(wù)推送給用戶[24],幫助用戶了解當(dāng)前學(xué)習(xí)狀態(tài)和挑戰(zhàn),從而為用戶提供個性化的學(xué)習(xí)建議。 在學(xué)習(xí)結(jié)束后,人工智能系統(tǒng)將以可視化的形式展現(xiàn)用戶在整個學(xué)習(xí)過程中的認知學(xué)習(xí)圖譜,讓用戶了解自身認知遷移變化,同時,該系統(tǒng)還能夠?qū)⒃u估結(jié)果與其他利益相關(guān)者共享。 在人類反饋強化學(xué)習(xí)機制支持下,人工智能系統(tǒng)甚至能夠分析用戶對評估結(jié)果的反應(yīng)。AIGC 支撐下的智慧化學(xué)習(xí)評估系統(tǒng)將重塑智慧圖書館評價模式,使其向智能化、智慧化方向發(fā)展。
AIGC 時代已來臨,智慧圖書館應(yīng)當(dāng)借助計算機視覺、自然語言處理、多模態(tài)大模型等技術(shù)變革機遇,在新的運行邏輯下針對多元化生產(chǎn)、生成式檢索、精準(zhǔn)化傳播、個性化評估等服務(wù)場景,通過完善基礎(chǔ)語料庫建設(shè)、訓(xùn)練高質(zhì)量大型語言模型、提升相關(guān)人員數(shù)字素養(yǎng)、升級智慧圖書館基礎(chǔ)設(shè)施等手段,推動智慧圖書館的發(fā)展躍上新臺階。
AIGC 技術(shù)應(yīng)用的關(guān)鍵在于海量多源多模態(tài)數(shù)據(jù)資源,智慧圖書館作為數(shù)據(jù)資源的聚集地,擁有強大的數(shù)據(jù)基礎(chǔ)。 其不僅擁有圖書、期刊、專利等靜態(tài)館藏數(shù)據(jù),也包含用戶借還書、查詢、參考咨詢、薦購等動態(tài)數(shù)據(jù),同時還涉及各種傳感器動態(tài)實時捕捉的圖書館環(huán)境狀態(tài)數(shù)據(jù)。 將這些海量的數(shù)據(jù)資源作為AIGC 的“燃料”和“驅(qū)動力”,可以為圖書館生產(chǎn)適應(yīng)各大場景的文本、圖片、視頻、音頻等數(shù)據(jù)內(nèi)容,但這也存在一些問題,諸如數(shù)據(jù)標(biāo)注費時費力、數(shù)據(jù)多樣化不足、數(shù)據(jù)獲取與使用面臨隱私保護的挑戰(zhàn)等。 因此,圖書館需要探索新的路徑來完善基礎(chǔ)語料庫建設(shè)。 而合成數(shù)據(jù)可以幫助圖書館解決上述問題,其是計算機模擬技術(shù)或算法創(chuàng)建、生成的自標(biāo)注信息,可以在數(shù)學(xué)或統(tǒng)計學(xué)層面反映真實世界數(shù)據(jù)的屬性,能夠作為真實世界數(shù)據(jù)的替代品來訓(xùn)練、測試AI 模型[25]。 圖書館利用合成數(shù)據(jù)技術(shù)可以改善數(shù)據(jù)質(zhì)量、避免用戶隱私泄露、增加數(shù)據(jù)多樣性、提升AI 模型訓(xùn)練速度和效果。 因此,未來可以將合成數(shù)據(jù)納入智慧圖書館基礎(chǔ)語料庫建設(shè),推動智慧圖書館的可持續(xù)化發(fā)展。
AIGC 將重塑智慧圖書館信息檢索新范式,基于海量文獻數(shù)據(jù)訓(xùn)練高質(zhì)量的大型語言模型是將人工智能模型嵌入智慧圖書館檢索服務(wù)中的關(guān)鍵。 大型語言模型的訓(xùn)練和學(xué)習(xí)是文本生成的核心,并且大型語言模型具備易擴展性,能夠?qū)崿F(xiàn)跨模態(tài)的知識沉淀,同時,還能夠利用海量無標(biāo)注文本進行預(yù)訓(xùn)練。 智慧圖書館可以參考基于人類反饋的強化學(xué)習(xí)思路,以圖書館海量文獻數(shù)據(jù)、用戶行為數(shù)據(jù)、空間環(huán)境數(shù)據(jù)等為基礎(chǔ)構(gòu)建大規(guī)模語言模型,通過反復(fù)測試、迭代,不斷優(yōu)化,使其在關(guān)鍵詞生成、文獻分類、智能問答、文本相似性計算、摘要生成、情感分析等圖書館檢索服務(wù)中發(fā)揮價值。
內(nèi)容傳播效率的提升除了需要依靠智能機器設(shè)備,還需要依賴高數(shù)字素養(yǎng)的館員和用戶。 一方面,AIGC 技術(shù)的準(zhǔn)入門檻較高,圖書館館員中擁有人工智能專業(yè)背景及相關(guān)技術(shù)的人員并不多。 另一方面,AIGC 與智慧圖書館深度融合后會引發(fā)系列問題,諸如知識產(chǎn)權(quán)歸屬與認定困難、虛假信息與錯誤信息泛濫、用戶個人隱私信息泄露 、算法歧視等。因此,智慧圖書館在引入AIGC 技術(shù)之前,需要配備AIGC 技術(shù)團隊,通過提供后期專業(yè)學(xué)習(xí)和定期培訓(xùn)的形式打造適應(yīng)各種場景應(yīng)用開發(fā)的復(fù)合型人才隊伍,提升內(nèi)部人員的數(shù)字素養(yǎng)。 同時,圖書館需要通過常規(guī)培訓(xùn)與制度安排,培養(yǎng)工作人員及用戶的AIGC 技術(shù)風(fēng)險認知、個人隱私信息保護意識、AIGC生產(chǎn)虛假信息鑒別能力,以提升工作人員和用戶的數(shù)字素養(yǎng)。 此外,圖書館還可以聯(lián)合相關(guān)部門制定一套適合我國本土發(fā)展的用戶數(shù)字素養(yǎng)評價指標(biāo)體系,通過評價與反饋不斷優(yōu)化數(shù)字素養(yǎng)提升路徑。
基礎(chǔ)設(shè)施是AIGC 生產(chǎn)數(shù)據(jù)、存儲數(shù)據(jù)、分析數(shù)據(jù)和利用數(shù)據(jù)的載體,也是推動智慧圖書館發(fā)展的支撐力量,因此,升級圖書館基礎(chǔ)設(shè)施是打造智慧圖書館智慧評估系統(tǒng)的基礎(chǔ)和保障。 首先,AIGC 在智慧圖書館中的應(yīng)用對算力提出了較高要求。 例如,GPT-3. 5 模型采用了海量的訓(xùn)練數(shù)據(jù),擁有超過1 750 億個參數(shù),其在Azure AI 基礎(chǔ)設(shè)施上進行訓(xùn)練,總算力需要消耗3 640 PF-days(即假如每秒計算1 000 萬億次,需要計算3 640 天)。 然而,目前絕大多數(shù)圖書館無法獨立承擔(dān)如此龐大的算力供給,因此,圖書館可以借助企業(yè)設(shè)施和國家工程提高算力。 例如,圖書館可以依托企業(yè)GPU 云服務(wù)器和國家“東數(shù)西算”工程,利用API 接口調(diào)用相關(guān)應(yīng)用程序來打造智慧圖書館基礎(chǔ)設(shè)施體系。 其次,圖書館應(yīng)當(dāng)投入一定的資金來購買智能可穿戴設(shè)備。 例如,美國羅得島大學(xué)圖書館已將可穿戴技術(shù)引入圖書館中,用戶借助可穿戴設(shè)備可以自由進行閱讀、學(xué)習(xí)和交流,圖書館繼而收集可穿戴設(shè)備中的多模態(tài)數(shù)據(jù),利用人工智能模型對用戶的生理和行為數(shù)據(jù)進行綜合分析和評估。 由此可見,AIGC 與可穿戴技術(shù)的結(jié)合,對智慧圖書館建立強大的智慧評估系統(tǒng)十分關(guān)鍵。
AIGC 的內(nèi)容創(chuàng)造力、跨模態(tài)融合及認知交互力等技術(shù)優(yōu)勢將進一步推動圖書館傳統(tǒng)服務(wù)模式的轉(zhuǎn)型,逐步實現(xiàn)“AIGC+”的智慧化服務(wù)模式。 未來AIGC 在智慧圖書館中的應(yīng)用場景將進一步拓展,結(jié)合區(qū)塊鏈、虛擬現(xiàn)實等技術(shù),最終實現(xiàn)場景間的深度融合,構(gòu)筑虛實融合的“自生成、自更新”[26]的新型內(nèi)容生態(tài)。 但不可否認的是,目前AIGC 技術(shù)發(fā)展還不夠成熟,將其應(yīng)用于智慧圖書館建設(shè)還存在一些難點。 因此,在智慧圖書館建設(shè)進程中,應(yīng)當(dāng)提前制定好AIGC 戰(zhàn)略性發(fā)展框架,通過單點局部建設(shè),逐步推動整體發(fā)展。