摘? ?要:近年來,在算法、數(shù)據(jù)和算力的綜合推動下,生成式人工智能(AIGC)的發(fā)展進入爆發(fā)期,AIGC的應用在各行業(yè)迅速展開。對圖書館行業(yè)來說,AIGC的應用可大大提升用戶體驗,為圖書館創(chuàng)新服務模式和內(nèi)容帶來無限可能,但也潛藏著諸多不利因素。如何規(guī)避風險,最大化利用AICG助力圖書館發(fā)展,需要圖書館提前謀劃,制定出有效的應對策略。
關鍵詞:生成式人工智能;AIGC ChatGPT;圖書館
中圖分類號:G251? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023021
Abstract The advent of Artificial Intelligence Generated Content(AIGC), exemplified by OpenAI's large-scale model ChatGPT, has garnered global attention and sparked a new wave of AI revolution. While AIGC offers opportunities for intelligent information retrieval, transformative library experiences, and the development of metaverse libraries, it also has the potential to alter readers' search and reading habits, amplifying the existing technology and talent shortages in libraries. There are also risks involved, including copyright infringement and privacy breaches. To address these challenges, libraries can begin by enhancing and expanding their services through the implementation of chatbots and exploring the use of open-source models to train on existing library literature data. It is crucial for libraries to proactively address and mitigate the risks associated with the application of AIGC.
Key words Artificial Intelligence Generated Content(AIGC);ChatGPT; intelligent libraries, intelligent retrieval;opportunities; strategies
2022年11月30 日,由美國人工智能研究公司OpenAI研發(fā)的生成式人工智能聊天機器人程序ChatGPT正式上線,短短5天內(nèi)注冊用戶數(shù)就突破百萬,到2023年1月末,其活躍用戶數(shù)已達到1億,成為史上活躍用戶增長最快的應用程序。ChatGPT的推出引發(fā)了相關領域企業(yè)的強烈反映。2月2日,OpenAI的合作伙伴微軟公司宣布旗下所有產(chǎn)品將全線整合ChatGPT,包括搜索引擎必應、Office以及云計算平臺Azure等,使微軟的所有產(chǎn)品具備AI能力。在國內(nèi),2月8日,阿里巴巴確認正在研發(fā)“阿里版聊天機器人ChatGPT”;2月10日,京東宣布了其產(chǎn)業(yè)版ChatGPT——智能人機對話平臺ChatJD的落地應用路線圖;3月16日,百度正式發(fā)布其生成式AI產(chǎn)品“文心一言”。與此同時,ChatGPT更是引發(fā)了各行各業(yè)對生成式人工智能應用場景及其對各行業(yè)影響的大討論,甚至已經(jīng)在為AIGC可能帶來的社會變革做好準備??梢灶A見,作為通用型多任務人工智能對話系統(tǒng)的一個里程碑,ChatGPT的推出將引發(fā)更多的機構(gòu)加入到AIGC的應用及開發(fā)中來,對包括圖書館在內(nèi)的各個行業(yè)也必將產(chǎn)生深遠影響。本文通過分析生成式人工智能(AIGC)的特點、發(fā)展趨勢及圖書館應用AIGC面臨的機遇與挑戰(zhàn),提出圖書館的應對策略,以期為業(yè)界的相關研究和實踐提供參考。
1? ?AIGC的特點及發(fā)展趨勢
2014年,由前谷歌大腦研究科學家Lan Goodfellow等首次提出的生成對抗網(wǎng)絡模型(GAN)被認為是生成式人工智能發(fā)展的開端[1]。GAN使用兩個相互對立的神經(jīng)網(wǎng)絡即生成器和識別器經(jīng)過交替周期訓練賦予了人工智能深度學習模型以想象力,使其更接近人類思維[2]。而近幾年來,隨著新的模型結(jié)構(gòu)如Transformer等的出現(xiàn)以及硬件能力的不斷提升,具有龐大數(shù)據(jù)參數(shù)的生成式人工智能大模型逐漸代替了之前的小模型,如OpenAI的GPT-3已經(jīng)具有1750億參數(shù)、96層Transformer解碼器[3]。由于參數(shù)越多的模型其表現(xiàn)越出色,加上軟硬件技術的發(fā)展提供的巨大算力,2022年ChatGPT的出現(xiàn),使生成式人工智能的發(fā)展迎來了爆發(fā)期[4]。綜合來看,目前AIGC有如下特點及發(fā)展趨勢:
(1)基礎生成算法模型的不斷突破創(chuàng)新使AIGC能夠創(chuàng)造和生成內(nèi)容的類型日益多元,質(zhì)量也在不斷提升。除初期的GAN之外,近幾年涌現(xiàn)出一大批性能穩(wěn)定、各具特色的基礎生成算法模型,如2015年Stability AI推出的能夠根據(jù)文本描述生成高質(zhì)量圖像的diffusion模型,2017年谷歌推出的可并行、通用性強的Transformer模型,2021年初OpenAI推出的擁有強大特征抽取能力、能夠?qū)D像和任意文本聯(lián)系起來CLIP模型等。尤其是2022年,AI生成模型更是層出不窮,如文本-圖像生成模型Stable Diffusion、Imagen、DALL-E2,文本-3D生成模型Magic3D、Dreamfusion、Point·E,圖像-文本生成模型VisualGPT、Flamingo,文本-視頻生成模型Soundify、Phenaki,文本-音頻生成模型Whisper、AudioLM、Jukebox以及文本-代碼生成模型、文本-科學知識模型等[5]。這些強大的算法生成模型使得目前AIGC可生成文字、圖像、語音、視頻、程序代碼甚至3D物體和交互內(nèi)容等等多種類型的數(shù)據(jù)。
(2)大型預訓練模型和遷移學習技術只需標記少量數(shù)據(jù)就可實現(xiàn)微調(diào)預訓練,很多情況下無需開發(fā)人員從頭開始訓練,因而有效降低了AI訓練成本[5]。同時,預訓練模型可以通過增加數(shù)據(jù)集和模型優(yōu)化來不斷擴展其應用場景和反應的準確性。理論上講,人類可以將世界上所有可獲得的文本、圖片等不同類型的數(shù)據(jù)加入預訓練數(shù)據(jù)集即可自動學習其中蘊含的知識點而無需人工介入。而預訓練模型在特定任務或領域上的微調(diào)模式也使其具有更大的伸縮和適應性,因而能夠適用于多任務、多場景、多功能需求。成本的降低和適應性提升了AIGC的通用化能力和內(nèi)容生產(chǎn)能力,使得同一個AIGC模型可以高質(zhì)量地完成多種內(nèi)容輸出任務,成為數(shù)字內(nèi)容生產(chǎn)的“流水線”。
(3)多模態(tài)人工智能成為AIGC重要的發(fā)展和應用方向。多模態(tài)技術能夠?qū)⒉煌B(tài)數(shù)據(jù),如圖像、文本、視頻進行關聯(lián)從而實現(xiàn)跨模態(tài)檢索或不同模態(tài)數(shù)據(jù)的相互轉(zhuǎn)化和生成,大大提升了AIGC生成內(nèi)容的多樣性和AIGC的通用化能力[6]。如OpenAI推出的DALL-E2模型、CLIP&DALL-E模型,谷歌的Imagen模型等均可將用戶的自然語言轉(zhuǎn)化為圖片,根據(jù)用戶的描述生成逼真的圖像,CLIP&DALL-E模型還可實現(xiàn)跨模態(tài)檢索;DeepMind的Gato模型能夠同時執(zhí)行多達600多項任務,可以一邊視頻游戲,一邊聊天,同時通過機械臂堆疊積木等[7]?,F(xiàn)實世界中,人們很容易根據(jù)圖像、文本、視頻等多模態(tài)數(shù)據(jù)全面而準確地學習和理解知識,因而多模態(tài)技術的應用也使得AIGC向接近人類思維邁了一大步。
(4)在算法、數(shù)據(jù)和算力的綜合推動下,AIGC應用已迅速展開。目前的應用模式主要分為三大部分:一是基礎生成算法模型和通用預訓練大模型應用,往往由實力較強的企業(yè)推出,通過受控API、開源等方式提供模型應用,如Stability.ai、OpenAI;二是按需對大模型進行“專業(yè)訓練”和調(diào)試形成定制化的小模型,使其成為能夠為教育、金融、傳媒、游戲等各行業(yè)提供服務的技術平臺;三是在上述基礎模型和定制化小模型的基礎上進一步開發(fā)面向個人和企業(yè)用戶的應用,形成最終產(chǎn)品,如聊天機器人、圖像生成軟件等。
2? ?AIGC應用給圖書館帶來的機遇
2.1? ? 多模態(tài)技術助力全新的智慧檢索體驗
AIGC中多模態(tài)技術的應用不僅解決了信息檢索中的“異構(gòu)鴻溝”問題,還可將多模態(tài)數(shù)據(jù)進行更深層次的精細關聯(lián),從而實現(xiàn)精準的跨模態(tài)信息檢索而為用戶帶來全新體驗。自媒體時代,圖像、文本、視頻等多模態(tài)數(shù)據(jù)呈爆炸式增長,圖書館文獻資源載體也日益多元,通過多模態(tài)技術實現(xiàn)以圖搜文、以文搜圖,使用戶更方便、快捷地找到自己想要的文獻。如用戶可通過輸入文字找到自己想要的視頻或圖片,也可通過輸入圖像找到文字或進行混合搜索,改變了傳統(tǒng)的用文字搜文字、用圖片搜圖片的單一檢索模式。這不僅能有效提高文獻利用率,還可為圖書館的資源建設、資源組織和知識管理提供新的思路。首先,檢索方式的改變,使得圖書館館內(nèi)資源、網(wǎng)絡資源、館外機構(gòu)資源和其他資源的整合與共享更加容易,囿于用戶無法統(tǒng)一檢索而帶來的資源整合障礙有望盡快消除;其次,AIGC在文本、圖像、視頻等多模態(tài)數(shù)據(jù)間建立精細關聯(lián)的功能也有助于建立資源結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù)之間的關聯(lián),從而實現(xiàn)文獻資源的重新聚類和分類揭示,為用戶提供更精準和多樣化的信息。目前,跨模態(tài)檢索技術已經(jīng)在公安、傳媒及醫(yī)學領域展開應用,但模態(tài)數(shù)據(jù)特征表示還不夠精細、不同模態(tài)特征之間細粒度對應關系的聯(lián)想捕捉等問題,導致其在真實場景下的泛化能力受限[8]。2022年以來AIGC的爆發(fā)性發(fā)展使得業(yè)界對多模態(tài)技術向著更深的領域探索,其應用領域也在逐步擴展,在圖書館行業(yè)的應用也指日可待。
2.2? ? AIGC應用助力智能圖書館向智慧圖書館轉(zhuǎn)變
事實上,人工智能技術早已被廣泛應用于圖書館,如智能檢索、智能咨詢、智能導航等,相較于傳統(tǒng)圖書館服務,智能技術的應用使圖書館服務更加專業(yè)化、智能化、人性化。建立在基礎算法模型、預訓練模型等通用大模型基礎上,并經(jīng)過專業(yè)訓練和調(diào)式的AIGC應用則會給圖書館服務帶來更大的變革,有望推動圖書館服務由智能化向智慧化轉(zhuǎn)變。以圖書館聊天機器人為例,目前的圖書館聊天機器人采用的是基于規(guī)則的模型,通過規(guī)則來匹配最正確的答案,因而僅能根據(jù)預設規(guī)則回答用戶有限的問題,對于用戶提出的新問題或復雜查詢難以處理,且回答問題生硬機械,無法滿足用戶的實時交互和個性化需求,達不到參考咨詢服務的智慧化。而基于AIGC應用開發(fā)的聊天機器人如ChatGPT在自然語言生成任務上已達到了非常高的水平,不僅擁有語言理解和文本生成能力,還具有編寫和調(diào)試計算機程序、翻譯、撰寫論文,進行電視劇、故事、音樂、詩歌、繪畫等的創(chuàng)作能力。在處理參考咨詢?nèi)蝿辗矫婢哂懈蟮牟樵兎秶途_度、較高的處理復雜問題的能力,能根據(jù)聊天上下文進行互動,與真實人類聊天場景幾無差異。理論上講,圖書館可以將世界上所有可獲得的文本、圖片等不同類型的數(shù)據(jù)加入預訓練數(shù)據(jù)集,讓聊天機器人更智慧、更接近人類思維,從而滿足用戶的多樣化需求。除了聊天機器人,AIGC依據(jù)自然語言自動輸出內(nèi)容的特性,在圖書館閱讀推廣、特殊群體服務、用戶培訓等方面也會發(fā)揮重要作用。如文獻的多語言翻譯、盲文翻譯、館藏文獻的多元化展示等;在用戶培訓方面,AIGC應用將創(chuàng)造高質(zhì)量的沉浸式內(nèi)容,如按需生成視頻、創(chuàng)建三維空間導覽等,可為用戶帶來多感官、互動性的時空體驗,獲得最佳培訓效果。
2.3? ? AIGC助推圖書館元宇宙的發(fā)展
元宇宙是對虛擬世界的高度模擬,是趨近真實、虛實融合的互聯(lián)網(wǎng)應用和社會形態(tài)。元宇宙時代的圖書館是實體空間和虛擬空間、實體館藏和虛擬館藏相互融合,為用戶同時提供實體空間服務和虛擬空間服務的無所不在的圖書館,館員是擁有活躍在虛擬圖書館任意空間的數(shù)字替身的超級館員[9]。因此,元宇宙和元宇宙時代的圖書館需要大量的數(shù)字內(nèi)容來支撐,未來AIGC應用作為數(shù)字內(nèi)容生產(chǎn)的“流水線”,可以高質(zhì)量地完成多種內(nèi)容和數(shù)據(jù)輸出任務,因而AIGC技術將成為元宇宙重要的基礎設施之一。而AIGC技術在圖書館的應用,還將為圖書館自行進行元宇宙建設提供更多的技術上的主動權,讓圖書館有更多的機會按照自身的特點和用戶需求進行圖書館元宇宙的規(guī)劃、設計和建設,而不是一味地被外包商牽著鼻子走。同時,AIGC模型的通用化能力和工業(yè)化水平,能夠使更多的圖書館用戶融入進來,參與內(nèi)容創(chuàng)建;而對于圖書館來說,則可以將復雜、效率低、成本高的事交給AIGC去做,如虛擬館舍和家具建設、虛擬館藏建設、用戶服務場景仿真、分布于不同場景的虛擬分館建設等,館員則騰出更多時間進行元宇宙規(guī)劃和設計,屆時AIGC將為圖書館節(jié)省大量的時間成本和金錢成本。未來,AIGC在圖書館的應用意味著圖書館將從繁冗的基礎性工作中解脫出來,把更多的精力放到服務設計和創(chuàng)新中,這也是AIGC應用背景下圖書館人工作方式的整體趨勢。
3? ?AIGC應用給圖書館帶來的挑戰(zhàn)
對圖書館行業(yè)來說,AIGC的應用可大大提升用戶體驗,為圖書館創(chuàng)新服務模式和內(nèi)容帶來無限可能,但也需要警惕AIGC應用給圖書館發(fā)展帶來的不利影響。
3.1? ? 用戶檢索與閱讀習慣改變帶來的挑戰(zhàn)
信息環(huán)境的變化會直接影響用戶行為和習慣,往往會對圖書館的服務模式和內(nèi)容產(chǎn)生根本性的沖擊。事實上,近20年來,隨著互聯(lián)網(wǎng)、搜索引擎、短視頻等社交媒體的發(fā)展,相較于傳統(tǒng)的閱讀方式,人們的檢索和閱讀習慣已經(jīng)發(fā)生了很大變化,圖書館也在不斷適應這種變化的過程中做出了很大改變,搜索引擎先進的索引技術和理念、人工智能技術等在圖書館的應用,使數(shù)字圖書館的建設日趨成熟,智慧圖書館建設也已提上日程。然而依然有一部分用戶在檢索信息時首選搜索引擎或互聯(lián)網(wǎng)而非圖書館,圖書館的用戶流失已成既定事實。如果說互聯(lián)網(wǎng)、搜索引擎的出現(xiàn)深刻地影響了圖書館服務,那么以ChatGPT為代表的AIGC應用的出現(xiàn)則會對搜索引擎產(chǎn)生顛覆性的挑戰(zhàn),甚至有人預言谷歌只需要一兩年時間就會被徹底顛覆[10]。為應對危機,各大搜索引擎相繼推出了自己的人工智能聊天機器人,如谷歌的Bard、百度的文心一言,而微軟直接將ChatGPT嵌入到其搜索引擎中,如Bing搜索上的“問答搜索功能”,就采用GPT3.5提供支持;甚至在其Edge瀏覽器上也添加了聊天和撰寫功能,幫助用戶解答問題和撰寫郵件、簡歷、文檔等。搜索引擎與智能聊天機器人的競爭不僅能夠快速提升各自的性能,也使得人工智能技術進入人們現(xiàn)實生活的門檻更低,兩者通過聊天場景與用戶建立聯(lián)系也就更容易,人們的檢索和閱讀習慣也就更容易發(fā)生改變,對圖書館來說,用戶的流失則會進一步加重,除非圖書館能提供與兩者截然不同的、對用戶更有幫助的服務。
3.2? ? 圖書館相關技術與人才弱勢帶來的挑戰(zhàn)
眾所周知,計算機和信息技術是推動圖書館發(fā)展的重要動力。但長期以來,圖書館對于信息技術的應用多依賴于企業(yè)相關產(chǎn)品的研發(fā)或技術外包,更多地是在購買和使用服務,導致大多數(shù)圖書館的技術部門只是充當圖書館硬件設備或常用數(shù)據(jù)庫和軟件的購買、維護、使用和培訓工作,不具備軟件開發(fā)能力,只有少量頂級高校圖書館或省級公共圖書館的技術部門具備一定的技術研發(fā)能力。以圖書館智能聊天機器人為例,圖書館往往或采取直接購買,或與企業(yè)合作開發(fā)的方式,能夠自主研發(fā)的圖書館少之又少。相關技術與人才弱勢使得圖書館在應對計算機和信息技術高速發(fā)展,尤其是在具有里程碑意義的新技術出現(xiàn)時顯得力不存心,這也給圖書館在瞬息萬變的信息時代的生存帶來了危機。ChatGPT上線以來,很多行業(yè)以最快的速度做出了反應,圖書館界雖然也很快加入了相關討論,但卻很難在短時間內(nèi)做出應對。2023年3月1日,OpenAI宣布以收費方式開放ChatGPT的應用程序接口(API),允許第三方通過API將ChatGPT集成至自己的應用程序和服務中,從而構(gòu)建自己的人工智能聊天機器人,為用戶提供更深層次的服務。根據(jù)OpenAI官網(wǎng)展示的應用案例,已經(jīng)有社交平臺、學習平臺、生鮮配送平臺、購物程序等接入ChatGPT API創(chuàng)建了自己的聊天界面[11]。ChatGPT API接入圖書館最直接的應用就是將館藏資源輸入ChatGPT 中,使其通過學習為用戶提供知識服務,將圖書館智能聊天機器人提供的基本參考咨詢服務擴展到知識咨詢與服務。然而,如果圖書館行動不夠快速,各大數(shù)據(jù)庫商可能會搶占先機,圖書館將再次淪為購買和作為信息中介的被動局面,用戶的流失將不可避免。
3.3? ? AIGC自身的局限性給圖書館帶來的風險
從安全的角度來看,首先存在版權風險。以ChatGPT為例,其用于訓練的大型文本數(shù)據(jù)語料庫的數(shù)據(jù)主要來自互聯(lián)網(wǎng),如果這些數(shù)據(jù)中存在侵犯版權的情況,則其生成內(nèi)容也可能面臨知識產(chǎn)權糾紛,正如OpenAI公司自己所承認的那樣,即使ChatGPT在預訓練時已經(jīng)在盡量規(guī)避版權風險,但不能保證所有數(shù)據(jù)都經(jīng)過了原始作者的許可[12]。由于AIGC的預訓練模型數(shù)據(jù)量龐大,圖書館在應用時無論是否輸入自有的數(shù)據(jù),也會面臨版權風險;其次是存在用戶隱私、敏感和機密信息泄漏的風險。AIGC依靠收集和存儲大量用戶數(shù)據(jù)來提高性能,當用戶輸入個人數(shù)據(jù)或其他敏感信息時, AIGC可能會將其納入語料庫從而產(chǎn)生泄露風險;第三是存在產(chǎn)生偏見和歧視性結(jié)果的風險。一是用于訓練人工智能的語料庫中如果含有偏見或歧視性的數(shù)據(jù),模型可能會不加區(qū)別地進行處理,進而把這種偏見和歧視反映到輸出內(nèi)容上。二是如果算法潛藏偏見和歧視,也會導致偏見或歧視性結(jié)果。雖然目前AIGC應用工具都在設法規(guī)避“毒性”語料,但其算法被認為是“黑箱”操作,透明度缺失,仍然存在輸出偏見或歧視性結(jié)果的風險[13];最后是助長學術造假的風險。以ChatGPT為例,由于其具有翻譯、撰寫論文、編寫代碼等創(chuàng)作功能,已有國外大學生利用其發(fā)表學術論文、撰寫課程作業(yè),引發(fā)了學術界和教育界的擔憂[14]。在線課程提供商Study.com對1000多名學生進行的調(diào)查顯示,89%以上的學生使用ChatGPT來幫助其完成家庭作業(yè)[15]。已有包括《Nature》在內(nèi)的多家知名學術期刊明確表示不接受由ChatGPT生成的論文投稿[16]。但如何區(qū)分人類寫作文本和人工智能合成文本卻困難重重,針對這種情況,2023年2月,OpenAI公司推出AI Text Classifier的文件檢測器,但其準確性也不容樂觀,僅為26%[17]。
4? ?圖書館應對 AIGC的策略與途徑
4.1? ? 從聊天機器人入手優(yōu)化和擴展其服務范圍
聊天機器人是目前很多圖書館提供在線參考咨詢服務的方式。但現(xiàn)有的圖書館聊天機器人主要被用來回答最基本的有關圖書館服務的問題,復雜的問題還需要館員來解答。參考ChatGPT理念與模型訓練方法,優(yōu)化和豐富訓練語料庫,創(chuàng)建圖書館特色的人工智能聊天機器人,使其既能回答最基本的和較為復雜的參考咨詢問題,同時也能真正扮演聊天對象,為用戶提供范圍更廣的聊天服務,改善用戶體驗,這應該說是目前較為簡單的圖書館與AIGC技術對接的方式。一項對60多個品牌的客服聊天機器人的研究發(fā)現(xiàn),約40%的用戶的請求是感性的,即用戶可能只是需要向聊天機器人宣泄情感,而不是尋求具體的產(chǎn)品或服務信息[18]。加州大學歐文分校圖書館對其智能聊天機器人ANTswers的用戶咨詢問題進行統(tǒng)計后發(fā)現(xiàn),與圖書館服務無關的問題數(shù)量之多出乎了館員的意料。由于用戶是匿名咨詢,他們更喜歡把ANTswers當作人來對待,詢問它怎么樣以及生活情況等。也就是說,用戶可能只是想找個人聊聊天,而聊天機器人充當了這個角色。統(tǒng)計結(jié)果使歐文分校圖書館放棄了將這些與圖書館服務無關的聊天數(shù)據(jù)從語料庫中刪除的決定,因為這樣可以為用戶帶來更好的體驗[19]。因此,將圖書館聊天機器人語料庫向通用型靠攏,增加更多的通用型內(nèi)容對其進行訓練,使其能夠回答用戶除圖書館服務外更為廣泛的問題,逐步深化大規(guī)模語言模型在圖書館參考咨詢服務中的應用。
4.2? ? 嘗試利用開源模型訓練圖書館現(xiàn)有文獻數(shù)據(jù)
目前,大多數(shù)人工智能開源模型基于Transformer模型,并具有上手快、易操作等特點,適合入門級開發(fā)人員使用,對技術力量薄弱的圖書館來說,可以快速自主開展適應圖書館自身業(yè)務需要的人工智能數(shù)據(jù)訓練,為AIGC技術在圖書館的成熟應用打下基礎。國外已經(jīng)有圖書館開展了類似的工作。如瑞典國家圖書館就采用開源自然語言處理平臺Hugging Face的Transformer模型對幾個世紀以來的館藏資源進行人工智能訓練。在過去的500年里,瑞典國家圖書館收集了幾乎所有用瑞典語出版的各種資料,這些資料包括書籍、報紙、廣播和電視、互聯(lián)網(wǎng)內(nèi)容、博士學位論文、明信片、菜單和電子游戲等,資源的多樣化非常適應進行人工智能訓練。2019年,瑞典國家圖書館成立KBLab,開始在1TB的瑞典語文本上訓練其模型,為提高模型性能,還嘗試向數(shù)據(jù)集添加荷蘭語、德語和挪威語的內(nèi)容。隨著館藏資源的不斷數(shù)字化,每個月都會增加約50TB訓練數(shù)據(jù),小型工作站已不能滿足要求,瑞典國家圖書館隨即采用了英偉達的超級計算機DGX,并增加了將聲音轉(zhuǎn)錄為文本的人工智能工具,使圖書館龐大的廣播電視館藏能夠轉(zhuǎn)錄為文本,利用多模態(tài)數(shù)據(jù)進行人文研究。隨著訓練工作的不斷推進,瑞典國家圖書館現(xiàn)在已開始開發(fā)生成文本模型,并正在研究可以處理視頻和能夠自動描述視頻內(nèi)容的模型[20]。圖書館開展AIGC模型應用是一個循序漸進、逐步推進的過程,利用現(xiàn)有館藏積極進行初期的應用不失為一種跟進人工智能技術、改善用戶知識服務的良好途徑。
4.3? ? 提前進行AIGC應用的風險規(guī)避和防范
在安全問題方面,版權和用戶隱私問題事實上一直是數(shù)字圖書館建設中不可回避的話題,在AIGC技術應用背景下,這一問題更加復雜,圖書館要做的工作相對更多。在用戶隱私保護方面,要通過培訓和教育提高館員和用戶的安全意識。在很多情況下,往往是用戶在不經(jīng)意間將自己的隱私信息泄露出去的,如在使用聊天機器人時,輸入了自己的隱私數(shù)據(jù)而毫不知情。因此,需要對用戶進行必要的信息安全教育,并不斷完善用戶隱私政策。館員可以說是用戶隱私的“守護者”,應對他們進行數(shù)字安全技能培訓以及職業(yè)道德教育,增強對用戶隱私的保護意識。在版權方面,首先要保證圖書館用于人工智能訓練的數(shù)據(jù)的合法性,除圖書館自有數(shù)據(jù)外,其他數(shù)據(jù)要確保獲得許可和授權或符合著作權法的其他規(guī)定;其次,有關AI生成內(nèi)容的版權問題目前還存在爭議。OPenAI公司在其用戶協(xié)議中規(guī)定,用戶擁有基于輸入內(nèi)容而生成的輸出內(nèi)容的所有權,并對內(nèi)容負法律責任,ChatGPT則擁有這些內(nèi)容的使用權[21]。而根據(jù)我國《著作權法》的規(guī)定,“著作權屬于作者。創(chuàng)作作品的自然人是作者。也就是說目前我國的法律僅保護自然人創(chuàng)作的作品,對于由人工智能和自然人共同創(chuàng)作的作品還沒有明確的規(guī)定。圖書館作為信息文獻中心,有責任也有義務關注并對相關法律的制定、修訂提出自己的建議,這需要圖書館在服務實踐中不斷地積累相關的用戶使用情況和意愿,并將之納入業(yè)務研究范疇,關注涉及人工智能生成內(nèi)容的版權糾紛案件。另外,自2023年1月10日起,我國正式實施《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》,對深度合成服務的提供者、使用者、支持者所要承擔的法律責任和義務進行了規(guī)定[22]。2023年4月11日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》,對生成式人工智能產(chǎn)品或服務應當遵循的法律法規(guī)提出了要求[23]。AIGC若在圖書館使用,則作為服務提供者的圖書館需要承擔相應的法律責任,這也是圖書館行業(yè)應該提前規(guī)劃和關注的方面。
5? ?結(jié)語
2023年3月22日,非營利組織生命未來研究所(Future of Life)發(fā)布了一封《暫停大型人工智能研究》的公開信,呼吁所有人工智能實驗室立即暫停比GPT-4更強大的人工智能系統(tǒng)訓練6個月,共同制定和實施人工智能設計和開發(fā)共享安全協(xié)議,并由獨立的外部專家進行嚴格的審查和監(jiān)督,通過建設AI治理系統(tǒng)防止人工智能對人類造成的危險[24]。每一項新技術的應用都會帶來潛在的風險,雖然AIGC的潛力還存在很多不確定性,但毫無疑問它對圖書館行業(yè)必將產(chǎn)生深刻的影響。未雨綢繆,提前謀劃;持續(xù)跟蹤,積極實踐,是當前圖書館應對這一危機和影響的必由之路。
參考文獻:
[1]? Poulomi Chatterjee.What Excites Yoshua Bengio about the Future of Generative AI[EB/OL].[2023-03-26].https://analyticsindiamag.com/what-excites-yoshua-bengio-about-the-future-of-generative-ai/.
[2]? 魏富強,古蘭拜爾·吐爾洪,買日旦·吾守爾.生成對抗網(wǎng)絡及其應用研究綜述[J].計算機工程與應用,2021,57(19):18-31.
[3]? ?Brown T,Mann B,Ryder N,et al.Language models are few-shot learners[J].Advances in neural information processing systems,2020,33:1877-1901.
[4]? Gozalo-Brizuela R,Garrido-Merchan E C.ChatGPT is not all you need.A State of the Art Review of large Generative AI models[J].arXiv preprint arXiv:2301.04655,2023.
[5]? 唐亞匯.大規(guī)模預訓練模型對AI應用與普及的影響[J].上海信息化,2021(9):52-55.
[6]? 趙朝陽,朱貴波,王金橋.ChatGPT給語言大模型帶來的啟示和多模態(tài)大模型新的發(fā)展思路[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2023,7(3):26-35.
[7]? ?Reed S,Zolna K,Parisotto E,et al.A generalist agent[J].arXiv preprint arXiv:2205.06175,2022.
[8]? 劉穎,郭瑩瑩,房杰,等.深度學習跨模態(tài)圖文檢索研究綜述[J].計算機科學與探索,2022,16(3):489-511.
[9]? 董甜甜,卜險峰.圖書館邁向元宇宙的先行實踐、未來場景及發(fā)展策略[J].圖書與情報,2022(5):92-97.
[10]? 齊健,陳伊凡.ChatGPT引爆新一輪科技軍備賽[EB/OL].[2023-02-26].https://new.qq.com/rain/a/20230212A01Z8L00.
[11]? OpenAI.Customer stories[EB/OL].[2023-02-26].https://openai.com/customer-stories.
[12]? 叢立先,李泳霖.聊天機器人生成內(nèi)容的版權風險及其治理——以ChatGPT的應用場景為視角[J].中國出版,2023(5):16-21.
[13]? Goldstein J A,Sastry G,Musser M,et al.Generative Language Models and Automated Influence Operations:Emerging Threats and Potential Mitigations[J].arXiv preprint arXiv:2301.04246,2023.
[14]? ?Thorp H H.ChatGPT is fun,but not an author[J].Science,2023,379(6630):313-313.
[15]? Productive Teaching Tool or Innovative Cheating?[EB/OL].[2023-03-30].https://study.com/resources/perceptions-of-chatgpt-in-schools.
[16]? Editorials? N.Tools such as ChatGPT threaten transparent science;here are our ground rules for their use[J].Nature,2023 (613):612.
[17]? Kirchner? J H,Ahmad? L,Aaronson? S,et al.New AI classifier for indicating AI-written text[J].OpenAI,2023.
[18]? Xu A,Liu Z,Guo Y,et al.A new chatbot for customer service on social media[C].In Proceedings of the 2017 CHI conference on human factors in computing systems,2017:3506-3510.
[19]? Kane D.Analyzing an interactive chatbot and its impact on academic reference services[J/OL].[2023-03-22].https://alair.ala.org/bitstream/handle/11213/17624/AnalyzinganInteractiveChatbotanditsImpactonAcademicReferenceServices.pdf?sequence=1.
[20]? ISHA SALIAN[EB/OL].[2023-03-30].https://blogs.nvidia.com/blog/2023/01/23/sweden-library-ai-open-source/?utm_campaign=Learning%20Posts&.utm_content=235868723&utm_medium=social&utm_source=facebook&hss_channel=fbp-1556374471294462.
[21]? Lemley M A.Terms of use[J].Minn L Rev,2006,91:459.
[22]? 國家互聯(lián)網(wǎng)信息辦公室,工業(yè)和信息化部,公安部.互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定[EB/OL].[2023-03-26].http://www.cac.gov.cn/2022-12/11/c_1672221949354811.htm.
[23]? 國家互聯(lián)網(wǎng)信息辦公室.國家互聯(lián)網(wǎng)信息辦公室關于《生成式人工智能服務管理辦法(征求意見稿)》公開征求意見的通知[EB/OL].[2023-04-11].http://www.cac.gov.cn/2023-04/11/c_1682854275475410.htm.
[24]? Future of Life Institute.Pause Giant AI Experiments:An Open Letter[EB/OL].[2023-03-30].https://futureoflife.org/open-letter/pause-giant-ai-experiments/?continueFlag=d19c796896f3776241c518f8747afa68.
作者簡介:李穎婷,女,內(nèi)蒙古呼倫貝爾市圖書館主任編輯,研究方向:圖書館管理、資源建設、圖書館服務、智慧圖書館。