摘 要 數(shù)字人作為元宇宙的重要元素和入口,在智慧圖書館與元宇宙融合發(fā)展的背景下,為智慧圖書館創(chuàng)新發(fā)展提供了新的切入點(diǎn)。論文通過梳理數(shù)字人概念、起源、分類,以及建模、驅(qū)動(dòng)、對(duì)話等核心技術(shù),總結(jié)出數(shù)字人具有超越真人局限、IP打造和多人協(xié)同、定制化服務(wù)、全時(shí)段工作、自動(dòng)創(chuàng)作等應(yīng)用優(yōu)勢,探討其在智慧圖書館建設(shè)領(lǐng)域的潛在應(yīng)用場景,從而推進(jìn)智慧圖書館建設(shè)的理論創(chuàng)新、管理創(chuàng)新、服務(wù)創(chuàng)新。此外,論文還從成本控制、自然人權(quán)力保障、讀者自控能力影響等方面對(duì)數(shù)字人在智慧圖書館應(yīng)用的潛在風(fēng)險(xiǎn)進(jìn)行了分析。
關(guān)鍵詞 數(shù)字人;智慧圖書館;創(chuàng)新發(fā)展
分類號(hào) G252
DOI 10.16810/j.cnki.1672-514X.2024.09.009
Digital Human Drive Innovation in Smart Libraries: Technology, Advantages and Implementation Paths
Zheng Cong, Bai Xue, Lv Yan’e, Chen Mang
Abstract As an important element and entrance to the meta-universe, digital human provides a new entry point for the innovative development of smart libraries in the context of the integration and development of smart libraries and meta-universe. By sorting out the concept, origin and classification of digital human, as well as the core technologies of modeling, driving and dialogue, we conclude that digital human has application advantages such as transcending the limitations of real people, IP creation and multi-person collaboration, customized services, full time work and automatic creation, and explore its potential application scenarios in the field of smart library construction, so as to promote theoretical innovation, management innovation and service innovation in smart library construction. In addition, the potential risks of digital people in the application of smart libraries are analyzed in terms of cost control, natural person power guarantee, and the influence of readers’ self-control ability.
Keywords Digital human. Smart libraries. Innovative development.
0 引言
隨著技術(shù)的進(jìn)步,社會(huì)正在朝著元宇宙時(shí)代邁進(jìn)[1]。元宇宙業(yè)態(tài)為智慧圖書館創(chuàng)新建設(shè)帶來了無限可能,作為元宇宙三大要素之一和重要入口的數(shù)字人也愈發(fā)引起圖書館行業(yè)關(guān)注。與此同時(shí),元宇宙與人工智能的跨越式發(fā)展給圖書館造成了很大的沖擊,在現(xiàn)代技術(shù)的加持下,豐富多樣的信息源正在逐步吸引用戶的注意力,如果要避免圖書館在信息服務(wù)中的邊緣化,就需要積極擁抱新技術(shù),利用新技術(shù)契機(jī)進(jìn)行業(yè)務(wù)創(chuàng)新與變革,將用戶注意力重新吸引回圖書館[2]。因此,本文在梳理數(shù)字人相關(guān)起源、概念的基礎(chǔ)上,嘗試將數(shù)字人理論、技術(shù)與智慧圖書館建設(shè)進(jìn)行融合,探索其應(yīng)用場景、優(yōu)勢和潛在風(fēng)險(xiǎn),以期為促進(jìn)智慧圖書館創(chuàng)新服務(wù)工作提供思路。
1 數(shù)字人起源及發(fā)展
數(shù)字人最早依托于虛擬偶像概念,誕生于20世紀(jì)80年代,第一代虛擬偶像如日本的林明美、英國的Max Headroom等,以平面繪畫為載體,開始涉足演藝、電影等行業(yè),取得了較大成功[3]。醫(yī)學(xué)領(lǐng)域也開始建立虛擬人計(jì)劃(Virtual human Project,VHP)[4]。進(jìn)入到21世紀(jì),隨著QQ的普及,QQ秀這一虛擬形象逐漸被網(wǎng)絡(luò)玩家接受,中國網(wǎng)絡(luò)用戶也可以低成本的擁有自己的虛擬形象,這可以算是國內(nèi)較早大規(guī)模普及的平面型數(shù)字人前身。后來隨著CG、動(dòng)作捕捉等技術(shù)的逐漸興起,數(shù)字人創(chuàng)造進(jìn)入到一個(gè)嶄新的階段,實(shí)現(xiàn)了立體化、擬人化等質(zhì)的飛躍,數(shù)字人形象逐漸豐滿。而人工智能則為數(shù)字人注入了靈魂,數(shù)字人可以自主完成語音對(duì)話、情緒表達(dá)等類人行為,從而提升數(shù)字人內(nèi)涵;元宇宙的飛速發(fā)展和落地則為數(shù)字人提供了廣袤的生存土壤,數(shù)字人應(yīng)用的場景也逐漸多元化。
數(shù)字人也叫做虛擬人或者虛擬數(shù)字人,其名稱相似度較高,但是根據(jù)特征的細(xì)化,在概念上“數(shù)字人>虛擬人>虛擬數(shù)字人”。數(shù)字人強(qiáng)調(diào)運(yùn)行環(huán)境為數(shù)字世界,數(shù)字人按照現(xiàn)實(shí)世界人物進(jìn)行設(shè)定,如果場景、人物完全與現(xiàn)實(shí)相同就實(shí)現(xiàn)了數(shù)字孿生;虛擬人則沒有實(shí)體依托,身份與形象完全虛擬化,但是其具備人類外觀和行為模式;虛擬數(shù)字人則指存在于非物理世界中,由計(jì)算機(jī)圖形學(xué)、圖形渲染、動(dòng)作捕捉等計(jì)算機(jī)手段創(chuàng)造及使用,并具有多重人類特征如外貌特征、人類表演能力、人類交互能力等的綜合產(chǎn)物[5]。
數(shù)字人的分類可以從多個(gè)維度展開,常見的有技術(shù)、角色、設(shè)計(jì)風(fēng)格、商業(yè)模式、產(chǎn)業(yè)應(yīng)用、結(jié)構(gòu)組成、視覺效果等維度。例如從技術(shù)維度可以劃分算法驅(qū)動(dòng)型和真人驅(qū)動(dòng)型,前者使用AI實(shí)時(shí)生成數(shù)字人,后者則通過動(dòng)作捕捉進(jìn)行數(shù)字人驅(qū)動(dòng);從數(shù)字人扮演的角色可以分為完美偶像型、前沿實(shí)驗(yàn)型、真實(shí)生活型、智能助手型、行業(yè)專家型等;按設(shè)計(jì)風(fēng)格可劃分為動(dòng)漫型、類人型、超寫實(shí)型、科幻型等;從商業(yè)模式可劃分為IP型和非IP型,IP型一般包含娛樂型、品牌型、明星型等數(shù)字人,非IP型一般為身份型、功能型、學(xué)術(shù)型數(shù)字人。
2 數(shù)字人技術(shù)
數(shù)字人技術(shù)一般可分為硬件技術(shù)和軟件技術(shù),硬件技術(shù)包括使用數(shù)字人所要的相關(guān)設(shè)施、設(shè)備等,如顯示設(shè)備、VR設(shè)備、光學(xué)設(shè)備、專用芯片、傳感器等;軟件技術(shù)包括數(shù)字人建模技術(shù)、數(shù)字人驅(qū)動(dòng)技術(shù)、數(shù)字人及場景渲染技術(shù)等。數(shù)字人軟件技術(shù)相較于硬件技術(shù)發(fā)展較為迅猛,并且逐漸通過軟件技術(shù)降低專用硬件使用量,使數(shù)字人的實(shí)現(xiàn)成本進(jìn)一步降低。因此圖書館作為數(shù)字人應(yīng)用場景,需要關(guān)注建模技術(shù)、驅(qū)動(dòng)技術(shù)等較為核心的數(shù)字人軟件技術(shù),通過現(xiàn)有硬件的改造和適配實(shí)現(xiàn)數(shù)字人應(yīng)用。
2.1 建模技術(shù)
數(shù)字人建模技術(shù)是數(shù)字人技術(shù)的重中之重,解決數(shù)字人的創(chuàng)造問題。數(shù)字人建??梢苑譃檐浖?、儀器采集建模和自動(dòng)化建模三種。
軟件建模利用3D軟件如3DMax、Maya等直接建模,該方式經(jīng)過長時(shí)間的發(fā)展較為成熟,是目前應(yīng)用較多的建模手段,但是建設(shè)周期較長,在真人還原精度方面不可控。
儀器采集建模又細(xì)分為靜態(tài)建模和動(dòng)態(tài)建模,靜態(tài)建模使用掃描技術(shù),例如結(jié)構(gòu)光掃描和相機(jī)陣列掃描,其中相機(jī)陣列掃描可以實(shí)現(xiàn)超高速的拍攝和細(xì)節(jié)重建;動(dòng)態(tài)建模則主要指動(dòng)態(tài)光場重建,可以重塑人物的幾何模型,同時(shí)還可以一次性獲取不同視角下人體的高質(zhì)量光影模型數(shù)據(jù),視覺保真度更高。
而目前最為火熱的是依托AI進(jìn)行自動(dòng)化建模,分為兩個(gè)思路,一個(gè)是通過采集的平面照片利用AI算法從2D構(gòu)建出3D模型,一般是對(duì)人臉進(jìn)行2D到3D的轉(zhuǎn)換,而身體則在模型庫中選取,然后進(jìn)行拼接;另一個(gè)是通過AI算法直接生成人臉、身體等模型。自動(dòng)化建模目前還不是很成熟,仍在實(shí)驗(yàn)室研究階段,但是就其使用方式來看,是最接近現(xiàn)實(shí)使用環(huán)境的,能將數(shù)字人建模降低到無需特定設(shè)備、無需特定場所、無需專業(yè)人員就能完成的水平,能極大地促進(jìn)數(shù)字人應(yīng)用范圍。
2.2 驅(qū)動(dòng)技術(shù)
驅(qū)動(dòng)技術(shù)簡單來講是通過一些技術(shù)手段讓已經(jīng)建立好的數(shù)字人模型動(dòng)起來。在驅(qū)動(dòng)之前需要對(duì)數(shù)字人做一個(gè)驅(qū)動(dòng)初始化操作,該操作在數(shù)字人模型上找尋關(guān)鍵點(diǎn),比如手肘、手腕、膝蓋、腳踝、眼皮、嘴角、眉頭等,通過關(guān)鍵點(diǎn)位可以操作數(shù)字人的動(dòng)作、表情等。在具體實(shí)現(xiàn)時(shí),往往是先創(chuàng)建一個(gè)骨骼系統(tǒng),里面標(biāo)記好了通用的關(guān)鍵點(diǎn)位,然后將骨骼系統(tǒng)按照比例與數(shù)字人模型進(jìn)行整合和聯(lián)動(dòng),最后進(jìn)行參數(shù)的調(diào)優(yōu),使數(shù)字人的運(yùn)動(dòng)和表情更加自然。
模型初始化后就涉及如何進(jìn)行驅(qū)動(dòng)使用,整體上驅(qū)動(dòng)類型可分為互動(dòng)型驅(qū)動(dòng)和非互動(dòng)型驅(qū)動(dòng),非互動(dòng)型驅(qū)動(dòng)較為簡單,通過預(yù)先設(shè)置好的流程、動(dòng)作、文本等讓數(shù)字人動(dòng)起來、說起來、演起來,跟傳統(tǒng)動(dòng)畫片較為類似,驅(qū)動(dòng)過程中無法與使用者進(jìn)行交互。
互動(dòng)型驅(qū)動(dòng)則較為復(fù)雜,數(shù)字人需要接收外界信息并予以反饋,實(shí)現(xiàn)上有真人驅(qū)動(dòng)和AI驅(qū)動(dòng)兩類。真人驅(qū)動(dòng)是比較傳統(tǒng)的驅(qū)動(dòng)方式,大規(guī)模應(yīng)用于影視行業(yè),使用光學(xué)捕捉、慣性捕捉等技術(shù)從真人身上采集動(dòng)作和表情信息,然后傳遞給數(shù)字人進(jìn)行驅(qū)動(dòng),也就是一個(gè)數(shù)字人或一批數(shù)字人背后需要有一個(gè)真人對(duì)外界信息進(jìn)行反饋,由于光學(xué)捕捉和慣性捕捉需要穿戴大量設(shè)備,所以限制了其應(yīng)用范圍。相比較之下,AI驅(qū)動(dòng)無需真人干預(yù),通過對(duì)AI技術(shù)如CV[6](Computer Vision,計(jì)算機(jī)視覺)、TTS[7](Text to Speech,語音合成技術(shù))、ASR[8](Automatic Speech Recognition,語音識(shí)別技術(shù))等進(jìn)行整合來驅(qū)動(dòng)數(shù)字人,該方案具有成本低、靈活性大等特點(diǎn),但是受限于AI技術(shù)發(fā)展現(xiàn)狀,其只能在某一特定垂直領(lǐng)域進(jìn)行訓(xùn)練和應(yīng)用。
2.3 對(duì)話式AI
建模技術(shù)和驅(qū)動(dòng)技術(shù)解決了數(shù)字人長什么樣子、怎么動(dòng)起來的問題,而對(duì)話式AI則決定數(shù)字人講什么話的問題。對(duì)話式AI從技術(shù)角度可以分為基于規(guī)則對(duì)話、基于模塊對(duì)話、召回式對(duì)話、生成式對(duì)話等。
基于規(guī)則對(duì)話使用符號(hào)主義和專家系統(tǒng)這一類AI 設(shè)計(jì)方法,通過邏輯運(yùn)算規(guī)則可以最終實(shí)現(xiàn)類人AI,但是在1980 年之后這一類方法逐漸沉寂,現(xiàn)在大家已經(jīng)基本否決了通過專家經(jīng)驗(yàn)或是規(guī)則這一類方式就能達(dá)到自由對(duì)話的可能性?;谀K對(duì)話通常包含幾個(gè)固定的模塊,使用自然語言理解、對(duì)話狀態(tài)追蹤、策略學(xué)習(xí)等流程,將狀態(tài)映射為動(dòng)作,最終通過自然語言生成模塊來生成出想要的回復(fù)。召回式對(duì)話使用語料庫去找匹配貼近用戶需求的答案,回復(fù)質(zhì)量完全受限于語料庫的覆蓋范圍,在復(fù)雜、寬泛場景下效果要低于簡單、垂直領(lǐng)域場景。
目前使用前景最好的是生成式對(duì)話,時(shí)下火熱的ChatGPT正是基于1750億參數(shù)的超大規(guī)模模型完成對(duì)話生成[9-10],作為一個(gè)通用型語言模型,Chat GPT已經(jīng)可以在諸多專業(yè)領(lǐng)域回答特定問題,并根據(jù)需要生成內(nèi)容文檔。有了文檔之后,上游的數(shù)字人只需要驅(qū)動(dòng)數(shù)字人面部完成對(duì)話,就可以達(dá)到真人水準(zhǔn)。
3 數(shù)字人優(yōu)勢應(yīng)用
數(shù)字人最大的優(yōu)勢就是超越真人局限,做到真人館員無法做到的事情。例如場景切換、語言切換、著裝切換、表情設(shè)計(jì)、動(dòng)作設(shè)計(jì)等,真人館員無法在活動(dòng)中進(jìn)行頻繁切換,而數(shù)字人則可以借助手段實(shí)現(xiàn),更有甚者可以使用全息投影方式,讓數(shù)字人與讀者同臺(tái)演繹,共同體驗(yàn)元宇宙圖書館樂趣。因此,圖書館可對(duì)數(shù)字人進(jìn)行以下的開發(fā)應(yīng)用。
3.1 可進(jìn)行IP打造和多人協(xié)同
傳統(tǒng)閱讀推廣依賴于專業(yè)館員,專業(yè)館員的推廣方式、語言、語氣、人格等諸多特性帶入推廣工作,就會(huì)形成較為鮮明的推廣特征,形成獨(dú)特的推廣品牌。這對(duì)圖書館來講其實(shí)是把雙刃劍,一方面向讀者提供了較為豐富、可選擇的閱讀方案,另一方面讀者也會(huì)產(chǎn)生閱讀依賴,如果推廣人員發(fā)生外在或內(nèi)在的變動(dòng)會(huì)給讀者帶來一定困擾。閱讀推廣數(shù)字人則可以規(guī)避此類問題,一個(gè)圖書館可以只打造一個(gè)或幾個(gè)數(shù)字人,館員則置身數(shù)字人背后,成為其內(nèi)容提供者或決策者,利用專業(yè)知識(shí)通過數(shù)字人發(fā)起閱讀推廣,這樣就可以形成唯一IP,讀者的閱讀習(xí)慣將會(huì)最大限度得到保留。同時(shí),閱讀推廣內(nèi)容出口的統(tǒng)一也可以讓館員進(jìn)行多人協(xié)同工作,分工更加精細(xì)化,提升閱讀推廣工作效率。
3.2 可開展定制化服務(wù)
定制化服務(wù)可以按照讀者的需求提供服務(wù)。讀者在圖書館生態(tài)系統(tǒng)中處于消費(fèi)者地位,消費(fèi)者天然的帶有個(gè)性化服務(wù)需求,圖書館作為閱讀服務(wù)提供方最理想化的是為讀者提供一對(duì)一方案,更有甚者是為讀者提供多套方案。但是在傳統(tǒng)場景下,受制于人工成本和技術(shù)手段等因素,這種設(shè)想往往無法實(shí)現(xiàn)。數(shù)字人場景下,人工成本會(huì)極大地壓縮,如果使用了人工智能驅(qū)動(dòng)的全自動(dòng)數(shù)字人,人工成本甚至?xí)嚎s至極限,通過數(shù)字人全時(shí)段、全場景、全學(xué)科的給讀者提供一對(duì)一定制化閱讀服務(wù)將成為可能。同時(shí),在人工智能挖掘技術(shù)和知識(shí)生產(chǎn)技術(shù)的助力下,數(shù)字人也可以根據(jù)館藏形成自己的知識(shí)體系結(jié)構(gòu),從而更加智能、準(zhǔn)確地為讀者提供定制服務(wù)。
3.3 可設(shè)置全時(shí)段工作
數(shù)字人可以無休無眠的一直工作,只要有穩(wěn)定的電力供應(yīng)和持續(xù)的數(shù)據(jù)輸入,數(shù)字人就可以根據(jù)設(shè)定好的人工智能算法自主工作和提供服務(wù)。全時(shí)段工作說明數(shù)字人可以不用像人類一樣休息,同時(shí)更能體現(xiàn)數(shù)字人可以長時(shí)間、高強(qiáng)度工作而不會(huì)產(chǎn)生疲勞和偏差,知識(shí)輸出和服務(wù)質(zhì)量可以在較大時(shí)間跨度下保持穩(wěn)定的優(yōu)勢。
數(shù)字人的全時(shí)段工作并不是擠占了傳統(tǒng)館員的工作空間,相反數(shù)字人可以進(jìn)一步釋放館員的創(chuàng)造活力。這在當(dāng)下已經(jīng)有了較為鮮明的例子,比如RFID的推行實(shí)現(xiàn)了全開架的讀者自助借還,釋放了大量的勞動(dòng)力,這些館員并不會(huì)因?yàn)镽FID技術(shù)的接入而失去工作,他們轉(zhuǎn)而能將精力投入到閱讀推廣、學(xué)科服務(wù)等更加具有創(chuàng)造性的領(lǐng)域中。所以數(shù)字人改變工作,館員創(chuàng)造工作。
3.4 在知識(shí)圖譜基礎(chǔ)上進(jìn)行自動(dòng)創(chuàng)作
數(shù)字人也可以使用知識(shí)圖譜技術(shù)實(shí)現(xiàn)自動(dòng)創(chuàng)作,知識(shí)圖譜技術(shù)脫胎于知識(shí)工程,是人工智能領(lǐng)域最先發(fā)展起來的三個(gè)方向之一,現(xiàn)代知識(shí)圖譜技術(shù)以圖結(jié)構(gòu)化的知識(shí)描述世界中的概念、關(guān)系、屬性等。圖書館資源由于具有較好的組織性和層級(jí)結(jié)構(gòu),因此非常適合于轉(zhuǎn)化為知識(shí)圖譜形式,在知識(shí)圖譜基礎(chǔ)上數(shù)字人可以完成概念理解、資源分類、個(gè)性推薦、知識(shí)推理等工作,進(jìn)而產(chǎn)生數(shù)字人自己的想法,即完成數(shù)字人的自動(dòng)創(chuàng)作,形成數(shù)字人的知識(shí)圖譜大腦,讓其像人類一樣思考。
4 智慧圖書館數(shù)字人構(gòu)建路徑
通過對(duì)數(shù)字人建模技術(shù)、驅(qū)動(dòng)技術(shù)、對(duì)話式AI等方面使用優(yōu)勢的梳理,并結(jié)合智慧圖書館建設(shè)實(shí)際情況,本文總結(jié)出智慧圖書館數(shù)字人構(gòu)建路徑如圖1所示。語料來源為智慧圖書館數(shù)字人的現(xiàn)實(shí)基礎(chǔ),需要對(duì)圖書館相關(guān)檔案、網(wǎng)站、公眾號(hào)、規(guī)章制度、常見問題等進(jìn)行凝練和匯總,并以易于計(jì)算機(jī)處理的Markdown格式進(jìn)行存儲(chǔ),形成數(shù)字人問答提供現(xiàn)實(shí)依據(jù);知識(shí)庫在語料的基礎(chǔ)上進(jìn)行分類、向量化、分片、標(biāo)注等工作,將連續(xù)的文本描述進(jìn)行拆分,使其適合匹配,提高命中效率;將知識(shí)庫內(nèi)容導(dǎo)入到語言模型中,可以給通用語言模型增加具有本館特色的知識(shí)資源,從而提升私域知識(shí)領(lǐng)域的問答準(zhǔn)確度;通過語言模型開放的接口,可以將公共知識(shí)與私域知識(shí)融合提供給數(shù)字人驅(qū)動(dòng)平臺(tái),形成智慧圖書館數(shù)字人問答能力。
圖1 智慧圖書館數(shù)字人構(gòu)建路徑
依據(jù)圖1的構(gòu)建路徑,本文使用開源軟件進(jìn)行智慧圖書館數(shù)字人實(shí)現(xiàn)探索如圖2所示,其中語料來源為華南地區(qū)某高校圖書館部分檔案、運(yùn)行日志、網(wǎng)站、規(guī)章制度、常見問題、公眾號(hào)等。
第一步將語料資源導(dǎo)入到Max KB知識(shí)庫,并對(duì)在線語料與離線語料進(jìn)行向量化、分片、標(biāo)注與存儲(chǔ),如圖2所示。
圖2 根據(jù)語料創(chuàng)建知識(shí)庫
第二步使用Ollama平臺(tái)創(chuàng)建llama2大語言模型,并根據(jù)知識(shí)庫內(nèi)容優(yōu)化參數(shù),如圖3所示。
圖3 在知識(shí)庫中進(jìn)行語料向量化和分片
第三步在大語言模型之上創(chuàng)建圖書館數(shù)字人問答支撐平臺(tái),如圖4所示。
圖4 在Ollama中構(gòu)建語言模型
第四步通過調(diào)用AI數(shù)字人驅(qū)動(dòng)平臺(tái),完成圖書館數(shù)字人上線進(jìn)行領(lǐng)域知識(shí)問答,如圖5所示。
圖5 使用知識(shí)庫和語言模型創(chuàng)建問答支撐平臺(tái)
5 數(shù)字人推動(dòng)智慧圖書館創(chuàng)新發(fā)展
智慧圖書館理論框架是圖書館基本理論在智慧技術(shù)上的進(jìn)一步延伸,而數(shù)字人的引入將讓智慧圖書館內(nèi)涵與特征、圖書館管理與服務(wù)上更加深動(dòng)和豐富。
5.1 進(jìn)一步提升圖書館的智慧形態(tài)
智慧圖書館體系結(jié)構(gòu)包含基礎(chǔ)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、資源標(biāo)準(zhǔn)、服務(wù)標(biāo)準(zhǔn)、空間標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)等[11],其架構(gòu)是從全國圖書館標(biāo)準(zhǔn)化技術(shù)委員會(huì)標(biāo)準(zhǔn)體系結(jié)構(gòu)演化而來。隨著數(shù)字人技術(shù)成熟與應(yīng)用,智慧圖書館體系結(jié)構(gòu)將面臨新的升級(jí),需要明確數(shù)字人的基礎(chǔ)硬件、軟件、環(huán)境,制定數(shù)字人服務(wù)標(biāo)準(zhǔn)、劃定服務(wù)范圍,并且將物理空間向虛擬空間擴(kuò)展,增加與數(shù)字人相關(guān)的管理內(nèi)容,例如數(shù)字員工管理規(guī)定、數(shù)字人服務(wù)評(píng)價(jià)機(jī)制、數(shù)字人信息安全、數(shù)字人數(shù)據(jù)資產(chǎn)管理等,進(jìn)一步提升圖書館智慧體形態(tài),使得圖書館全時(shí)段、高精度的虛擬參考咨詢服務(wù)成為可能,實(shí)現(xiàn)圖書館真正意義上的“全時(shí)域”服務(wù)。
5.2 進(jìn)一步提升圖書館管理的智慧程度
智慧技術(shù)對(duì)圖書館管理工作有一定的增效提速作用,數(shù)字人的到來則可以對(duì)管理工作進(jìn)行一次顛覆。例如,書庫管理,數(shù)字人可以接管除了上架以外的所有工作,例如上架指導(dǎo)、錯(cuò)架提醒、報(bào)表生成,還可以借助自動(dòng)化機(jī)器人完成盤點(diǎn)工作,通過后臺(tái)強(qiáng)大的大數(shù)據(jù)、云計(jì)算和人工智能算力支撐,以數(shù)字人助理館員形象為書庫管理員提供實(shí)時(shí)數(shù)據(jù)概覽與下一步工作方向,將管理工作的智慧程度提升一個(gè)層次。
數(shù)字人作為工作人員參與到圖書館日常工作后勢必也會(huì)帶來管理架構(gòu)的創(chuàng)新,常規(guī)的圖書館部門內(nèi)部各司其職、部門之間互通有無,數(shù)字人館員則可跨越部門的界限,是一個(gè)全能型選手。如果數(shù)字人館員數(shù)量逐漸增加,可以考慮單獨(dú)設(shè)置一個(gè)“數(shù)字館員”部門,提升數(shù)字人管理地位與形象。隨著數(shù)字人生產(chǎn)力的逐漸增強(qiáng),數(shù)字人館員也會(huì)產(chǎn)生分工,形成如處理一般事務(wù)的數(shù)字人員工、提供專業(yè)型產(chǎn)業(yè)知識(shí)技能的數(shù)字人專家、進(jìn)行學(xué)習(xí)鼓勵(lì)與學(xué)習(xí)輔助的陪伴數(shù)字人、進(jìn)行圖書館公共資源預(yù)約沖突裁決的數(shù)字人裁判等,這就更加需要圖書館進(jìn)行組織架構(gòu)創(chuàng)新,賦予“新員工”合適的角色。
5.3 進(jìn)一步增強(qiáng)圖書館工作的高度協(xié)同
圖書館評(píng)價(jià)體系是提升管理科學(xué)程度、提高服務(wù)質(zhì)量的有力抓手,數(shù)字人的引入可以從評(píng)價(jià)內(nèi)容、評(píng)價(jià)指標(biāo)、評(píng)價(jià)技術(shù)等多方面促成各個(gè)工作環(huán)節(jié)之間的高度協(xié)同。首先數(shù)字人的引入可對(duì)制度創(chuàng)新提出新的需求,如可在勞動(dòng)組織、工作計(jì)量、人員培訓(xùn)、崗位職責(zé)等方面進(jìn)行規(guī)章制度的創(chuàng)新,對(duì)包含基礎(chǔ)業(yè)務(wù)能力、核心業(yè)務(wù)能力、競爭能力、服務(wù)能力、管理能力、技術(shù)能力等在內(nèi)的評(píng)價(jià)客體進(jìn)行科學(xué)地評(píng)判,以促進(jìn)圖書館規(guī)章制度的進(jìn)一步完善。其次,對(duì)虛擬人在提供虛擬參考咨詢、閱讀推廣、圖書館場所引導(dǎo)等服務(wù)時(shí)的業(yè)務(wù)范圍進(jìn)行限定,結(jié)合相應(yīng)指標(biāo)體系,保證其在合規(guī)合法的情況下進(jìn)行工作。如可將“全國縣級(jí)以上公共圖書館評(píng)估定級(jí)”指標(biāo)體系納入人工智能技術(shù),對(duì)圖書館進(jìn)行綜合、全面的數(shù)據(jù)考評(píng),提高數(shù)據(jù)評(píng)價(jià)指標(biāo)維度,形成數(shù)據(jù)駕駛艙,供圖書館決策使用[12]。
5.4 進(jìn)一步提高圖書館閱讀推廣成效
數(shù)字人引入到圖書館閱讀推廣工作中可以實(shí)現(xiàn)自動(dòng)化的館藏資源挖掘、智能化的資源內(nèi)容分類、智慧化的推廣內(nèi)容生成等功能,形成虛實(shí)結(jié)合的、面向元宇宙形態(tài)的知識(shí)管理體系、知識(shí)生產(chǎn)體系和閱讀推廣服務(wù)體系,從而完成數(shù)字人與圖書館閱讀推廣工作服務(wù)創(chuàng)新[13]。數(shù)字人作為圖書館閱讀推廣大使,可以突破場景、場地、內(nèi)容、形式、交互等多方面的限制,同時(shí)在閱讀推廣數(shù)字人的打造上,圖書館可以集中各種優(yōu)勢資源如館員、館藏、管理、服務(wù)等,抽取各類型資源的精華,打造帶有圖書館烙印的數(shù)字人閱讀推廣大使;也可以在專題閱讀推廣中根據(jù)背景環(huán)境使用公共數(shù)字人比如歷史人物、知名人物、科學(xué)家或動(dòng)畫形象等。
在閱讀推廣數(shù)字人的使用上,需要與閱讀推廣要素相結(jié)合,首先是主動(dòng)要素的結(jié)合,數(shù)字人需要能夠接收來自專業(yè)館員的閱讀推廣方案,或是數(shù)字人通過知識(shí)加工和創(chuàng)造生成閱讀推廣方案,再由專業(yè)館員進(jìn)行審核、發(fā)布和驅(qū)動(dòng),完成主動(dòng)推送的工作;其次是被動(dòng)要素的結(jié)合,在閱讀推廣活動(dòng)中,閱讀推廣數(shù)字人需要為讀者找到較為恰當(dāng)?shù)钠鹾宵c(diǎn)推廣其需要的資源,在此過程中還可產(chǎn)生一定互動(dòng),根據(jù)讀者對(duì)推廣活動(dòng)的反饋進(jìn)行下次方案的調(diào)整。其中,可應(yīng)用虛擬助手助力圖書館線上對(duì)外服務(wù),提供定制化的3D客服形象,并與圖書館形象進(jìn)行綁定,在讀者心中打造專屬助手形象。同時(shí),借助數(shù)字人的AI對(duì)話和實(shí)時(shí)反饋能力,服務(wù)伴隨讀者的使用全過程,例如讀者使用傳統(tǒng)的圖書館OPAC,則可以將數(shù)字人嵌入到OPAC頁面,通過學(xué)習(xí)讀者的檢索過程判斷其所需要的資源,并實(shí)時(shí)進(jìn)行推薦,也可以根據(jù)讀者對(duì)推薦的反饋信息,進(jìn)一步挖掘館藏資源,實(shí)現(xiàn)讀者和數(shù)字人虛擬助手的良性互動(dòng)。
6 數(shù)字人應(yīng)用的潛在風(fēng)險(xiǎn)
隨著數(shù)字人在各行業(yè)的應(yīng)用,尤其在圖書館業(yè)務(wù)中的應(yīng)用,其勢必會(huì)增加圖書館運(yùn)營成本。目前,數(shù)字人產(chǎn)業(yè)界一般將其成熟期定義為1~2年,才能完全勝任相關(guān)領(lǐng)域工作,在此期間需要持續(xù)賦予其豐富的內(nèi)容;同時(shí)數(shù)字人生產(chǎn)和運(yùn)維成本較高,實(shí)時(shí)反饋型數(shù)字人造價(jià)一般在100萬左右,而其運(yùn)維費(fèi)用更高達(dá)800萬每年,即使是超寫實(shí)數(shù)字人視頻制作成本也在每秒8000元至15 000元區(qū)間,圖書館需要找到低成本、可持續(xù)之路。除此以外,圖書館在服務(wù)方面要注意自然人權(quán)力保障。權(quán)力保障涉及的自然人既包括圖書館工作人員又包括讀者。對(duì)于圖書館工作人員,數(shù)字人的引入無疑會(huì)對(duì)其工作崗位產(chǎn)生直接競爭,甚至?xí)〈徊糠肿匀蝗斯ぷ鲘徫?,從而產(chǎn)生職業(yè)焦慮,影響其事業(yè)、心理、生理健康發(fā)展,需要引導(dǎo)其發(fā)展。對(duì)于讀者,數(shù)字人會(huì)存在敏感信息搜集邊界不清晰風(fēng)險(xiǎn),從而侵犯自然人的隱私權(quán),對(duì)自然人的人格尊嚴(yán)和自主性產(chǎn)生負(fù)面影響。因此,這些都需要在建設(shè)之初制定科學(xué)的管理制度進(jìn)行規(guī)避。
7 結(jié)語
數(shù)字人技術(shù)隨著元宇宙技術(shù)的飛速發(fā)展而快速迭代,圖書館需要積極開展相關(guān)技術(shù)儲(chǔ)備,為即將到來的變革做好充分準(zhǔn)備。圖書館也需要積極嘗試業(yè)界已經(jīng)產(chǎn)出的數(shù)字人產(chǎn)品,通過使用、體驗(yàn)逐步探索數(shù)字人在推進(jìn)智慧圖書館建設(shè)的諸多可能性,驗(yàn)證數(shù)字人技術(shù)在理論創(chuàng)新、管理創(chuàng)新、服務(wù)創(chuàng)新方面的作用,從而不斷開拓智慧圖書館建設(shè)的新場景。與此同時(shí),圖書館也需要警惕數(shù)字人帶來的潛在風(fēng)險(xiǎn),基于概率模型的數(shù)字人具有一定的不可預(yù)測性,如何讓其合規(guī)、合法地提供服務(wù)也是圖書館需要特別關(guān)注的問題。
參考文獻(xiàn):
劉煒,祝蕊,單蓉蓉.圖書館元宇宙:是什么、為什么和怎么做?[1362e4ce75dca9299e1d63c625d6b37fJ].圖書館論壇,2022,42(7):7-17.
司莉,馬小景.元宇宙視角下虛擬數(shù)字人賦能
圖書館用戶服務(wù)研究[J].圖書館建設(shè), 2023(6):
62-68.
科技智谷.對(duì)不起,虛擬數(shù)字人拒絕做社畜[EB/OL].(2022-05-11)[2023-09-06]. https://mp.
weixin.qq.com/s/KFOR5iW1-WqFvof25mXxBw.
婁方園,齊夢娜,王竹新,等.元宇宙場域下的
教育數(shù)字人及其應(yīng)用[J].圖書館論壇, 2023,43
(3):101-108.
智東西內(nèi)參.數(shù)字人深度報(bào)告:元宇宙下的爆火概念,技術(shù)和應(yīng)用一文看懂[EB/OL].(2022-01-23)[2023-09-06].https://www.thepaper.cn/news
Detail_forward_16410296.
儲(chǔ)節(jié)旺,陳夢蕾.人工智能驅(qū)動(dòng)圖書館變革[J].
大學(xué)圖書館學(xué)報(bào),2019,37(4):5-13.
張小峰,謝鈞,羅健欣,等.深度學(xué)習(xí)語音合成技術(shù)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(9):50-59.
鐘遠(yuǎn)薪,王蕾,楊新涯,等.徽州文書文本化語
音識(shí)別技術(shù)應(yīng)用研究[J].圖書館論壇, 2023,43
(2):49-56.
王靜靜,葉鷹.生成式AI及其GPT類技術(shù)應(yīng)用對(duì)信息管理與傳播的變革探析[J].中國圖書館學(xué)報(bào),2023,49(6):41-50.
段薈,張海,王東波.信息資源管理領(lǐng)域科研人員對(duì)ChatGPT態(tài)度、認(rèn)知及應(yīng)對(duì)策略研究[J].情報(bào)理論與實(shí)踐,2023,46(7):17-24.
申曉娟,邱奉捷,楊凡.智慧圖書館標(biāo)準(zhǔn)體系的構(gòu)建[J].中國圖書館學(xué)報(bào),2023,49(3):41-54.
文化和旅游部辦公廳公共服務(wù)司.文化和旅游
部辦公廳關(guān)于開展第七次全國縣級(jí)以上公共圖
書館評(píng)估定級(jí)工作的通知[EB/OL].[2023-05-10].
https://zwgk.mct.gov.cn/zfxxgkml/ggfw/202206/t20220602_933319.html.
張興旺,畢語馨,鄭聰.圖書館與元宇宙理論融
合:內(nèi)涵特征、體系結(jié)構(gòu)與發(fā)展趨勢[J].圖書與情報(bào), 2021(6):81-89.
鄭 聰 桂林理工大學(xué)圖書館副研究館員。 廣西桂林,541000。
柏 雪 桂林理工大學(xué)圖書館副研究館員。 廣西桂林,541000。
呂艷娥 桂林理工大學(xué)圖書館副研究館員。 廣西桂林,541000。
陳 茫 桂林理工大學(xué)商學(xué)院教授、研究館員。 廣西桂林,541000。
(收稿日期:2023-11-28 編校:左靜遠(yuǎn),曹曉文)
*本文系國家社會(huì)科學(xué)規(guī)劃基金資助一般項(xiàng)目“嶺南瑤族鄉(xiāng)村民俗檔案文化數(shù)字化傳承保護(hù)與創(chuàng)新交融研究”(項(xiàng)目編號(hào): 22BTQ081)、廣西哲學(xué)社會(huì)科學(xué)研究課題“數(shù)字人文視域下廣西桂劇非遺的文化基因提取與知識(shí)圖譜構(gòu)建研究”(項(xiàng)目編號(hào):23FTQ006)系列研究成果。