錢毅 崔浩男
摘 要:人物照片檔案資源蘊含豐富的隱性知識和語義信息,其深度開發(fā)利用仍處于探索階段。文章借鑒圖像學(xué)的圖像類型和分析層次理論,結(jié)合當(dāng)下的人臉識別等技術(shù),提出以“認人—識人—用人”為明線、“人臉特征庫—人物知識庫—人物應(yīng)用場景池”為暗線的人物照片檔案開發(fā)新框架,以實現(xiàn)照片檔案的要素識別、語義關(guān)聯(lián)和深度利用,對于轉(zhuǎn)變照片檔案開發(fā)利用的傳統(tǒng)思維和固有方式具有指導(dǎo)作用。
關(guān)鍵詞:照片檔案;信息資源開發(fā);圖像學(xué)理論;語義增強
分類號:G273
Research on the Development and Utilization of Portrait Photographic Archives Based on Iconology Theory
Qian Yi1,2, Cui Haonan1,3( 1.School of Information Resource Management of Renmin University of China, Beijing 100872; 2.Research Center of Electronic Records Management of Renmin University of China, Beijing 100872; 3.Research Center for Digital Humanities of Renmin University of China, Beijing 100872 )
Abstract: Portrait photographic archives contain rich tacit knowledge and semantic information, and their in-depth development and utilization is still in the exploratory stage. Based on the image type and analytic hierarchy theory of iconology, combined with the current face recognition and other technologies, this paper puts forward a new framework for the development of portrait photographic archives, which takes recognizing portrait - knowing portrait - using portrait as the bright line and face feature database - portrait knowledge database - portrait application scene as the dark line, so as to realize the element recognition, semantic relevance and in-deep utilization of photographic archives. This paper has a directive function for changing the traditional thinking and inherent way of photographic archives development and utilization.
Keywords: Photographic Archives; Development of Information Resources; Iconology Theory; Semantic Enhancement
檔案資源的智慧化轉(zhuǎn)型是“十四五”時期檔案工作應(yīng)對數(shù)字時代挑戰(zhàn)、實現(xiàn)全面數(shù)字轉(zhuǎn)型的題中之義。但是,當(dāng)前檔案資源的智慧化轉(zhuǎn)型研究還大多圍繞常規(guī)文本類資源展開,對特殊門類資源的管理和開發(fā)關(guān)注不足,缺乏深入、可復(fù)用的智慧化開發(fā)路徑與方法。特殊門類的檔案資源往往信息表示更為復(fù)雜,凝聚的語義更為豐富,可挖掘的價值更強,對于豐富和提升檔案機構(gòu)的資源品質(zhì)具有不可或缺的獨特作用。因此,本文聚焦人物照片檔案,即組織機構(gòu)或個人在社會實踐活動中直接形成的對國家和社會具有保存價值并歸檔保存的人像照片,結(jié)合圖像學(xué)理論與人工智能技術(shù),創(chuàng)新照片檔案開發(fā)利用的思維,探索照片檔案資源智慧化轉(zhuǎn)型的路徑和方案。
當(dāng)前,照片檔案管理的研究趨勢已從傳統(tǒng)照片檔案轉(zhuǎn)向數(shù)碼照片檔案,進入“深水區(qū)”和“內(nèi)涵式”的高質(zhì)量發(fā)展階段。為聚焦研究主題,筆者通過在中國知網(wǎng)、萬方、維普等文獻庫中檢索主題為“數(shù)碼照片檔案”的文獻(檢索時間為2022年2月),發(fā)現(xiàn)當(dāng)前研究主要圍繞“數(shù)碼照片檔案”“數(shù)碼照片”“照片檔案”“檔案管理”等主題展開;研究主體集中在公共事業(yè)單位;研究內(nèi)容比較關(guān)注在數(shù)碼時代的客觀環(huán)境下,依托照片檔案管理的現(xiàn)狀改進實際工作,側(cè)重經(jīng)驗總結(jié)。[1-3]此外,當(dāng)前研究較少關(guān)注人物照片檔案這一特定類別,僅有學(xué)者提出一種照片檔案人物自動標注方法,以解決不同照片重復(fù)人物的標注問題。[4]
1 人物照片檔案開發(fā)利用的新理論
本文的研究對象是人物照片檔案,即原生數(shù)碼照片檔案和傳統(tǒng)載體照片檔案的數(shù)字化成果中包含人物要素的部分。人物照片檔案歸根結(jié)底屬于“圖像”的范疇,因而可以借鑒藝術(shù)領(lǐng)域中圖像學(xué)的相關(guān)理論。圖像志(Iconography)被認為是圖像學(xué)發(fā)展的早期階段,[5]是藝術(shù)史研究的一種方法學(xué),主要涉及圖像的收集、整理和描述、分類工作,并對作品中的人物身份、事件、形象進行知識性的解釋。20世紀后,傳統(tǒng)圖像志發(fā)展為現(xiàn)代圖像學(xué)研究,開始注重對圖像作品主題事件和深層意義的探索。[6]
1.1 圖像類型研究
美國藝術(shù)史學(xué)家馬克·D·富勒頓區(qū)分了“象征性”和“敘事性”兩種圖像類型,認為象征性圖像表示某種物體或現(xiàn)象,敘事性圖像則主要和某個故事或事件相關(guān)聯(lián),都帶有深刻的精神寓意和文化內(nèi)涵。[7]據(jù)此,人物照片檔案可區(qū)分為“象征型人物照片”和“敘事型人物照片”。象征型人物照片是指以人物形象為核心拍攝對象,為特定目的而進行的有選擇性的拍攝,如人物標準肖像照、會議合影等形式。這類照片往往在照片檔案中占據(jù)相當(dāng)比重,由于其形成本身具有特定目的性和時機選擇性,因而在常規(guī)管理到位的情況下,相關(guān)元數(shù)據(jù)信息有一定的保障。敘事型人物照片則是指為記錄客觀活動場景而拍攝的一類照片,人物作為其中的要素得以展示。這類照片的“敘事性”特點突出,主要用于展示客觀活動過程和典型場景,承載更多的業(yè)務(wù)動作和事件屬性,相對而言沒有刻意突出人物形象,符合人們平時生活中的“抓拍”情形,人物形象表達也更為自然。簡而言之,象征型照片有較強的確定性,數(shù)據(jù)來源更為明確;敘事型照片的隨機性更強,數(shù)據(jù)來源更為豐富。在人物照片檔案開發(fā)中應(yīng)有機融合兩種照片類型,在不同應(yīng)用場景中充分發(fā)揮兩種照片的優(yōu)勢。
1.2 圖像分析層次研究
圖像學(xué)提供的圖像分析層次思想可以用于指導(dǎo)人物照片檔案的開發(fā)。帕諾夫斯基將圖像學(xué)分析步驟分為三層:第一層為“前圖像志描述”,即描述圖像的自然意義,包括外觀的形式結(jié)構(gòu)、外在事實意義等,解釋者應(yīng)該有實際經(jīng)驗;第二層為“圖像志分析”,是發(fā)現(xiàn)、解釋圖像的傳統(tǒng)意義和作品的特定主題,解釋者應(yīng)該有原典知識;第三層為“圖像學(xué)分析”,解釋圖像或作品的內(nèi)在意義和內(nèi)容,解釋者應(yīng)該有綜合直覺能力。[8]由此可見,結(jié)合圖像背后的內(nèi)涵才能理解圖像的完整意義。在大規(guī)模數(shù)字化的當(dāng)下,這種對圖像作品內(nèi)容的描述和闡釋方法可為人物照片檔案的內(nèi)容開發(fā)環(huán)節(jié)帶來啟示。如表1所示。
2 人物照片檔案開發(fā)利用的新框架
基于上述圖像學(xué)理論,結(jié)合人工智能技術(shù),尤其是人臉識別技術(shù)的廣泛應(yīng)用,本文從實際業(yè)務(wù)開展和基礎(chǔ)設(shè)施構(gòu)建兩條線索共同切入,探索人物照片檔案開發(fā)利用的新思維。一方面,從檔案行業(yè)的業(yè)務(wù)開展內(nèi)容看,“認人—識人—用人”分別對應(yīng)圖像學(xué)分析的三個層次,可作為“明線”貫穿業(yè)務(wù)活動中;另一方面,從資源體系和技術(shù)融合的角度看,結(jié)合上述線索可以構(gòu)建“人臉特征庫—人物知識庫—人物應(yīng)用場景池”的基礎(chǔ)設(shè)施“暗線”,分別代表著要素與要素的連接、知識與知識的關(guān)聯(lián)、場景與場景之間的協(xié)同?!懊骶€”與“暗線”的三個環(huán)節(jié)分別由淺至深地實現(xiàn)信息要素識別、信息語義關(guān)聯(lián)和信息深度利用的目的。如圖1所示,本文提出基于圖像學(xué)理論的人物照片檔案開發(fā)框架,可根據(jù)需求進一步構(gòu)建實現(xiàn)路徑和應(yīng)用場景模塊,實現(xiàn)底層對象、中層要素、高層語義的連接。
2.1 明線——實際業(yè)務(wù)開展
照片檔案管理可以圍繞“人”這一基礎(chǔ)性要素創(chuàng)新人物照片檔案開發(fā)的流程,促使人物照片檔案在“載體—文件—數(shù)據(jù)—語義—價值”維度上延伸。
(1)認人:人臉識別技術(shù)的成熟應(yīng)用
認人,指通過人工智能技術(shù)中的人臉識別技術(shù)能夠?qū)?shù)碼照片檔案中的人物予以高效識別和精準指認。就照片檔案的利用而言,利用者通常會用“人名”作為關(guān)鍵字進行檢索,這就要求對照片中的人物進行充分的識別和標注。目前對人物照片檔案的識別方式比較傳統(tǒng):主要依據(jù)照片檔案六要素“拍攝時間、事由、地點、人物、背景、攝影者”進行。在要素齊全的情況下,可根據(jù)“人物”要素的相關(guān)著錄信息進行識別,而當(dāng)照片檔案進館要素不齊、照片檔案載體本身出現(xiàn)發(fā)黃粘連和脫落、只著錄了主要人物信息卻沒有著錄所有人物信息時,[9]則往往依靠人工識別。AI人臉識別技術(shù)的發(fā)展使得基于人物圖像的數(shù)碼照片自動“認人”成為可能,據(jù)此可以對人物圖像識別的邏輯與嵌入照片檔案管理全過程的技術(shù)要點進行重新設(shè)計。
(2)識人:人物照片檔案的語義關(guān)聯(lián)
識人,指基于現(xiàn)有人物圖像,結(jié)合相關(guān)檔案館藏以及外部信息源進行語義分析和邏輯關(guān)聯(lián)。目前,單靠文字說明和部分著錄元數(shù)據(jù)的照片檔案無法滿足檔案深度利用的要求,通過人工逐一標注海量照片數(shù)據(jù)的方式則囿于各項成本而難以實現(xiàn)。為突破瓶頸,需進一步創(chuàng)新“識人”機制,可使用對應(yīng)的圖像數(shù)據(jù)增強工具,結(jié)合圖像語義提取圖像特征值建立特征索引庫。同時,設(shè)計“識人”模式下的成果反哺機制,通過人臉識別技術(shù)所識別的人物信息,回溯至檔案特征索引庫中增加“補充性著錄資料”,逐漸豐富照片著錄信息。依托這種方式,通過自建或利用相關(guān)語義基礎(chǔ)設(shè)施,可以批量對人物照片檔案相關(guān)信息進行語義增強,如利用其家族、所在機構(gòu)、社交圈、相關(guān)事件、行動軌跡等基礎(chǔ)數(shù)據(jù)對人物進行語義拓展和關(guān)聯(lián)。
(3)用人:人物照片的深度挖掘利用
用人,指借助照片檔案資源中的人物要素及其關(guān)聯(lián)信息,在各類利用場景中挖掘人物照片檔案資源的深度利用價值,最終服務(wù)于前端開發(fā)工作。其核心含義是將“認人”和“識人”中獲得的人物表面信息,結(jié)合其他背景要素信息,在人工智能技術(shù)手段下,形成真實、完整、流暢的檔案敘事。其主要思路包括:第一,基于人工智能的各項服務(wù)場景技術(shù),如照片時間軸技術(shù)、GPS地點人物相結(jié)合的元素檢索技術(shù)、情感分析技術(shù)等,實現(xiàn)對照片檔案中人物的軌跡分析、交集分析、關(guān)系分析、情感分析等。第二,結(jié)合人物照片檔案的其他元素信息(如主題、時間、地點、攝影者等)進行交叉分析處理,完整展示照片形成的歷史背景和社會環(huán)境因素,探索多人物交集環(huán)境下多要素結(jié)合的檔案檢索、查詢應(yīng)用,明晰檔案信息深度挖掘利用的基本路徑。第三,協(xié)助檔案機構(gòu)人員開展歸檔環(huán)節(jié)的決策分析,通過人物庫與移交照片的對比,獲取反饋結(jié)果,從而為檔案人員開展歸檔鑒定提供判斷依據(jù),實現(xiàn)敏感信息自動識別與檔案分級分類。第四,借助數(shù)據(jù)平臺實現(xiàn)開發(fā)成果的實時迭代更新,當(dāng)新的人物照片檔案數(shù)據(jù)源納入該成果主題時,依照開發(fā)模型和規(guī)范,相關(guān)新數(shù)據(jù)會被及時填入開發(fā)產(chǎn)品中。
2.2 暗線——基礎(chǔ)設(shè)施構(gòu)建
建設(shè)人臉特征庫、人物知識庫、人物應(yīng)用場景池等檔案語義基礎(chǔ)設(shè)施是提升人物照片檔案資源開發(fā)能力的“暗線”。檔案語義基礎(chǔ)設(shè)施是用于拓展檔案數(shù)據(jù)內(nèi)涵的具有工具性和服務(wù)性的語義產(chǎn)品。[10]照片檔案語義基礎(chǔ)設(shè)施不僅包含帶有照片檢索服務(wù)的文獻庫,還包含基于資源對象和數(shù)據(jù)單元層面的基礎(chǔ)知識庫和開發(fā)產(chǎn)品,應(yīng)支持跨機構(gòu)的共建共享、跨網(wǎng)域的開放互聯(lián)和跨領(lǐng)域的知識融通。[11]這將涉及到照片檔案數(shù)字化、文本化、數(shù)碼照片的知識表示、數(shù)字圖像互聯(lián)與共享、照片知識庫構(gòu)建等多個環(huán)節(jié)。[12]
(1)人臉特征庫:通過技術(shù)賦能管理
人臉特征庫建設(shè)的核心是通過人臉識別技術(shù)賦能精細化管理,主要包括“技術(shù)認人”和“管理認人”兩個關(guān)鍵節(jié)點。技術(shù)認人是通過人臉識別技術(shù)和外部資源的協(xié)同來建設(shè)人臉比對庫,提高認人的效率,避免大量的重復(fù)勞動,是后續(xù)開發(fā)環(huán)節(jié)的基礎(chǔ)。管理認人是在主題場景的指導(dǎo)下,通過人工提取著錄項,豐富元數(shù)據(jù)中的基本信息,有利于進一步增強信息密度、打破信息迷霧、提升信息關(guān)聯(lián)。通過技術(shù)和管理手段來構(gòu)建人臉特征庫實現(xiàn)照片人物識別,可以克服合影人物眾多難以識別、老舊照片人物模糊、人物信息不全等難點,是照片價值得以充分發(fā)揮的重要途徑,也是照片檔案資源進行人機交互的重要方式。
(2)人物知識庫:通過關(guān)聯(lián)增強語義
通過人臉識別、人工著錄能夠得到較為充分的人物照片檔案基礎(chǔ)數(shù)據(jù),由此可以進一步以人物照片檔案內(nèi)容的解析為基礎(chǔ),建立人物照片檔案信息的關(guān)聯(lián)關(guān)系,實現(xiàn)照片檔案之間、照片檔案與其他資源之間的靈活互動,建設(shè)人物知識庫等語義基礎(chǔ)設(shè)施。由于與照片人物相關(guān)的信息很有可能分布存放在不同單位和系統(tǒng)之中,加之采用不同的描述方法和標準,難以實現(xiàn)跨機構(gòu)、跨系統(tǒng)的開發(fā)利用。但人物照片檔案與相關(guān)檔案資源往往隱含著共同的“記憶點”,因而通過對照片檔案內(nèi)容進行分層處理,形成照片層、元數(shù)據(jù)層和標簽層的多層數(shù)據(jù)對象,針對數(shù)據(jù)對象采用主題建模、標簽加注等手段來構(gòu)建本體模型和知識圖譜,可以在人物層面實現(xiàn)語義樹的層次拓展和縱向延伸。在這個過程中,人物照片檔案所記錄反映的“人、事、時、地、物”要素及其互相之間的關(guān)系能夠得到更加靈活的揭示,可以將更多的顯性知識與隱性知識、內(nèi)部知識與關(guān)聯(lián)知識、通用知識與專用知識疊加起來,實現(xiàn)照片檔案內(nèi)容的語義增強,[13]有助于完整反映歷史事實的證據(jù)情況和發(fā)展線索。
(3)人物應(yīng)用場景池:通過成果輔助敘事
數(shù)字時代的人物照片檔案開發(fā)成果及其應(yīng)用場景應(yīng)更加多元,包括數(shù)字出版物、專題數(shù)據(jù)庫、微系統(tǒng)、融媒體可視化產(chǎn)品等。這些多元化的成果能提供各種數(shù)據(jù)服務(wù),用戶可通過可視化產(chǎn)品瀏覽、數(shù)據(jù)庫檢索、數(shù)據(jù)集調(diào)用、微服務(wù)應(yīng)用等多種方式加以利用,并可以在線上直接與開發(fā)者進行雙向交互,由此支撐構(gòu)建以照片檔案為核心資源的融媒體數(shù)字記憶空間,真正實現(xiàn)全方位、多模態(tài)圖文互動的檔案敘事。隨著媒體融合時代的到來,檔案敘事不再單單依靠文字,而是應(yīng)綜合運用圖片、視頻、音頻等多種信息傳播方式,給用戶帶來更加豐富的使用感受。隨著互聯(lián)網(wǎng)技術(shù)與數(shù)字展陳設(shè)備的發(fā)展,照片檔案的圖像敘事正在實現(xiàn)流程再造,敘事的“集中采編、移動優(yōu)先、融媒產(chǎn)品、全屏直播”成為趨勢,統(tǒng)一的檔案故事在不同媒體中呈現(xiàn)出不同敘事特征,一種多元化的檔案敘事形態(tài)正在形成。伴隨著照片檔案智能化的發(fā)展,照片檔案在檔案敘事中的作用將不斷凸顯,其與檔案文本敘事方式可以有機結(jié)合,利用融媒體展陳產(chǎn)生新的敘事風(fēng)格,實現(xiàn)從“零散信息”到“聚合信息”的跨越,即借助照片檔案的典型性特點,結(jié)合其他檔案材料的完整性特點,實現(xiàn)多資源、多媒體聯(lián)動,完成全方位的檔案敘事。
3 總結(jié)與展望
照片檔案具有生動性、講述力、故事感,采用圖像文字組合等簡單的數(shù)字化形式雖能復(fù)原或重構(gòu)相關(guān)信息,卻難以描述故事元素之間的復(fù)雜關(guān)聯(lián)和模糊語義。本研究基于圖像學(xué)理論,以“認人、識人、用人”為線索,提出實現(xiàn)人物照片檔案信息識別、分析和挖掘利用的新框架,有助于從根本上轉(zhuǎn)變照片檔案的管理邏輯起點,實現(xiàn)從照片檔案的載體管理轉(zhuǎn)向照片檔案的內(nèi)容管理。未來在檔案工作實踐過程中結(jié)合人工智能技術(shù)不斷檢驗、改進現(xiàn)有框架,可以將原先照片資源開發(fā)過程中對人物照片檔案的簡要羅列式的思維,創(chuàng)新為“以人敘事”的新型人物照片檔案開發(fā)思路,將原先“用照片去襯托故事”的利用模式變?yōu)椤坝谜掌ブv故事”的新模式,實現(xiàn)人物照片檔案資源和其他資源之間的關(guān)聯(lián)敘事,真正實現(xiàn)照片檔案資源的“活化”。
*本文系國家檔案局科技項目“AI人臉識別在數(shù)碼照片檔案管理中的應(yīng)用研究”(項目編號:2021-X-09)階段性研究成果。
注釋與參考文獻
[1]朱玉清.基于高校照片檔案編研的反饋及思考[J].中國檔案,2021(4):44-45.
[2]曾靜怡,顧偉,劉力超,等.照片檔案創(chuàng)新編研思路探析[J].檔案學(xué)通訊,2021(4):71-76.
[3]曾靜怡.上下文在照片檔案敘事中的應(yīng)用[J].檔案學(xué)研究,2021(6):100-105.
[4]李剛.一種照片檔案的人物自動標注的方法[J].電子技術(shù)與軟件工程,2020(15):137-138.
[5]比亞洛斯托基,楊思梁,宋青青.圖像志[J].新美術(shù),1990(1):73-88.
[6]徐建融.大辭海:美術(shù)卷[M].上海:上海辭書出版社,2012:516.
[7]李旭暉,吳燕秋,王曉光.基于角色關(guān)聯(lián)的敘事型文化遺產(chǎn)知識表示方法[J].圖書情報工作,2017(9):116-122.
[8]宋小蒙.從圖像志看圖像學(xué)的本土化[J].美與時代(下),2020(11):15-17.
[9]郭俊山.淺談檔案館搬遷中的檔案保護[J].黑龍江檔案,2019(1):97.
[10]劉煒,謝蓉,張磊,等.面向人文研究的國家數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)[J].中國圖書館學(xué)報,2016(5):29-39.
[11]夏翠娟.面向人文研究的“數(shù)據(jù)基礎(chǔ)設(shè)施”建設(shè)——試論圖書館學(xué)對數(shù)字人文的方法論貢獻[J].中國圖書館學(xué)報,2020(3):24-37.
[12]顏佳,楊敏,彭梅.面向數(shù)字人文的圖像數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)研究——以我國圖博檔領(lǐng)域為視角[J].圖書館,2021(5):51-58.
[13]陳濤.目標檢測在數(shù)字人文圖像中的應(yīng)用嘗試[J].數(shù)字人文研究,2021(3):39-50.