科技檔案作為重要的科技創(chuàng)新資源[1-2],記錄著科技創(chuàng)新活動(dòng)的來(lái)龍去脈和創(chuàng)新成果產(chǎn)出,對(duì)其進(jìn)行有效利用能夠促進(jìn)科技創(chuàng)新水平提升。然而,目前科技檔案管理工作的重點(diǎn)仍停留在檔案實(shí)體管理等常規(guī)工作上,缺少基于科技檔案內(nèi)容的知識(shí)服務(wù)、檔案智能檢索等深度開發(fā),難以發(fā)揮出科技檔案資源對(duì)科技創(chuàng)新活動(dòng)的賦能作用[3]。
人工智能技術(shù)[4]誕生于1956年,是研究、開發(fā)用于模擬、延伸和擴(kuò)展人類智能的理論、方法、技術(shù)以及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué)。目前,其在自然語(yǔ)言處理、模式識(shí)別、生物特征識(shí)別以及知識(shí)圖譜等領(lǐng)域取得顯著進(jìn)展[5]。《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》提出要探索人工智能在檔案信息深層加工和利用中的應(yīng)用以及數(shù)字檔案館建設(shè)中的應(yīng)用。當(dāng)前,城建等行業(yè)探索將人工智能技術(shù)應(yīng)用于行業(yè)檔案管理,并形成了較為成熟的研究成果[6]。將人工智能技術(shù)與科技檔案特點(diǎn)和管理規(guī)律相結(jié)合并運(yùn)用在科技檔案工作之中,勢(shì)必能夠發(fā)揮科技檔案資源對(duì)創(chuàng)新的賦能作用。
一、人工智能技術(shù)在科技檔案領(lǐng)域的適用性分析
科技檔案作為檔案資源重要組成部分,具有完整性、綜合性和動(dòng)態(tài)性等顯著特點(diǎn)。
在完整性方面,科技檔案記錄科研項(xiàng)目立項(xiàng)論證、研究實(shí)施、過(guò)程管理、結(jié)題驗(yàn)收、績(jī)效評(píng)價(jià)、成果登記等環(huán)節(jié),各環(huán)節(jié)之間既相互獨(dú)立又緊密相關(guān),反應(yīng)了科研項(xiàng)目的全流程,具有較強(qiáng)的完整性。
在綜合性方面,科學(xué)研究、技術(shù)開發(fā)都是綜合且復(fù)雜的系統(tǒng)工程,項(xiàng)目可行性研究、立項(xiàng)論證、研究方案制定、技術(shù)路線實(shí)施、成果應(yīng)用與轉(zhuǎn)化等環(huán)節(jié)之間有著較強(qiáng)的關(guān)聯(lián)性,這就決定了科技檔案具有形式多樣性、內(nèi)容廣泛性的特點(diǎn)。
在動(dòng)態(tài)性方面,科技創(chuàng)新是不斷發(fā)展進(jìn)步的迭代過(guò)程,科技檔案工作必須要與科技創(chuàng)新保持同步,進(jìn)行必要的動(dòng)態(tài)跟蹤管理,對(duì)已有檔案進(jìn)行及時(shí)補(bǔ)充、完善和更新,使科技檔案能夠全面、真實(shí)反應(yīng)科技創(chuàng)新水平。
科技檔案的上述特點(diǎn)決定了其在科技創(chuàng)新過(guò)程中發(fā)揮著重要作用,同時(shí)也促進(jìn)參與創(chuàng)新活動(dòng)的各類主體、科創(chuàng)活動(dòng)管理部門、成果轉(zhuǎn)化及應(yīng)用部門的聯(lián)系更加緊密,這都對(duì)科技檔案管理的工作量和檔案質(zhì)量提出了新的要求。同時(shí),由于科技檔案要具備動(dòng)態(tài)性,檔案部門及時(shí)對(duì)接科創(chuàng)活動(dòng)各相關(guān)方,在第一時(shí)間合規(guī)獲取最新檔案,并發(fā)揮科技檔案對(duì)科技創(chuàng)新的參考、憑證、資政的多重價(jià)值。為此,需要處理好各部門間的資源對(duì)接、文件歸檔、卷宗管理,并從內(nèi)容層面甚至語(yǔ)義層面對(duì)檔案進(jìn)行信息檢索和智能分析,根據(jù)用戶需求提供精準(zhǔn)信息服務(wù)。然而,科技檔案管理部門受體制機(jī)制、人員編制、業(yè)務(wù)水平等因素制約,難以全部滿足上述要求。
人工智能技術(shù)的本質(zhì)是信息系統(tǒng)在資源受限的情況下,對(duì)外界環(huán)境或需求變化作出自適應(yīng)的調(diào)整。同時(shí),根據(jù)《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》,可將人工智能技術(shù)分為通用技術(shù)(如知識(shí)圖譜、模式識(shí)別等)和關(guān)鍵領(lǐng)域技術(shù)(如自然語(yǔ)音處理、生物特征識(shí)別等)。這些細(xì)分技術(shù)在社會(huì)生產(chǎn)、生活各方面均得到較為成熟的應(yīng)用[7],同時(shí)以ChatGPT為代表的智能產(chǎn)品將人工智能技術(shù)帶到了新的高度。因此,將人工智能技術(shù)應(yīng)用到科技檔案工作當(dāng)中,勢(shì)必能夠滿足科技檔案高質(zhì)量管理、精準(zhǔn)服務(wù)等方面的要求,破解目前科技檔案部門工作中存在的各類資源相對(duì)不足的難題。
二、人工智能在科技檔案領(lǐng)域的應(yīng)用場(chǎng)景分析
科技檔案作為檔案資源的一個(gè)重要類型,其全生命周期包括“收管存用”四個(gè)環(huán)節(jié)。
(一)智能化采集
在大數(shù)據(jù)時(shí)代,科技檔案具有種類多樣、形式多元、來(lái)源多渠道等特征。因此,在進(jìn)行檔案資料采集時(shí),一方面需要借助智能終端設(shè)備在線爬取互聯(lián)網(wǎng)信息資源等作為元數(shù)據(jù),并通過(guò)自然語(yǔ)言處理技術(shù)將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)原始檔案素材的采集;另一方面,利用人工智能技術(shù)可以將科技檔案中對(duì)專家學(xué)者進(jìn)行采訪獲得的口述史等原始音頻和視頻素材轉(zhuǎn)錄為文字資料。
(二)智能化管理
1.檔案智能分類
利用自然語(yǔ)言處理技術(shù)和自監(jiān)督學(xué)習(xí)技術(shù)訓(xùn)練出人工智能文本分類器模型,對(duì)科技檔案文本進(jìn)行面向特定服務(wù)的語(yǔ)義級(jí)檔案分類,如:從研究領(lǐng)域、成果形式、項(xiàng)目單位等維度對(duì)科技檔案進(jìn)行分類。同時(shí),利用文字識(shí)別技術(shù)對(duì)科技檔案內(nèi)容進(jìn)行智能分類,輔助開展科技檔案分類體系建設(shè)。
2.檔案開放鑒定
將《文書檔案保管期限表》《科學(xué)技術(shù)研究檔案管理規(guī)定》等作為人工智能模型訓(xùn)練的微調(diào)知識(shí),進(jìn)行下游任務(wù)訓(xùn)練,使人工智能模型具備科技管理和檔案管理等相關(guān)知識(shí),能夠?qū)崿F(xiàn)專家系統(tǒng)的功能,模擬人類專家對(duì)檔案開放共享策略作出決策,為科技檔案有效開放利用提供工具支撐和技術(shù)保障。
3.檔案修復(fù)及安全管理
利用人工智能技術(shù)修復(fù)文字檔案中的文字壞損、音頻或視頻檔案中的信息失幀等,提升科技檔案的完整性。同時(shí),將生物特征識(shí)別、模式識(shí)別等技術(shù)嵌入檔案門禁管理系統(tǒng)、識(shí)別跟蹤系統(tǒng)以及防火墻等產(chǎn)品中,實(shí)現(xiàn)檔案訪問(wèn)權(quán)限控制、安全預(yù)警、風(fēng)險(xiǎn)監(jiān)控等,提升科技檔案的使用安全性。
(三)智能化保存
將人工智能技術(shù)運(yùn)用在科技檔案保存環(huán)節(jié)是將人工智能模型與檔案數(shù)字化系統(tǒng)進(jìn)行系統(tǒng)集成和功能融合,實(shí)現(xiàn)對(duì)科技活動(dòng)中形成的項(xiàng)目申報(bào)書、研究報(bào)告、研究方案等科研過(guò)程文檔進(jìn)行電子化保存和自動(dòng)化歸檔。一方面,可以利用人工智能提升檔案數(shù)字化系統(tǒng)功能,使其能夠?qū)萍紮n案進(jìn)行自動(dòng)化保存,實(shí)現(xiàn)檔案電子化即歸檔的功能。另一方面,可以將人工智能模型融入檔案數(shù)字化管理系統(tǒng),對(duì)管理系統(tǒng)中錄入的檔案信息進(jìn)行智能化處理,將離散的系統(tǒng)信息整合為可直接歸檔的科技檔案文件。
(四)智能化利用
1.檔案智能化檢索
利用人工智能中的自然語(yǔ)言處理技術(shù)訓(xùn)練科技檔案語(yǔ)料庫(kù),使人工智能模型具備針對(duì)特定主題或研究領(lǐng)域的智能檢索能力,同時(shí)結(jié)合人工智能技術(shù)實(shí)現(xiàn)智能化檢索主題檔案、智能化存取檔案操作以及智能化檔案歸檔等,減輕一線工作人員的勞動(dòng)強(qiáng)度。
2.檔案知識(shí)服務(wù)
通過(guò)自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)語(yǔ)義級(jí)的檔案內(nèi)容提取,實(shí)現(xiàn)面向特定應(yīng)用場(chǎng)景或用戶需求的檔案內(nèi)容服務(wù)。如:針對(duì)同一科研項(xiàng)目檔案,既可以對(duì)項(xiàng)目研究領(lǐng)域進(jìn)行分析,形成該領(lǐng)域的研究案例,還可以對(duì)項(xiàng)目成果轉(zhuǎn)化情況進(jìn)行概述歸納,形成研究成果展示素材。同時(shí),通過(guò)從語(yǔ)義級(jí)提取科技檔案信息、獲取科技檔案內(nèi)容,利用內(nèi)容標(biāo)注與分類技術(shù),將科技檔案進(jìn)行多維度劃分,實(shí)現(xiàn)對(duì)同一檔案資源的多場(chǎng)景復(fù)用。
3.科技主題宣傳
利用“人工智能多模態(tài)大模型+數(shù)字檔案館”提取科技檔案中的文字內(nèi)容信息,利用文生圖、文生視頻技術(shù)生成圖片或視頻等多媒體資料并通過(guò)音頻和視頻的方式進(jìn)行同步展現(xiàn),利用新媒體對(duì)外發(fā)布,實(shí)現(xiàn)對(duì)科技創(chuàng)新活動(dòng)及其成果的推廣宣傳。
三、人工智能在科技檔案管理中的應(yīng)用策略
(一)夯實(shí)數(shù)字化檔案資源基礎(chǔ)
推進(jìn)科技檔案資源增量數(shù)字化和存量電子化,將科技檔案中包含的文字、圖片等轉(zhuǎn)化為計(jì)算機(jī)可讀、可用的格式,并作為人工智能模型訓(xùn)練的先驗(yàn)知識(shí),訓(xùn)練出科技檔案管理垂直領(lǐng)域模型,提升模型對(duì)科技檔案資源管理及開發(fā)利用的適用性。此外,對(duì)現(xiàn)有檔案管理信息系統(tǒng)進(jìn)行改造,將人工智能模型嵌入現(xiàn)有系統(tǒng),實(shí)現(xiàn)檔案管理的智能化與自動(dòng)化。
(二)注重檔案資源利用安全性
部分科技檔案會(huì)涉及對(duì)國(guó)家科技安全具有重要影響的項(xiàng)目信息,而人工智能的“黑盒”特性使其輸出結(jié)果不可解釋、運(yùn)行過(guò)程不安全。因此,注重人工智能產(chǎn)品訓(xùn)練過(guò)程中的數(shù)據(jù)安全,篩選已在行業(yè)主管部門登記備案的人工智能產(chǎn)品進(jìn)行模型訓(xùn)練,確保訓(xùn)練過(guò)程不發(fā)生數(shù)據(jù)泄露;同時(shí),加強(qiáng)人工智能使用過(guò)程中的數(shù)據(jù)安全制度設(shè)計(jì),形成涵蓋檔案電子化與數(shù)字化、檔案信息提取、檔案信息資源輸入、人工智能產(chǎn)品輸出等全鏈條的數(shù)據(jù)安全制度。
(三)編制科技檔案領(lǐng)域人工智能應(yīng)用指南
編制科技檔案領(lǐng)域人工智能應(yīng)用指南,提升利用人工智能技術(shù)的規(guī)范性和應(yīng)用效能。一方面,促進(jìn)人工智能與檔案管理學(xué)融合,對(duì)人工智能應(yīng)用于科技檔案來(lái)源、全宗原則、文件生命周期,以及電子檔案四性保障、元數(shù)據(jù)管理等場(chǎng)景進(jìn)行梳理,實(shí)現(xiàn)檔案管理原則、方法與人工智能技術(shù)的有機(jī)融合;另一方面,引導(dǎo)人工智能模型集成至科技檔案管理系統(tǒng)框架,使其支撐數(shù)字化檔案全生命周期、全流程、全要素的管理與服務(wù),發(fā)揮人工智能對(duì)科技檔案資源開發(fā)利用的引領(lǐng)作用,更好服務(wù)科技創(chuàng)新。
四、結(jié)語(yǔ)
科技檔案具有完整性、綜合性、動(dòng)態(tài)性等特點(diǎn),將人工智能應(yīng)用在科技檔案管理工作的“收管存用”四個(gè)環(huán)節(jié),通過(guò)網(wǎng)絡(luò)信息爬取、信息轉(zhuǎn)錄、檔案分類、開放鑒定、檔案修復(fù)與安全管理、檔案知識(shí)服務(wù)、智能檢索等,可充分提升科技檔案利用效能,但在此過(guò)程中,也要注意夯實(shí)數(shù)字化檔案資源基礎(chǔ)、注重檔案資源利用安全、編制應(yīng)用指南等,以更好發(fā)揮人工智能技術(shù)在檔案管理中的作用。
參考文獻(xiàn):
[1] 張文馨,張笑星,田議方.我國(guó)人工智能在檔案領(lǐng)域的應(yīng)用研究綜述[J].蘭臺(tái)內(nèi)外,2021 (15):12-15.
[2] 郝莎.科技檔案編研探析[J].蘭臺(tái)世界,2017(18):60-63.
[3] 贠疆鵬,加小雙,王妍.人工智能在我國(guó)檔案管理中的應(yīng)用現(xiàn)狀與對(duì)策分析[J].檔案與建設(shè),2023(2):62-65.
[4] 沙洲.人工智能在檔案工作中的應(yīng)用研究[J].檔案與建設(shè),2018(2):36-39.
[5] 林凱,鄭慧. 國(guó)外人工智能在檔案工作中的應(yīng)用研究及啟示[J].山西檔案,2020(1):104-111.
[6] 孫琳,陳著,劉謹(jǐn)銘.人工智能技術(shù)在城建檔案管理中的可能應(yīng)用場(chǎng)景及推進(jìn)策略[J].檔案與建設(shè),2023(7):68-70.
[7] 劉麗,王兆偉,張明智.生成式人工智能對(duì)檔案工作的影響[J].浙江檔案,2023(9):47-50.
基金項(xiàng)目:天津市科技計(jì)劃智庫(kù)項(xiàng)目“天津市應(yīng)用基礎(chǔ)研究項(xiàng)目‘首席制’組織管理模式研究”(21ZLZKZF00500)
作者單位:天津市科學(xué)技術(shù)發(fā)展戰(zhàn)略研究院 天津工業(yè)大學(xué)后勤管理處