趙宣哲
摘要:傳統(tǒng)的聲像檔案著錄模式已不能滿足新時(shí)代人們對(duì)數(shù)字聲像檔案的需求,該文提出了數(shù)字聲像檔案智能標(biāo)注,詳細(xì)分析了可能出現(xiàn)的問題,并深入思考相應(yīng)的對(duì)策建議。由于技術(shù)的先進(jìn)性,這僅僅是筆者的一種構(gòu)想,以期未來檔案領(lǐng)域能夠引入更多新技術(shù),提高數(shù)字聲像檔案管理水平。
關(guān)鍵詞:數(shù)字聲像檔案 人工智能 智能標(biāo)注 檔案管理
在信息技術(shù)不斷進(jìn)步的今天,數(shù)字聲像檔案管理工作逐漸成為當(dāng)前檔案工作的重難點(diǎn)問題,智能標(biāo)注的應(yīng)用能夠簡(jiǎn)化數(shù)字聲像檔案管理工作對(duì)人工的依賴,是對(duì)聲像檔案工作的創(chuàng)新性探索,對(duì)促進(jìn)檔案事業(yè)發(fā)展有著重要意義。
數(shù)字聲像檔案智能標(biāo)注是依賴計(jì)算機(jī)系統(tǒng)直接利用人工智能技術(shù)完成對(duì)數(shù)字聲像檔案內(nèi)容信息的處理,達(dá)到生成多個(gè)關(guān)鍵詞的目的。為了與傳統(tǒng)的“標(biāo)引”有所區(qū)別,本文采用了“標(biāo)注”的概念。傳統(tǒng)的自動(dòng)標(biāo)引,又稱計(jì)算機(jī)輔助標(biāo)引,即根據(jù)文獻(xiàn)內(nèi)容,依靠系統(tǒng)程序全部或部分按照主題法掃描內(nèi)容給出主題詞,通常主要用于文本分類、主題詞標(biāo)引等,對(duì)于數(shù)字聲像檔案來說不太適用。而“智能標(biāo)注”可以說是一個(gè)全新的概念,利用人工智能技術(shù)從根本上解決檔案工作者在數(shù)字聲像檔案內(nèi)容信息標(biāo)注上的難題。
(一)內(nèi)生動(dòng)力不足
相對(duì)于文書檔案,當(dāng)前大量生成數(shù)字聲像檔案的機(jī)關(guān)單位較少,一些具有執(zhí)法職能的行政管理部門,由于歷史的原因,可能會(huì)存有較多執(zhí)法過程中的聲像檔案。這些檔案大多被存放在形成部門(如各機(jī)關(guān)的執(zhí)法大隊(duì)),沒有集中到單位的檔案部門管理,導(dǎo)致檔案部門對(duì)數(shù)字聲像檔案的形成、保管及查詢使用情況不了解,對(duì)新變化不敏感。另外,綜合檔案館的電子檔案接收工作是近年來才開展的,機(jī)關(guān)單位向檔案館移交電子檔案的過程中更多的是移交文書檔案,而數(shù)字聲像檔案相對(duì)較少。因此,無論是機(jī)關(guān)單位還是作為永久保存基地的綜合檔案館,在數(shù)字聲像檔案管理方面探索新管理方式的動(dòng)力不足。
此外,隨著“放管服”改革等政策的不斷深入和改善營(yíng)商環(huán)境的持續(xù)推進(jìn),政府部門在加強(qiáng)事中事后監(jiān)管方面新的措施不斷出臺(tái),數(shù)字聲像檔案的記錄和憑證作用也將進(jìn)一步深化。如果檔案部門不能敏銳地發(fā)現(xiàn)和應(yīng)對(duì)新的變化,勢(shì)必造成今后管理工作上的被動(dòng)。
(二)標(biāo)準(zhǔn)規(guī)范不完善
信息技術(shù)已經(jīng)發(fā)展到智能信息處理階段,而目前大多數(shù)單位仍然認(rèn)為一些新技術(shù)應(yīng)用于數(shù)字聲像檔案管理較為困難,根本原因是當(dāng)前的制度和指導(dǎo)性文件不完善,導(dǎo)致在管理過程中方向性不強(qiáng)。根據(jù)國(guó)家檔案局2017年8月發(fā)布的《錄音錄像類電子檔案元數(shù)據(jù)方案》(DA/T 63—2017)中的內(nèi)容判斷,聲像檔案標(biāo)準(zhǔn)規(guī)范仍然沒有擺脫傳統(tǒng)的管理理念。2020年5月發(fā)布的《錄音錄像檔案管理規(guī)范》(DA/T 78—2019)提到了著錄的要求,但是基本沿襲了傳統(tǒng)聲像檔案著錄的內(nèi)容,主要是從其形式特征的角度進(jìn)行描述,缺乏對(duì)聲像檔案內(nèi)容特征的描述,對(duì)技術(shù)前瞻性及新技術(shù)應(yīng)用的指導(dǎo)性建議不足?,F(xiàn)有標(biāo)準(zhǔn)規(guī)范的指導(dǎo)意義具有局限性,并沒有給新技術(shù)新手段留有一定空間。機(jī)關(guān)及企事業(yè)單位在數(shù)字聲像檔案大量生成、查詢需求明顯增強(qiáng)的情況下,若還是使用傳統(tǒng)的管理手段,不利于提高數(shù)字聲像檔案的標(biāo)注效率,更不利于數(shù)字聲像檔案的快速、高效檢索。
(三)檔案部門尚不具備獨(dú)立開發(fā)能力
數(shù)字聲像檔案智能標(biāo)注對(duì)管理水平和技術(shù)水平要求高,但大多數(shù)聲像檔案管理部門在數(shù)字聲像檔案管理的信息化研究和開發(fā)方面明顯能力不足,主要是單位自身并不具備獨(dú)立開發(fā)的能力。目前人工智能尚屬前沿技術(shù),該技術(shù)在交通運(yùn)輸領(lǐng)域應(yīng)用較為廣泛,主要是由于國(guó)家支持,社會(huì)力量參與廣泛,但在檔案領(lǐng)域應(yīng)用較少。在幾類檔案館中,綜合檔案館資源豐富,但技術(shù)力量相對(duì)較弱;一般企業(yè)規(guī)模較小,企業(yè)檔案室館藏資源不夠豐富;專業(yè)檔案館雖然館藏資源、技術(shù)力量尚可,但其缺乏資金的支持。即使資金到位,由于其檔案部門中技術(shù)開發(fā)人才占比較少,也不利于數(shù)字聲像檔案智能標(biāo)注技術(shù)的研發(fā)。
(四)數(shù)字聲像檔案智能標(biāo)注缺少大數(shù)據(jù)支持
數(shù)字聲像檔案智能標(biāo)注技術(shù)驗(yàn)證中重要的階段就是訓(xùn)練模型階段,這一階段各類人工智能技術(shù)較為依賴大數(shù)據(jù)模型。在智能標(biāo)注的過程中是需要通過監(jiān)督式學(xué)習(xí)自我訓(xùn)練建立標(biāo)準(zhǔn)的,而這個(gè)過程是需要一定量級(jí)數(shù)據(jù)支持的,比如人臉識(shí)別所需的人臉庫(kù),音頻識(shí)別所需的聲紋庫(kù),場(chǎng)景識(shí)別所需的場(chǎng)景特征庫(kù)等。而數(shù)字聲像檔案管理中無法獲取到所需的大數(shù)據(jù),其根本原因在于各個(gè)部門的大數(shù)據(jù)資源缺乏共享。如若缺少大數(shù)據(jù)對(duì)數(shù)字聲像檔案進(jìn)行有效的識(shí)別分析,則會(huì)使智能標(biāo)注過程中,出現(xiàn)錯(cuò)誤的概率加大,并會(huì)導(dǎo)致識(shí)別率下降等情況,無法起到很好的輔助聲像檔案管理的作用。
(五)數(shù)字聲像檔案管理水平參差不齊
現(xiàn)階段,不少機(jī)關(guān)單位數(shù)字聲像檔案收集困難,缺乏較為完備的儲(chǔ)存介質(zhì),加之預(yù)算有限,在數(shù)字聲像檔案的形成、管理、加工利用等各方面的管理手段均比較落后,水平參差不齊。有的檔案部門在形成或者收集聲像檔案的過程中,存在不注重“質(zhì)”強(qiáng)調(diào)“量”,以及清晰度等關(guān)鍵要素沒有達(dá)到標(biāo)準(zhǔn)就接收的現(xiàn)象,嚴(yán)重影響數(shù)字聲像檔案智能標(biāo)注的應(yīng)用與發(fā)展。
(一)提高對(duì)數(shù)字聲像檔案的認(rèn)識(shí)程度
為從源頭上改善并創(chuàng)新數(shù)字聲像檔案管理模式,需要轉(zhuǎn)變檔案工作者的管理觀念。一是要轉(zhuǎn)變對(duì)聲像檔案的傳統(tǒng)認(rèn)知。由于近年來聲像檔案的憑證作用明顯加強(qiáng),檔案工作者要積極學(xué)習(xí)與現(xiàn)代經(jīng)濟(jì)社會(huì)相適應(yīng)的聲像檔案管理方式。改善單一地對(duì)聲像信息處理只能通過人工判斷轉(zhuǎn)化為文本信息再進(jìn)行處理的間接處理方式,大膽創(chuàng)新,應(yīng)用先進(jìn)的人工智能技術(shù)成果,探索以圖找圖、以聲尋影的由計(jì)算機(jī)系統(tǒng)判斷的直接處理方式。二是要加強(qiáng)宣傳力度。各檔案館要利用好各類型宣傳陣地積極宣傳,公開展示一批精品數(shù)字聲像檔案、模擬辦理數(shù)字聲像檔案利用手續(xù)、宣講優(yōu)秀數(shù)字聲像檔案利用案例,使檔案工作者借此進(jìn)一步加深對(duì)數(shù)字聲像檔案認(rèn)識(shí)的同時(shí),也讓大眾親身體驗(yàn)到數(shù)字聲像檔案發(fā)揮的作用。
(二)制定數(shù)字聲像檔案管理規(guī)范
建議有關(guān)部門盡早出臺(tái)數(shù)字聲像檔案管理的相關(guān)規(guī)范要求,重點(diǎn)強(qiáng)調(diào)以下三點(diǎn)內(nèi)容:一是對(duì)于在數(shù)字聲像檔案管理中應(yīng)用人工智能技術(shù)給予明確具體的指導(dǎo)性意見;二是在起草修訂制度過程中應(yīng)有前瞻性,給新技術(shù)新手段留有制度空間;三是為促進(jìn)各部門共建共享數(shù)據(jù)庫(kù),實(shí)現(xiàn)數(shù)據(jù)庫(kù)資源共享等發(fā)展要求,建議檔案管理部門進(jìn)一步統(tǒng)籌出臺(tái)細(xì)則,明確對(duì)聲像檔案內(nèi)容特征的要求,促進(jìn)各檔案館根據(jù)標(biāo)準(zhǔn)規(guī)范,充分利用現(xiàn)代信息化技術(shù),實(shí)現(xiàn)數(shù)字聲像檔案資源的共享,以制度建設(shè)促進(jìn)數(shù)字聲像檔案管理工作提質(zhì)增效。
(三)鼓勵(lì)相關(guān)領(lǐng)域合作研發(fā)和開展技術(shù)試點(diǎn)
建議國(guó)家檔案局與公安、交通、高新技術(shù)公司等合作,也可以與有研發(fā)能力的大學(xué)開展相關(guān)技術(shù)的研發(fā)。同時(shí),應(yīng)鼓勵(lì)開展跨行業(yè)技術(shù)研發(fā),嘗試建立“單位+企業(yè)”等多種融合機(jī)制,加速推進(jìn)聲像檔案資源的開發(fā)。有的機(jī)關(guān)單位將數(shù)字聲像檔案智能系統(tǒng)外包,不僅有助于削減成本,更有助于提高聲像檔案資源開發(fā)的效率。在實(shí)施數(shù)字聲像檔案智能標(biāo)注的同時(shí),有必要引入資質(zhì)高、信譽(yù)好的外包公司,以獲得優(yōu)質(zhì)、高效、全面的解決方案,攻克應(yīng)用難點(diǎn)以確保數(shù)字聲像檔案智能標(biāo)注的安全和效率;也可在大型高新企業(yè)開展試點(diǎn),以便借助其人員與技術(shù)優(yōu)勢(shì)。
此外,應(yīng)倡導(dǎo)有關(guān)部門建立開放共享大數(shù)據(jù)的有效機(jī)制。大數(shù)據(jù)是智能標(biāo)注技術(shù)應(yīng)用的基礎(chǔ),直接決定著智能標(biāo)注技術(shù)是否能夠正常實(shí)行。依照相關(guān)法律開放共享大數(shù)據(jù)資源是技術(shù)發(fā)展的需要。因此,鼓勵(lì)相關(guān)部門將其所擁有的大數(shù)據(jù)成果共享,有助于推動(dòng)數(shù)字聲像檔案智能標(biāo)注技術(shù)的推廣與應(yīng)用。
(四)提高數(shù)字聲像檔案管理水平
安全可靠的軟硬件環(huán)境是開展數(shù)字聲像檔案智能標(biāo)注的基礎(chǔ)保障,直接決定著數(shù)字聲像檔案的管理水平。因此,應(yīng)用新技術(shù)的首要條件就是全面提升軟硬件基礎(chǔ)設(shè)施,及時(shí)做好系統(tǒng)升級(jí)優(yōu)化,減少系統(tǒng)運(yùn)行錯(cuò)誤,加強(qiáng)系統(tǒng)易用性,多方面提高系統(tǒng)的安全性、可靠性。尤其需要注意的是,在數(shù)字聲像檔案收集方面,應(yīng)明確對(duì)有價(jià)值的聲像文件應(yīng)歸盡歸,還應(yīng)明確收集時(shí)的數(shù)據(jù)內(nèi)容要具有真實(shí)性、完整性和可用性,以及格式要滿足相應(yīng)條件。例如,聲像采集應(yīng)采用高清及以上攝錄設(shè)備,以不低于1080P像素進(jìn)行記錄,推薦采用4K\8K標(biāo)準(zhǔn),從源頭優(yōu)化數(shù)字聲像檔案質(zhì)量,提高數(shù)字聲像檔案管理水平。
傳統(tǒng)的數(shù)字聲像檔案標(biāo)注由于投入人力成本高、聲像信息雜亂、標(biāo)注困難等,已漸漸無法滿足現(xiàn)代化業(yè)務(wù)工作的需求,若還用舊方法標(biāo)注,難免會(huì)影響數(shù)字聲像檔案利用工作的開展。因此,開發(fā)數(shù)字聲像檔案管理新手段迫在眉睫,筆者建議有能力的單位盡早探索如數(shù)字聲像檔案智能標(biāo)注等“新技術(shù)+檔案”的新管理手段,充分發(fā)揮人工智能技術(shù)在數(shù)字聲像檔案管理中的作用,全面試點(diǎn)新的數(shù)字聲像檔案管理模式,提高數(shù)字聲像檔案資源的標(biāo)注質(zhì)量和水平,最終實(shí)現(xiàn)數(shù)字聲像檔案資源的高效利用。
參考文獻(xiàn):
[1]高建輝.精準(zhǔn)扶貧數(shù)碼照片音視頻檔案專題數(shù)據(jù)庫(kù)應(yīng)用平臺(tái)開發(fā)研究[J].北京檔案,2021(11):25-28.
[2]盧曉峰.特殊載體檔案概述[J].黑龍江科技信息,2012(18):112.
[3]段長(zhǎng)征.視頻內(nèi)容分析技術(shù)剖析及在校園視頻監(jiān)控系統(tǒng)的應(yīng)用探討[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)2012,43(1):100-104.
[4]王雪飛.數(shù)字化背景下聲像檔案管理的若干思考[J].大眾科技,2011(10):247-248.
[5]智敏.基于內(nèi)容的視頻檢索和瀏覽的關(guān)鍵技術(shù)[D].北京:北京郵電大學(xué),2006.
[6]路程.視頻內(nèi)容檢索技術(shù)概述[J].山西科技,2018,33(2):56-58.
[7]許琪瑋.論高校檔案管理與大數(shù)據(jù)技術(shù)的應(yīng)用[J].辦公室業(yè)務(wù),2018(14):157.
[8]楊曉宇.基于深度學(xué)習(xí)智能標(biāo)注圖片關(guān)鍵字系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣州:中山大學(xué),2014.
作者單位:交通運(yùn)輸部檔案館