黃麗清
[摘 要]現(xiàn)代科技推動(dòng)了數(shù)字檔案的發(fā)展步伐,尤其是人工智能技術(shù)的應(yīng)用,使“互聯(lián)網(wǎng)+檔案建設(shè)”成為可能。人工智能技術(shù)的優(yōu)勢,體現(xiàn)在數(shù)字檔案資源收集、分類檢索、價(jià)值鑒定與安全管理等方面,提高了檔案管理工作的智能性,同時(shí)也對管理人員的專業(yè)技能提出了高要求。本文主要對資源分類檢索功能展開分析,希望對數(shù)字檔案現(xiàn)代化發(fā)展起到積極借鑒作用。
[關(guān)鍵詞]人工智能技術(shù);數(shù)字檔案;信息資源;分類;檢索
doi:10.3969/j.issn.1673 - 0194.2019.14.078
[中圖分類號]G270.7[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2019)14-0-02
0? ? ?引 言
互聯(lián)網(wǎng)推動(dòng)了各行業(yè)發(fā)展,應(yīng)用價(jià)值正在不斷拓展,國家將其提高至戰(zhàn)略發(fā)展層面。人工智能技術(shù)出現(xiàn),加深了互聯(lián)網(wǎng)與檔案整合力度,能夠盡快實(shí)現(xiàn)檔案數(shù)字化與智能化目標(biāo)。相關(guān)部門通過對人工智能技術(shù)的開發(fā)與應(yīng)用推廣,拓展資源分類檢索功能模塊,切實(shí)對檔案信息化管理助力。
1? ? ?人工智能技術(shù)概述
人工智能發(fā)展經(jīng)歷了推理期、知識期與學(xué)習(xí)期,學(xué)習(xí)方法的商業(yè)價(jià)值也隨之提高。代表技術(shù)逐漸多樣化,從自然語言處理入手分析,指利用計(jì)算機(jī)處理人類自然語言的技術(shù),可以是書面形式語言,也可以口頭語言處理;這一技術(shù)被廣泛應(yīng)用到信息檢索與機(jī)器翻譯等領(lǐng)域。從模式識別入手分析,指計(jì)算機(jī)模擬人類感官,理解周圍環(huán)境或識別外界信息的技術(shù),被廣泛應(yīng)用于人臉、語音等識別領(lǐng)域。從專家系統(tǒng)入手分析,該計(jì)算機(jī)程序整合了多領(lǐng)域?qū)I(yè)經(jīng)驗(yàn)、知識,用于解決領(lǐng)域?qū)嶋H問題。從分布式智能研究入手分析,系統(tǒng)是問題求解實(shí)體的結(jié)合體,通過實(shí)體間的交互協(xié)作等,提升系統(tǒng)性能。機(jī)器學(xué)習(xí)指計(jì)算機(jī)模擬人類活動(dòng)以及獲取知識技能的方法,能夠提高整體系統(tǒng)性能。此外,人工智能技術(shù)整合了語言學(xué)與仿生學(xué)等學(xué)科內(nèi)容,以此實(shí)現(xiàn)對數(shù)據(jù)信息與知識的高效處理。
2? ? ?數(shù)字檔案應(yīng)用人工智能技術(shù)的必要性
2.1? ?強(qiáng)化檔案服務(wù)成效
在現(xiàn)在快節(jié)奏的生活狀態(tài)下,用戶對信息服務(wù)提出了更高要求,包括快速準(zhǔn)確、全面性等要求,常規(guī)檔案服務(wù)模式儼然不能滿足檔案館現(xiàn)代化發(fā)展需要。在信息時(shí)代,檔案館建設(shè)更注重與網(wǎng)絡(luò)等現(xiàn)代信息技術(shù)相結(jié)合,以此轉(zhuǎn)變信息服務(wù)模式,強(qiáng)化信息服務(wù)成效。在用戶需求與現(xiàn)代科技的帶動(dòng)下,檔案館數(shù)字化建設(shè)水平不斷提高,尤其是人工智能技術(shù)的應(yīng)用,使用戶檔案查詢操作更加便利與可靠,檔案服務(wù)與管理水平不斷提升。
2.2? ?強(qiáng)化資源管理成效
互聯(lián)網(wǎng)推動(dòng)了各行業(yè)發(fā)展,但在檔案資源管理方面的應(yīng)用正處于摸索性前進(jìn)階段,仍有較大的發(fā)展空間。同時(shí),數(shù)字檔案資源出現(xiàn)巨大轉(zhuǎn)變,信息資源內(nèi)容與形式更加豐富,增加了檔案管理的難度,但提高檔案管理成效的途徑更加廣泛,可通過引進(jìn)新經(jīng)驗(yàn)與新理念等方式實(shí)現(xiàn),但先進(jìn)技術(shù)引入是必不可少的。尤其是人工智能技術(shù)在信息資料管理中的應(yīng)用,包括機(jī)器學(xué)習(xí)與管理方式辨識等核心技術(shù),實(shí)現(xiàn)了信息資料精細(xì)化收集與分類管理,管理成效隨之加強(qiáng)。此外,核心技術(shù)應(yīng)用價(jià)值體現(xiàn)在快速分類文件收集形式的信息資料方面,按照標(biāo)識文件組合,快速查找關(guān)聯(lián)資料,以此實(shí)現(xiàn)信息分類。從檔案分類技術(shù)入手分析,能夠?qū)崿F(xiàn)自動(dòng)化分類整理文件類資料,可根據(jù)預(yù)先設(shè)定好的形式,分類整理數(shù)據(jù)庫檔案資料,也可以利用各種識別方法展開對數(shù)操作,包括視頻或圖片等識別技術(shù)。應(yīng)用技術(shù)組合,檔案效率會隨之強(qiáng)化,如模式辨別與普通話處理技術(shù),組合應(yīng)用能夠強(qiáng)化資料檢索功能,能夠根據(jù)資料篩選與錄入要求,快速完成信息資料錄入等工作,在智能化方面的作用優(yōu)勢,也是傳統(tǒng)人工檔案分類、檢索工作模式不能比擬的。核心技術(shù)組合應(yīng)用后,能夠自動(dòng)按照要求完成指定工作,并篩選過濾出不符合條件的信息資料,縮短檢索時(shí)間。人工智能技術(shù)在數(shù)字檔案信息資料管理中的應(yīng)用,涉及多種核心技術(shù),管理功能也隨之呈現(xiàn)多樣化的特點(diǎn),除文字信息資料分類檢索功能外,也可以完成對視頻圖片等資料分類檢索,進(jìn)一步豐富了檔案資料的信息載體。
2.3? ?實(shí)現(xiàn)“互聯(lián)網(wǎng)+檔案”戰(zhàn)略目標(biāo)
現(xiàn)階段,人們的生產(chǎn)生活對互聯(lián)網(wǎng)的依賴度逐漸增強(qiáng),步入“互聯(lián)網(wǎng)+”時(shí)代,“互聯(lián)網(wǎng)+檔案戰(zhàn)略”建設(shè)在緊鑼密鼓地展開,但實(shí)踐中的問題逐漸暴露。數(shù)字檔案信息數(shù)據(jù)龐大,檔案管理無從下手,傳統(tǒng)管理模式的滯后性逐漸顯現(xiàn),不能滿足信息時(shí)代的發(fā)展需要。基于此,引入人工智能技術(shù)意義重大,在帶動(dòng)檔案數(shù)字化與智能化建設(shè)發(fā)展的同時(shí),能夠盡快實(shí)現(xiàn)這一戰(zhàn)略目標(biāo)。
3? ? ?人工智能技術(shù)的具體應(yīng)用
3.1? ?智能收集資源
從網(wǎng)絡(luò)檔案資源入手分析,企業(yè)應(yīng)借助相應(yīng)技術(shù)將檔案資源轉(zhuǎn)化為數(shù)字形式,以圖片視頻等多媒體形式呈現(xiàn),在各種計(jì)算機(jī)介質(zhì)上分布式儲存,包括光介質(zhì)與磁介質(zhì)等,使其借助網(wǎng)絡(luò)成為通信傳遞、再現(xiàn)的集合體。在信息時(shí)代,網(wǎng)絡(luò)檔案信息數(shù)據(jù)龐大,種類隨之多樣化,針對信息資源的搜索過濾等工作,通常利用Agent實(shí)現(xiàn),以此實(shí)現(xiàn)智能收集。智能Agent的種類多樣,涉及學(xué)習(xí)Agent以及基于目標(biāo)、模型反射Agent等。Agent的自主交互性特征明顯,能夠根據(jù)預(yù)設(shè)的收集要求,自動(dòng)收集符合規(guī)則的信息資料,同時(shí)為使用者提供信息服務(wù)。各個(gè)種類的Agent應(yīng)用目的與功能存在差異,如智能爬蟲,其實(shí)際功能是抓取后分析網(wǎng)頁,以此獲得格式化數(shù)據(jù)。對此,檔案管理人員可根據(jù)資料收集需要,擇優(yōu)使用智能Agent,以此達(dá)到快速、準(zhǔn)確收集信息資料的目的。
3.2? ?智能分類資源
網(wǎng)絡(luò)檔案包含各種信息資料,信息數(shù)據(jù)的格式來源存在較大差異且雜亂無序,分類整理難度較大。快速找到準(zhǔn)確的數(shù)據(jù)信息,對信息預(yù)處理成果提出了更高要求,是對檔案管理工作人員專業(yè)性的一種挑戰(zhàn)。提高檔案信息資源分類智能水平,需利用智能分類技術(shù),將雜亂無序的知識數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行分類管理,確保信息數(shù)據(jù)能夠準(zhǔn)確定位與快速獲取。在檔案信息資料智能分類管理中,檔案管理人員需要先將信息數(shù)據(jù)進(jìn)行籠統(tǒng)性地主題劃分,再對各個(gè)主題進(jìn)行細(xì)化分類,以此構(gòu)建出多層次的主題結(jié)構(gòu)體系。實(shí)現(xiàn)數(shù)字檔案智能分類的人工智能技術(shù)多樣,核心技術(shù)包括機(jī)器學(xué)習(xí)、自然語言處理等,都可以實(shí)現(xiàn)資源智能分類。應(yīng)用自然語言處理方法時(shí),主要運(yùn)用文本分類技術(shù),在被標(biāo)準(zhǔn)過的文本樣本庫內(nèi),尋找與文本屬性相關(guān)聯(lián)的模型,利用模型區(qū)分全新文本。文本類信息資源能夠借助文本分類技術(shù)實(shí)現(xiàn)智能分類,實(shí)現(xiàn)途徑涉及以下幾項(xiàng),一是根據(jù)實(shí)現(xiàn)預(yù)設(shè)的信息資料分類方法,對文本類資源進(jìn)行劃分。二是抓取網(wǎng)頁,分析內(nèi)存的文本類信息,最后進(jìn)行智能劃分。第三,利用辨別技術(shù)組合后的分類技術(shù),辨別與分類數(shù)字檔案資源,如視頻圖像或語音等辨別技術(shù)。
3.3? ?智能搜索資源
在現(xiàn)代科技的帶動(dòng)下,人工智能技術(shù)得以迅猛發(fā)展,應(yīng)用范疇在不斷拓展。同時(shí),面對龐大的信息數(shù)據(jù)量,傳統(tǒng)檔案資源檢索模式明顯后勁不足,應(yīng)用弊端逐漸顯現(xiàn)。面對這種沖擊,提高信息資源檢索效率,滿足檔案工作需要,還需加大先進(jìn)技術(shù)的投入力度,帶動(dòng)傳統(tǒng)檢索模式優(yōu)化,實(shí)現(xiàn)檢索工作的智能性與高效性。數(shù)字檔案信息資源的智能檢索,集合了自然語言處理、模式辨別等核心技術(shù),但影響智能檢索成效發(fā)揮的因素較多,包括檔案管理人員的觀念與系統(tǒng)維護(hù)人員的專業(yè)水平等,因此,加強(qiáng)投入使用的科學(xué)管理意義重大。智能檢索的優(yōu)勢特征明顯,是傳統(tǒng)檢索模式不能比擬的,兩者的差異在于前者能夠?yàn)橛脩艨焖贆z索出與搜索內(nèi)容相近的信息資料,同時(shí),按照時(shí)間等順序標(biāo)準(zhǔn),排列檢索出來的信息資料,以此提高檢索成效,縮短檢索時(shí)間。此外,相比較于傳統(tǒng)檢索,智能檢索能夠檢出具有豐富信息載體的多媒體資料,包括聲音與視頻等資料。處于新媒體時(shí)代,數(shù)字檔案信息資料的發(fā)展更加快速,智能檢索技術(shù)憑借自身獨(dú)特的優(yōu)勢作用,逐步取代了傳統(tǒng)檔案的檢索技術(shù),為提高檔案檢索工作效率起到了積極促進(jìn)作用。
檔案分類管理工作意義重大,目的是實(shí)現(xiàn)數(shù)字檔案利用價(jià)值最大化,為檔案資料使用者提供優(yōu)質(zhì)與滿意的服務(wù),實(shí)現(xiàn)網(wǎng)絡(luò)檔案信息化管理。但實(shí)際上,影響網(wǎng)絡(luò)檔案管理成效的因素較多,加之信息資源種類繁多,知識數(shù)據(jù)來源廣泛,直接給用戶檢索增加了障礙。用戶想要盡快獲取最理想的檢索資料結(jié)果,需引入人工智能技術(shù)中的搜索技術(shù)。搜索技術(shù)種類多樣,如神經(jīng)網(wǎng)絡(luò)技術(shù)、模擬人類神經(jīng)網(wǎng)絡(luò)行為、分布式處理各種數(shù)據(jù)信息,以滿足用戶信息搜索需要。檔案分類管理是復(fù)雜且煩瑣的過程,全面強(qiáng)化搜索引擎功用,前提是高效整合神經(jīng)網(wǎng)絡(luò)技術(shù)。智能搜索引擎研發(fā)成功后,能夠準(zhǔn)確檢索資料中的數(shù)據(jù)知識等信息,科學(xué)高效管理檔案。
智能搜索引擎研發(fā)是系統(tǒng)工程,涉及多種算法與理論,以此實(shí)現(xiàn)應(yīng)用程序有效設(shè)計(jì),包括統(tǒng)計(jì)學(xué)、神經(jīng)網(wǎng)絡(luò)理論等,實(shí)現(xiàn)龐大數(shù)據(jù)信息快速整理分類,將最符合用戶搜索內(nèi)容的資料結(jié)果向用戶及時(shí)推送與傳遞,滿足用戶對檔案知識的需要。此外,該應(yīng)用程序能夠?qū)崟r(shí)掌握信息概念,自主學(xué)習(xí)與存儲概念內(nèi)含,便于日后搜索概念。智能搜索方法融合了模式辨別技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)等核心AI技術(shù),能夠?qū)⑿畔⑺阉鞫ㄎ唬O(shè)立在含義或文本內(nèi)容等基礎(chǔ)上,幫助用戶獲取最有價(jià)值的檢索信息。為提高信息資源檢索成效與檔案信息服務(wù),為用戶設(shè)立可拓展的信息資源結(jié)構(gòu)體系,企業(yè)檔案信息資源必須提高完整度,提高信息利用率,推動(dòng)檔案館現(xiàn)代化進(jìn)一步發(fā)展。
4? ? ?結(jié) 語
在網(wǎng)絡(luò)化時(shí)代,在國家“互聯(lián)網(wǎng)+”計(jì)劃號召下,數(shù)字檔案管理工作加大了人工智能技術(shù)的整合力度,使其不僅要滿足時(shí)代發(fā)展需要,還要帶動(dòng)檔案管理現(xiàn)代化發(fā)展。尤其是在檔案分類檢索工作中應(yīng)用人工智能核心技術(shù),能夠快速處理雜亂無章的信息資源,提高信息資源的檢索分類成效,為用戶提供最優(yōu)質(zhì)的信息服務(wù),以此進(jìn)一步提升檔案管理水平。
主要參考文獻(xiàn)
[1]李志勇,李鵬偉,高小燕,等.人工智能醫(yī)學(xué)技術(shù)發(fā)展的聚焦領(lǐng)域與趨勢分析[J].中國醫(yī)學(xué)裝備,2018(7).
[2]王本陸,千京龍,盧億雷,等.簡論中小學(xué)人工智能課程的建構(gòu)[J].教育研究與實(shí)驗(yàn),2018(4).