楊中營
摘要:本文從傳統(tǒng)音像檔案的保管和利用所面臨的問題切入,引入了音像檔案數(shù)字化,并從觀念、標(biāo)準(zhǔn)、人才和設(shè)備等方面分析了我國音像檔案數(shù)字化工作發(fā)展緩慢的原因,同時(shí)給出了推進(jìn)音像檔案數(shù)字化工作的對策和建議,著重闡述了音像檔案數(shù)字化的關(guān)鍵技術(shù)指標(biāo)選取問題。
關(guān)鍵詞:音像檔案數(shù)字化檔案數(shù)字化
音像檔案作為一種專門檔案,以其直觀、全面、生動再現(xiàn)等特點(diǎn),能夠全面記錄和生動還原歷史的真實(shí)面貌,能夠有效補(bǔ)充檔案全宗的完整性,能夠豐富檔案全宗的存在形式,在檔案工作中發(fā)揮著獨(dú)特的、重要的作用。但同時(shí)也因受到自身特點(diǎn)、存儲載體和播放設(shè)備等因素的影響和限制,傳統(tǒng)音像檔案的保管和利用狀況并不樂觀。傳統(tǒng)音像檔案經(jīng)歷了蠟筒、膠木、鋼絲和磁帶等作為記錄載體,其中,以磁帶為介質(zhì)的傳統(tǒng)音像檔案數(shù)量最多也最為常見。這些傳統(tǒng)錄音(像)帶檔案經(jīng)過長時(shí)間的存放和利用,磁介質(zhì)會發(fā)生退變、老化,信號逐步衰減,影像質(zhì)量越來越差,甚至無法正常播放。與此同時(shí),傳統(tǒng)的模擬音像系統(tǒng)和設(shè)備正逐漸淘汰,能夠正常使用的越來越少,存放在模擬音像帶上的珍貴音像資料將面臨永久丟失的危險(xiǎn)。
一、音像檔案數(shù)字化的作用和意義
針對傳統(tǒng)音像檔案面臨的風(fēng)險(xiǎn),通過音像檔案數(shù)字化,即利用信息技術(shù)將音像檔案原有的模擬聲音(視頻)信號轉(zhuǎn)換為可被計(jì)算機(jī)識別的數(shù)字音(視)頻文件,是安全保管和有效利用這些重要檔案的唯一出路。通過音像檔案數(shù)字化,不僅可以實(shí)現(xiàn)數(shù)字音(視)頻文件代替?zhèn)鹘y(tǒng)音像檔案提供利用,從而有效地保護(hù)音像檔案原件,而且數(shù)字音(視)頻文件的重放效果好,又不會造成損耗。此外,音像檔案經(jīng)過數(shù)字化,可以開發(fā)出豐富的文化資源,供社會公眾廣泛消費(fèi)。因此,音像檔案數(shù)字化,不僅是有效解決傳統(tǒng)音像檔案面臨問題的不二選擇,更是對檔案工作的長遠(yuǎn)發(fā)展和歷史文化的有效傳承都具有重要意義。
二、我國音像檔案數(shù)字化發(fā)展相對滯后的原因
現(xiàn)實(shí)中,與紙質(zhì)檔案數(shù)字化開展得如火如荼相比,我國音像檔案數(shù)字化發(fā)展則明顯滯后,只有少數(shù)檔案館和電臺、電視臺等開展了音像檔案數(shù)字化,而更多的音像檔案還沉睡在檔案館(室)的庫房中。
那么是什么原因造成了我國音像檔案數(shù)字化發(fā)展緩慢呢?筆者認(rèn)為,主要有以下幾個(gè)方面:
首先是觀念問題。由于音像檔案只是近一個(gè)世紀(jì)以來才逐漸出現(xiàn)的,它積累的數(shù)量與紙質(zhì)檔案相比是九牛一毛,在檔案工作中一直處于邊緣的位置。而許多檔案部門也就逐漸形成了“重紙質(zhì)檔案而輕其他專門檔案”的思想觀念,使得音像檔案長期得不到重視,而音像檔案數(shù)字化也就自然地落下了。
其次就是缺乏標(biāo)準(zhǔn)。音像檔案數(shù)字化是一項(xiàng)系統(tǒng)工程,需要統(tǒng)籌規(guī)劃、全程控制,需要確定工作流程和環(huán)節(jié),需要綜合選定各種技術(shù)指標(biāo)和參數(shù),必須要有專門的標(biāo)準(zhǔn)作為指導(dǎo)才能順利地開展。但我國目前仍沒有出臺關(guān)于音像檔案數(shù)字化的國家標(biāo)準(zhǔn)或行業(yè)標(biāo)準(zhǔn),標(biāo)準(zhǔn)的缺失嚴(yán)重制約了音像檔案數(shù)字化工作的發(fā)展。
再次是人才問題。與紙質(zhì)檔案數(shù)字化相比,音像檔案數(shù)字化涉及的技術(shù)更復(fù)雜,對數(shù)字化加工、組織和管理人員的要求也比較高,而檔案部門在這方面的技術(shù)力量和人才儲備大都比較薄弱,從而加劇了開展音像檔案數(shù)字化工作的難度。
最后是設(shè)備問題。與紙質(zhì)檔案數(shù)字化相比,音像檔案的數(shù)字化和后期編輯利用都需要更多種類的播放、采集和編輯等設(shè)備,而這些設(shè)備要么是價(jià)格不菲,要么是已經(jīng)停產(chǎn),市面上很難買到(如鋼絲錄音機(jī)),這也在一定程度上影響了音像檔案數(shù)字化的發(fā)展。
由此可見,造成音像檔案數(shù)字化發(fā)展滯后的原因是多方面的,這其中有些是檔案工作者們主觀造成的,有些則是客觀使然;有些是需要各級國家檔案部門共同推動并且經(jīng)過一個(gè)較長的時(shí)期才能徹底解決的,有些則是每個(gè)檔案館(室)通過自身努力就能取得明顯成效的。
三、如何更好地開展音像檔案數(shù)字化
我們應(yīng)該如何有效解決音像檔案數(shù)字化存在的問題,促進(jìn)音像檔案數(shù)字化工作的快速健康發(fā)展呢?筆者認(rèn)為,暫時(shí)拋開那些我們不能左右的客觀因素不談,只要做好以下幾方面,就可以推動音像檔案數(shù)字化工作順利開展。
(一)轉(zhuǎn)變觀念,積極創(chuàng)造有利于音像檔案數(shù)字化開展的各種條件
要想發(fā)展音像檔案數(shù)字化工作,首先就要在思想上充分認(rèn)識音像檔案以及音像檔案數(shù)字化的重要作用和意義,要積極轉(zhuǎn)變過去“重紙質(zhì)檔案而輕專門檔案”的思想觀念,要用發(fā)展的眼光看待音像檔案在多媒體網(wǎng)絡(luò)時(shí)代的強(qiáng)烈需求和美好未來,做到“思想上高度重視,資金上充足保障,人員上堅(jiān)決支持”,積極為音像檔案數(shù)字化工作的順利開展創(chuàng)造各種必要條件和有利條件。
(二)厘清音像檔案的種類和數(shù)量,選擇合適的組織生產(chǎn)方式
開展音像檔案數(shù)字化其中一項(xiàng)很重要的內(nèi)容就是要選擇合適的組織生產(chǎn)方式。音像檔案數(shù)字化有自主生產(chǎn)和外包生產(chǎn)兩種基本組織生產(chǎn)方式。自主生產(chǎn)一般由本單位人員負(fù)責(zé)檔案數(shù)字化系統(tǒng)的建設(shè)以及日常生產(chǎn)的組織與管理,有關(guān)操作人員向社會招聘并進(jìn)行技術(shù)培訓(xùn)。自主生產(chǎn)方式的管理成本較高,但方式靈活,可控性強(qiáng)。外包生產(chǎn)需要把音像檔案數(shù)字化作為一個(gè)項(xiàng)目公開向社會招標(biāo),選擇有一定資質(zhì)和經(jīng)驗(yàn)的企業(yè)承包生產(chǎn)。外包生產(chǎn)方式在建設(shè)與管理上相對簡單,但需要做好進(jìn)度控制、質(zhì)量驗(yàn)收和安全保障等工作。
各單位在開展音像檔案數(shù)字化前應(yīng)厘清本單位音像檔案的種類和數(shù)量,并主要根據(jù)音像檔案種類和數(shù)量同時(shí)參考資金投入方式和進(jìn)度要求等因素綜合選定組織生產(chǎn)方式。一般來說,音像檔案數(shù)量較少的單位可采取外包生產(chǎn)方式,可以有效減少本單位的人力和物力投入;而音像檔案數(shù)量較多的單位,可采用自主生產(chǎn)方式,可以有效確保音像檔案數(shù)字化的質(zhì)量和安全。
(三)統(tǒng)籌考慮,選好音像檔案數(shù)字化的關(guān)鍵技術(shù)指標(biāo)
在音像檔案數(shù)字化過程中,一些關(guān)鍵技術(shù)指標(biāo)參數(shù)選定的合適與否直接決定著音像檔案數(shù)字化的質(zhì)量。因此,在選定關(guān)鍵技術(shù)指標(biāo)參數(shù)時(shí),要統(tǒng)籌考慮,慎重選擇,既要著眼于未來發(fā)展趨勢和要求,又要立足于現(xiàn)實(shí)技術(shù)成熟度和兼容性;既要實(shí)現(xiàn)音像檔案的保真、生動再現(xiàn),又要便于網(wǎng)絡(luò)共享和廣泛利用。
1.音頻采樣頻率
音頻采樣頻率是指每秒鐘對聲音波形的采樣次數(shù),是描述聲音頻率的解析度,同時(shí)它也是衡量音質(zhì)的標(biāo)準(zhǔn),采樣頻率越高,聲音失真越小,音質(zhì)就越好,聲音的還原就越真實(shí)、自然,但音頻數(shù)據(jù)量也就越大。常用的音頻采樣頻率有11.025kHz、22.05kHz、44.1kHz和48kHz等。其中,11.025 kHz是電話和調(diào)幅廣播的聲音品質(zhì),22.05 kHz只能達(dá)到調(diào)頻廣播的聲音品質(zhì),44.1kHz是CD音質(zhì)(高保真立體聲)。由于人耳聽覺的頻率上限為20kHz,根據(jù)奈魁斯特(NYQUIST)采樣定理,用44.1kHZ的采樣頻率進(jìn)行采樣,剛好可還原為略高于人耳聽覺極限頻率的聲音,可以完全滿足錄音檔案數(shù)字化的需求。而48kHz采樣雖然更加精確一些,但人耳已經(jīng)分辨不出與44.1kHz采樣的差別了,而音頻數(shù)據(jù)量會隨之增大。因此,在開展錄音檔案數(shù)字化時(shí),建議音頻采樣頻率一般設(shè)置為44.1kHz就可以了。
2.視頻碼率
視頻碼率是指單位時(shí)間內(nèi)視頻數(shù)據(jù)的輸出量,是視頻編碼中畫面質(zhì)量控制中最重要的部分。一般情況下,視頻碼率和視頻質(zhì)量成正比,視頻碼率越大,視頻質(zhì)量就越高,視頻畫面越清晰,但當(dāng)視頻碼率超過一定數(shù)值后,對視頻畫面的質(zhì)量就沒有多大影響了。同時(shí),視頻碼率也與視頻文件體積成正比,視頻碼率越大,視頻文件體積也就越大。因此,錄像檔案數(shù)字化時(shí),不能一味為追求視頻質(zhì)量而肆意提高視頻碼率,而應(yīng)根據(jù)原錄像檔案的清晰度選定合適的視頻碼率,在保證能夠完美還原原始錄像檔案畫面的基礎(chǔ)上,又使數(shù)字化視頻文件的容量不會太大。一般地,標(biāo)清錄像檔案數(shù)字化時(shí)可選擇6M/S的碼率,數(shù)字化視頻與原錄像檔案畫面無明顯差別,一個(gè)小時(shí)大約需要2.5G的存儲空間;而高清錄像檔案數(shù)字化時(shí)可選擇12M/S的碼率,數(shù)字化視頻與原檔案畫面無明顯差別,一個(gè)小時(shí)大約需要10G的存儲空間。
3.視頻采樣格式
視頻采樣格式是指錄像檔案數(shù)字化時(shí)從原始圖像信息中獲取亮度信息和色彩信息的方式。常見的視頻采樣格式主要有YCbCr 4:4:4、YCbCr 4:2:2、YCbCr 4:1:1和YCbCr 4:2:0幾種,其中Y是亮度分量,Cb是藍(lán)色色度分量,而Cr是紅色色度分量。由于人眼對亮度比色度更敏感,因此在視頻采樣時(shí),通過減少色度分量,可以有效降低視頻容量,但人眼卻不能明顯察覺到圖像質(zhì)量的變化。YCbCr 4:4:4,表示全像素點(diǎn)陣,三個(gè)分量的采樣率相同,畫面與原始畫面非常一致,但數(shù)據(jù)量巨大;YCbCr 4:2:2,表示每4個(gè)像素有4個(gè)亮度分量、2個(gè)Cb分量、2個(gè)Cr分量,畫面非常接近原始畫面,數(shù)據(jù)量較大;YCbCr 4:2:0,表示每4個(gè)像素有4個(gè)亮度分量、2個(gè)Cb(或Cr)色度分量,相鄰的掃描行存儲不同的色度分量,畫面接近原始畫面,數(shù)據(jù)量一般;YCbCr 4:1:1,表示每4個(gè)像素有4個(gè)亮度分量、1個(gè)Cb分量、1個(gè)Cr分量,畫面與原始畫面差別較大,數(shù)據(jù)量較小。為獲取較高的視頻質(zhì)量、滿足絕大多數(shù)利用需求的同時(shí)又能有效減少存儲容量,在錄像檔案數(shù)字化時(shí),標(biāo)清錄像檔案建議選擇4:2:0的視頻采樣格式,高清錄像檔案建議選擇4:2:2的視頻采樣格式。
4.存儲格式
音像檔案通過數(shù)字化保存為不同格式數(shù)字化文件的容量相差很大,數(shù)字化檔案的品質(zhì)差別也非常大。而音像檔案數(shù)字化要實(shí)現(xiàn)充分地反映音像檔案內(nèi)容和便利的網(wǎng)上傳輸、利用,就非常有必要生成不同格式的數(shù)字化文件,從而滿足不同的需要:即在音像檔案數(shù)字化時(shí),可以直接保存為低壓縮率格式的數(shù)字化文件,以充分地保存和再現(xiàn)原始音像檔案的全部特征;在此文件的基礎(chǔ)上,通過轉(zhuǎn)換程序,可以生成高壓縮率格式的數(shù)字化文件,以便于快速檢索和網(wǎng)上傳輸、利用。
(1)音頻文件格式
目前用于音頻數(shù)據(jù)存儲的格式有很多,如WAV、MIDI、MP3、WMA等。其中,WAV是基于PCM編碼的一種波形存儲文件,被Windows平臺及眾多音頻軟件所廣泛支持,有極強(qiáng)的通用性。WAV文件的質(zhì)量很高,幾乎達(dá)到了CD音質(zhì),可以精確地記錄和完美地還原聲音,是存檔用比較理想的格式;但WAV文件體積較大,一小時(shí)的16位、44.1KHZ、立體聲WAV文件大約要占600MB的空間,而若將其轉(zhuǎn)換MIDI、MP3、WMA等壓縮率較高的格式,則轉(zhuǎn)換后的文件僅為原WAV文件大小的十分之一甚至更小。因此,錄音檔案數(shù)字化產(chǎn)生的用于長久保存的數(shù)字音頻文件,建議采用WAV格式存儲,而在此基礎(chǔ)上,可以將WAV文件轉(zhuǎn)換生成MIDI、MP3、WMA等格式,用于快速檢索和網(wǎng)上利用。
(2)視頻文件格式
用于存儲視頻數(shù)據(jù)的格式也很多,常見的有MPEG系列和RM、ASF、WMV等,有些適合于檔案存儲,有些適合于網(wǎng)絡(luò)在線播放。其中,MPEG系列標(biāo)準(zhǔn)有MPEG-1、MPEG-2、MPEG-4等,分別適用于不同的應(yīng)用領(lǐng)域:MPEG-1是VCD的壓縮標(biāo)準(zhǔn),它的視頻壓縮質(zhì)量僅達(dá)到家用錄像機(jī)的品質(zhì);MPEG-2編碼標(biāo)準(zhǔn)是DVD的核心技術(shù),還應(yīng)用于廣播、衛(wèi)星電視、有線電視和HDTV高清電視;MPEG-4是視頻流媒體的壓縮標(biāo)準(zhǔn),它的壓縮效率更高,可以在低帶寬網(wǎng)絡(luò)的情況下,保障連續(xù)的視頻數(shù)據(jù)播放,被VOD(視頻點(diǎn)播)所廣泛采用。其中,MPEG-2在設(shè)計(jì)之初就融入了存儲的理念,更加注重視頻數(shù)據(jù)的存儲,能夠完好地保存原始畫面,這正好契合錄像檔案數(shù)字化工作。由于MPEG-2的壓縮率較低,雖然能夠完美地保存和再現(xiàn)原始畫面,但存儲容量較大,不太適合網(wǎng)絡(luò)傳輸。用MPEG-2壓縮存儲10Mbps視頻碼率、720×576分辨率、384Kbps音頻碼率、立體聲這樣1小時(shí)的視頻畫面,約占用4GB的存儲空間。因此,建議錄像檔案數(shù)字化生成的數(shù)字視頻文件存儲為MPEG-2格式,用于錄像檔案數(shù)字化成果的長期保存;而在提供檢索、預(yù)覽等網(wǎng)絡(luò)利用時(shí),可以由MPEG-2轉(zhuǎn)換生成MPEG-4、RM、ASF、WMV等壓縮率較高、文件容量更小、適合網(wǎng)絡(luò)傳輸?shù)囊曨l流媒體格式。
在當(dāng)今網(wǎng)絡(luò)盛行的信息時(shí)代,寶貴的音像檔案資源若繼續(xù)被束之高閣,實(shí)為暴殄天物。我們檔案工作者要與時(shí)俱進(jìn),鼎力推進(jìn)音像檔案數(shù)字化工作,用數(shù)字化的音像檔案資源代替并保護(hù)傳統(tǒng)音像檔案提供利用的同時(shí),積極開發(fā)音像檔案的文化衍生品,主動推送給社會。這樣,不但能充分發(fā)揮音像檔案的獨(dú)特價(jià)值,更可為檔案工作注入新的生命力和增長點(diǎn)。
作者單位:北京市檔案局