柳 強(qiáng) 胡雪飛
摘 要:信息技術(shù)的發(fā)展給高校外語(yǔ)音像資料采集、存儲(chǔ)、使用帶來(lái)了全新的方式。外語(yǔ)音像資源庫(kù)系統(tǒng)是把計(jì)算機(jī)技術(shù)、媒體制作技術(shù)、流媒體技術(shù)和現(xiàn)代教學(xué)方法有機(jī)結(jié)合起來(lái)的一種教學(xué)輔助系統(tǒng)。本文介紹了湖北大學(xué)外國(guó)語(yǔ)學(xué)院音像資源庫(kù)的構(gòu)建和應(yīng)用情況,該資源庫(kù)系統(tǒng)的建成和應(yīng)用對(duì)豐富教學(xué)內(nèi)容、提高教學(xué)質(zhì)量、實(shí)現(xiàn)教育技術(shù)現(xiàn)代化起到了積極的作用。
關(guān)鍵詞:音像資源庫(kù) 數(shù)字化 流媒體
中圖分類號(hào):G203 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-8454(2009)03-0041-03
一、前言
外語(yǔ)音像資料是高校外語(yǔ)教學(xué)中必不可少的重要內(nèi)容,經(jīng)過(guò)幾十年的發(fā)展,外語(yǔ)學(xué)院存儲(chǔ)了大量以磁帶、錄像帶、光盤等為載體的教學(xué)音像資料。然而由于傳統(tǒng)的以磁帶、錄像帶為載體的模擬音像資料主要采用磁記錄的方式進(jìn)行存儲(chǔ),隨著時(shí)間的推移,磁帶逐漸老化變質(zhì),大批珍貴的音視頻資源將面臨報(bào)廢的危險(xiǎn)。如何整理、開發(fā)和利用現(xiàn)有的外語(yǔ)音像資料,充分發(fā)揮其特有的效能,更好地為外語(yǔ)教學(xué)和科研服務(wù)是高校教育技術(shù)中心管理人員責(zé)無(wú)旁貸的任務(wù)。
針對(duì)上述情況,我校通過(guò)將模擬音像資源進(jìn)行數(shù)字化改造,并建立一個(gè)基于流媒體技術(shù)的音像資源庫(kù),實(shí)現(xiàn)了對(duì)資源的有效利用和管理,更好地為外語(yǔ)教學(xué)、廣大師生服務(wù)。
二、音像資料的數(shù)字化處理
1.音像資料的數(shù)字化采集
傳統(tǒng)教學(xué)音視頻資料都是以磁帶和錄像帶的形式保存下來(lái)的,而磁帶和錄像帶都是采用模擬信號(hào)的方式來(lái)記錄信息的。因此傳統(tǒng)的教學(xué)音視頻資源數(shù)字化工程的第一步就是將這些模擬信號(hào)記載的信息轉(zhuǎn)化為計(jì)算機(jī)存儲(chǔ)的數(shù)字化信息,即音視頻材料的采集。[1]
(1)音頻資料數(shù)字化采集:將錄音磁帶上的模擬聲音信號(hào)通過(guò)電腦轉(zhuǎn)換成數(shù)字音頻信號(hào)。數(shù)字化的音頻文件格式有WAV、MP3、WMA等,可以針對(duì)不同的需要采用不同的格式。
(2)視頻資料數(shù)字化采集:通過(guò)計(jì)算機(jī)將傳統(tǒng)的模擬視頻信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)。如對(duì)VHS格式的錄像帶視頻轉(zhuǎn)換,其過(guò)程是將錄像機(jī)與計(jì)算機(jī)連接,在錄像機(jī)播放錄像帶的同時(shí),借助于計(jì)算機(jī)中的視頻采集卡和捕捉工具軟件,將錄像帶播放的模擬視頻信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),轉(zhuǎn)換后的數(shù)據(jù)可以保存為AVI、MPEG等數(shù)字文件格式。
2.音像資料的編輯
有相當(dāng)一部分通過(guò)各種途徑(磁帶轉(zhuǎn)換、網(wǎng)上下載、自己錄制等)獲取的外語(yǔ)音像資料,由于其本身或外界環(huán)境的因素,會(huì)存在著一些質(zhì)量上的問(wèn)題,諸如:噪音,單聲道,聲波振幅小,圖像模糊,亮度、灰度、對(duì)比度差等等。這些問(wèn)題都會(huì)直接影響到使用效果,所以有必要進(jìn)行適當(dāng)?shù)木庉嬏幚怼H纾簩?duì)音頻資料通過(guò)降噪、轉(zhuǎn)換成雙聲道立體聲、增大波形振幅,使聲音更加清晰飽滿;對(duì)視頻資料通過(guò)改變亮度、灰度、對(duì)比度使圖像更清晰,根據(jù)需要給視頻添加字幕、對(duì)視頻內(nèi)容進(jìn)行剪輯、去掉原先視頻的聲音或者雜音等。[2]
根據(jù)目前網(wǎng)絡(luò)技術(shù)、編碼技術(shù)和流媒體技術(shù)的發(fā)展,考慮到音視頻文件主要是放到網(wǎng)絡(luò)上供使用者在線點(diǎn)播和下載,應(yīng)將音視頻文件做成便于存儲(chǔ)和網(wǎng)上傳輸?shù)牧髅襟w格式。流媒體文件的優(yōu)勢(shì)是當(dāng)流媒體文件從服務(wù)器向客戶端進(jìn)行實(shí)時(shí)播放時(shí),用戶不必等到全部文件下載完畢,只需延遲幾秒或幾十秒便可播放,其余部分由客戶端計(jì)算機(jī)在后臺(tái)繼續(xù)接收,直至播放完畢或用戶取消播放,這樣可以減少用戶的等待時(shí)間,真正實(shí)現(xiàn)實(shí)時(shí)點(diǎn)播,并可同時(shí)為更多的用戶提供服務(wù)。
對(duì)音像資料進(jìn)行轉(zhuǎn)換、編輯處理的軟件很多,下面介紹幾款較實(shí)用的軟件:
(1)音頻編輯軟件——GoldWave,用于將磁帶上的模擬音頻資料轉(zhuǎn)換成數(shù)字音頻資料及對(duì)粗糙的聲音文件進(jìn)行編輯處理。
(2)視頻編輯軟件——會(huì)聲會(huì)影,用于將錄像帶上的模擬視頻資料轉(zhuǎn)換成數(shù)字視頻資料及對(duì)視頻文件進(jìn)行編輯處理。
(3)視頻壓縮轉(zhuǎn)換軟件——Easy RealMedia Producer,用于將AVI、MOV、MPEG等視頻文件壓縮成流媒體文件(RM、RMVB、RA),以利于網(wǎng)絡(luò)上的傳送與播放。
綜合考慮數(shù)字化音視頻的品質(zhì)、網(wǎng)絡(luò)傳輸速度、技術(shù)實(shí)現(xiàn)的難易程度等多種因素,我們采取的方案是:將視頻文件轉(zhuǎn)換成流媒體格式的RMVB文件,將音頻文件以MP3或WMA文件格式進(jìn)行保存。
三、數(shù)字化音像資源庫(kù)網(wǎng)絡(luò)平臺(tái)構(gòu)建
單純由音視頻流媒體文件和網(wǎng)絡(luò)還不能構(gòu)成一個(gè)完整的音視頻資源庫(kù)。要對(duì)音視頻流媒體文件進(jìn)行統(tǒng)籌管理、更新維護(hù),并利用網(wǎng)絡(luò)向用戶提供在線點(diǎn)播、下載等各種服務(wù),同時(shí)建立一個(gè)穩(wěn)定、高效、易用的音視頻資源庫(kù)網(wǎng)絡(luò)應(yīng)用平臺(tái)。
1.平臺(tái)結(jié)構(gòu)
在充分考慮系統(tǒng)的可靠性、易于擴(kuò)展性及操作簡(jiǎn)單性等因素的基礎(chǔ)上,資源庫(kù)系統(tǒng)平臺(tái)采用B/S結(jié)構(gòu),其系統(tǒng)結(jié)構(gòu)如圖1所示。
服務(wù)器包括Web服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器及資源服務(wù)器。Web服務(wù)器是整個(gè)系統(tǒng)的核心,是為用戶提供服務(wù)的窗口,它借助于應(yīng)用程序處理網(wǎng)絡(luò)客戶發(fā)出的各種請(qǐng)求,從數(shù)據(jù)庫(kù)中提取有用的數(shù)據(jù),并把結(jié)果以網(wǎng)頁(yè)的形式反饋給用戶。數(shù)據(jù)庫(kù)服務(wù)器是資源庫(kù)系統(tǒng)的信息中心,它存儲(chǔ)了與資源庫(kù)相關(guān)的所有信息。資源服務(wù)器主要用于存儲(chǔ)資源庫(kù)中所有媒體資源,為用戶提供在線點(diǎn)播以及文件下載等服務(wù)。
平臺(tái)Web服務(wù)器采用Windows 2000 Server操作系統(tǒng),后臺(tái)數(shù)據(jù)庫(kù)采用SQL Server 2000,資源服務(wù)器采用Windows 2003 Server操作系統(tǒng)。
2.功能設(shè)計(jì)
本系統(tǒng)分三種角色進(jìn)行功能設(shè)計(jì),即普通用戶、資源管理員和系統(tǒng)管理員。普通用戶的功能主要是資源的使用,提供資源的瀏覽、檢索、在線點(diǎn)播、下載等服務(wù)。資源管理員主要是進(jìn)行資源的日常管理,如資源類別和資源內(nèi)容的添加、更新、刪除,以及資源文件的上傳等。系統(tǒng)管理員要維持系統(tǒng)的正常運(yùn)行,其職責(zé)有系統(tǒng)配置、用戶管理、統(tǒng)計(jì)分析、安全管理等。
為了實(shí)現(xiàn)上述功能目標(biāo)和設(shè)計(jì)思路,資源庫(kù)管理系統(tǒng)可按照其各部分功能的不同分為:資源類別管理模塊、資源內(nèi)容管理模塊、用戶管理模塊、查詢功能模塊、系統(tǒng)管理模塊。
(1)資源類別管理模塊
數(shù)字化音像資料庫(kù)網(wǎng)絡(luò)應(yīng)用平臺(tái)建好后,就可以通過(guò)該網(wǎng)絡(luò)平臺(tái)的后臺(tái)管理系統(tǒng)向數(shù)據(jù)庫(kù)中添加經(jīng)編輯、壓縮過(guò)的數(shù)字化音像資料。為了方便用戶更好地使用資源庫(kù),在添加音視頻文件時(shí),應(yīng)先對(duì)其進(jìn)行分類。根據(jù)網(wǎng)絡(luò)應(yīng)用平臺(tái)的前臺(tái)系統(tǒng),將資源分為音頻資料和視頻資料兩大類。音頻資料先按語(yǔ)種分為英語(yǔ)、日語(yǔ)、法語(yǔ),再細(xì)分為教材音頻、語(yǔ)音語(yǔ)調(diào)、新聞、專四聽力、專八聽力、外語(yǔ)歌曲等部分。視頻資料先按語(yǔ)種分為英語(yǔ)、日語(yǔ)、法語(yǔ),再細(xì)分為教學(xué)頻道、電影頻道(包括愛(ài)情、動(dòng)作、科幻、動(dòng)畫、戰(zhàn)爭(zhēng)、記錄、劇情等)、電視劇、演講集萃等部分。
(2)資源內(nèi)容管理模塊
資源內(nèi)容管理模塊的服務(wù)對(duì)象是資源管理員,資源管理員可以在此處對(duì)媒體素材資源進(jìn)行添加、編輯、刪除管理。一個(gè)具體的資源內(nèi)容主要包括的信息有:名稱、語(yǔ)種、所屬類別、圖片地址、資源存儲(chǔ)地址、資源簡(jiǎn)介等。當(dāng)添加一個(gè)新的媒體資源時(shí),要將媒體文件上傳到資源服務(wù)器上。
(3)用戶管理模塊
用戶管理模塊負(fù)責(zé)用戶的注冊(cè)、對(duì)用戶進(jìn)行身份認(rèn)證和使用授權(quán)。用戶分為三級(jí):普通用戶、資源管理員和系統(tǒng)管理員。注冊(cè)時(shí),不同級(jí)別的用戶被賦予不同的操作權(quán)限,系統(tǒng)管理員的權(quán)限最高,可以進(jìn)行全系統(tǒng)維護(hù)與操作。用戶登錄時(shí),先通過(guò)輸入相應(yīng)的口令來(lái)驗(yàn)證身份,只有通過(guò)認(rèn)證的用戶才擁有相應(yīng)的操作權(quán)限。
(4)查詢功能模塊
查詢功能模塊提供一個(gè)功能強(qiáng)大的查詢工具,以實(shí)現(xiàn)用戶所需資源的快捷查詢。系統(tǒng)提供模糊查詢和條件組合查詢方式,用戶可按照實(shí)際需要通過(guò)多種方式進(jìn)行查詢,查詢項(xiàng)主要包括語(yǔ)種、媒體類別、內(nèi)容標(biāo)題等。
(5)系統(tǒng)管理模塊
該模塊主要是實(shí)現(xiàn)系統(tǒng)維護(hù),以保證系統(tǒng)的穩(wěn)定性和數(shù)據(jù)的安全性。它包括系統(tǒng)參數(shù)配置管理、安全管理、數(shù)據(jù)備份管理等。
四、系統(tǒng)實(shí)現(xiàn)所采用的關(guān)鍵技術(shù)
1.流媒體技術(shù)
流媒體是指在Internet/Intranet中使用流式傳輸技術(shù)的連續(xù)時(shí)基媒體,如音頻、視頻或多媒體文件。流式媒體在播放前并不下載整個(gè)文件,只將開始部分內(nèi)容存入內(nèi)存,流式媒體的數(shù)據(jù)流隨時(shí)傳送隨時(shí)播放,只是在開始時(shí)有些延遲,當(dāng)聲音等時(shí)基媒體在客戶端播放時(shí),文件的剩余部分將從后臺(tái)服務(wù)器繼續(xù)下載。與單純的下載方式相比,這種對(duì)多媒體文件邊下載邊播放的流式傳輸方式不僅使啟動(dòng)延時(shí)大幅度縮短,而且對(duì)系統(tǒng)緩存容量的需求也大大降低。實(shí)現(xiàn)流式傳輸有兩種方法:實(shí)時(shí)流式傳輸和順序流式傳輸。
流媒體技術(shù)主要用于在計(jì)算機(jī)網(wǎng)絡(luò)上發(fā)布視頻和音頻流。由于流媒體信息傳輸和處理的數(shù)據(jù)量大,并且音頻/視頻與時(shí)間的相關(guān)性強(qiáng),要求實(shí)時(shí)、同步地傳輸,因此流媒體系統(tǒng)首先應(yīng)有很高的帶寬,同時(shí)采用實(shí)時(shí)傳輸控制協(xié)議及實(shí)時(shí)傳輸技術(shù),以保證網(wǎng)絡(luò)系統(tǒng)的延遲盡可能減小。
流媒體傳輸?shù)膶?shí)現(xiàn)需要合適的傳輸協(xié)議。TCP需要較高的網(wǎng)絡(luò)帶寬,故不太適合傳輸實(shí)時(shí)數(shù)據(jù)。在流式傳輸?shù)膶?shí)現(xiàn)方案中,一般采用HTTP/TCP來(lái)傳輸控制信息,而用RTP/UDP來(lái)傳輸實(shí)時(shí)多媒體數(shù)據(jù)。主要協(xié)議包括實(shí)時(shí)傳輸協(xié)議RTP、實(shí)時(shí)傳輸控制協(xié)議RTCP和實(shí)時(shí)流協(xié)議RTSP等。[3] 流媒體傳輸?shù)倪^(guò)程如圖2所示。
當(dāng)用戶選擇播放某個(gè)流媒體文件后,Web瀏覽器與Web服務(wù)器之間使用HTTP/TCP協(xié)議交換控制信息,以便把需要傳輸?shù)膶?shí)時(shí)數(shù)據(jù)從原始信息中檢索出來(lái),再由Web服務(wù)器調(diào)用后臺(tái)數(shù)據(jù)庫(kù)中指向流媒體發(fā)布服務(wù)器的相關(guān)鏈接,然后客戶機(jī)上的Web瀏覽器啟動(dòng)A/V(音頻/視頻)播放器程序,使用HTTP從Web服務(wù)器檢索相關(guān)參數(shù)對(duì)播放器程序進(jìn)行初始化,最后通過(guò)UDP等協(xié)議定位和控制流媒體文件的播放。
2.多媒體數(shù)據(jù)壓縮技術(shù)
由于視頻所產(chǎn)生的實(shí)時(shí)數(shù)據(jù)量非常大,直接進(jìn)行傳輸或存儲(chǔ)會(huì)對(duì)網(wǎng)絡(luò)帶寬和存儲(chǔ)空間帶來(lái)很大的負(fù)擔(dān)。因此,多媒體數(shù)據(jù)在傳輸或存儲(chǔ)之前,先要進(jìn)行壓縮處理,傳送到目的地后再解壓播放出來(lái)。
數(shù)據(jù)壓縮處理一般由兩個(gè)過(guò)程組成:一是編碼過(guò)程,即對(duì)原始數(shù)據(jù)進(jìn)行編碼壓縮,以便存儲(chǔ)和傳輸;二是解碼過(guò)程,即對(duì)壓縮的數(shù)據(jù)進(jìn)行解壓,恢復(fù)成可用的數(shù)據(jù)。根據(jù)解壓后數(shù)據(jù)的保真度,數(shù)據(jù)壓縮技術(shù)可分為無(wú)損壓縮編碼和有損壓縮編碼兩大類。無(wú)損壓縮編碼是指解碼后的數(shù)據(jù)與原始數(shù)據(jù)完全相同,無(wú)任何偏差。它的壓縮能力與所處理數(shù)據(jù)的類型有關(guān),壓縮比較低,一般在2∶1~5∶1。有損壓縮編碼是指解碼后的數(shù)據(jù)與原始數(shù)據(jù)相比有一定的偏差,但仍可保持一定的視聽質(zhì)量和效果,其壓縮比可達(dá)100∶1。壓縮比越高,其解壓后的視、音頻質(zhì)量就越低。有損壓縮主要用于對(duì)音頻和視頻數(shù)據(jù)的壓縮。
利用視頻壓縮技術(shù),我們將各種視頻數(shù)據(jù)源如MPEG2格式的DVD教學(xué)影碟壓縮為RMVB格式的流媒體文件,供學(xué)生點(diǎn)播。
3.數(shù)據(jù)存儲(chǔ)技術(shù)
壓縮好的音視頻文件占用大量的磁盤空間,如何存儲(chǔ)這些數(shù)據(jù),合理利用空間顯得很重要。本系統(tǒng)采用2Gbps光纖通道(Fibre Channel,FC)標(biāo)準(zhǔn),通過(guò)在資源服務(wù)器上裝入2Gbps光纖通道卡,與光纖磁盤陣列進(jìn)行連接。
磁盤陣列是由一個(gè)硬盤控制器來(lái)控制多個(gè)硬盤的相互連接,使多個(gè)硬盤的讀寫同步,減少錯(cuò)誤,增加效率和可靠度的技術(shù)。磁盤陣列通過(guò)RAID技術(shù)將多個(gè)單一硬盤組合為一個(gè)超大容量硬盤,是多媒體資源庫(kù)中數(shù)字音視頻資源的理想存儲(chǔ)介質(zhì)。
RAID(冗余磁盤陣列)技術(shù)使用校驗(yàn)的概念提供容錯(cuò)能力。磁盤陣列采用分塊和交叉存取技術(shù),將數(shù)據(jù)分塊后分布在多個(gè)磁盤上,以并行的交叉存取提高速度。其并行性體現(xiàn)在一個(gè)或多個(gè)獨(dú)立的請(qǐng)求被一組磁盤驅(qū)動(dòng)器并行服務(wù),減少了I/O請(qǐng)求的排隊(duì)等待時(shí)間;同時(shí)大塊數(shù)據(jù)的I/O請(qǐng)求被一組磁盤服務(wù),通過(guò)并行的交叉存取從而提高數(shù)據(jù)傳輸率。磁盤陣列的性能差別根據(jù)采取不同的數(shù)據(jù)交叉粒度和冗余信息的放置與計(jì)算方法,按數(shù)據(jù)組織不同而分為多個(gè)級(jí)別,即RAID 0、RAID 1、RAID 0+1、RAID 3、RAID 5等。[4]
本系統(tǒng)采用RAID 5技術(shù),它具有數(shù)據(jù)安全、讀寫速度快、空間利用率高等優(yōu)點(diǎn)。RAID 5將各塊硬盤進(jìn)行條帶化分割,相同的條帶區(qū)進(jìn)行奇偶校驗(yàn),校驗(yàn)數(shù)據(jù)平均分布在每塊硬盤上。以n塊硬盤構(gòu)建的RAID 5陣列可以有n-1塊硬盤的容量,存儲(chǔ)空間利用率非常高。任何一塊硬盤上的數(shù)據(jù)丟失,均可以通過(guò)校驗(yàn)數(shù)據(jù)推算出來(lái)。
五、結(jié)束語(yǔ)
外語(yǔ)音像資料的數(shù)字化和基于流媒體技術(shù)的外語(yǔ)音像資料庫(kù)的建設(shè)為我院師生提供了豐富、高質(zhì)量的視頻和音頻教學(xué)資源以及網(wǎng)上資源查詢、在線播放、資源下載、資源上傳等功能。資源庫(kù)的建設(shè)是一個(gè)復(fù)雜的系統(tǒng)工程,它需要我們建設(shè)者不斷地根據(jù)資源庫(kù)的使用效果和師生的需求及時(shí)地進(jìn)行修改和動(dòng)態(tài)更新,這樣才能為教學(xué)提供更好的服務(wù)。
參考文獻(xiàn):
[1]桑宇芳.高校外語(yǔ)音像資料的數(shù)字化[J].教育信息化,2005(11).
[2]付玉明,單興苗.外語(yǔ)音像資料的數(shù)字化處理[J].新疆師范大學(xué)學(xué)報(bào),2007(2).
[3]楊波.利用流媒體技術(shù)建設(shè)網(wǎng)上外語(yǔ)教學(xué)資源庫(kù)[J].天津工業(yè)大學(xué)學(xué)報(bào),2002(6).
[4]郭向勇.面向數(shù)字視頻資源應(yīng)用的海量存儲(chǔ)系統(tǒng)建構(gòu)研究[J].電化教育研究,2004(10).