◆喻永生 郭海富
?
粒子群優(yōu)化算法在音視頻信號傳輸中的應(yīng)用
◆喻永生 郭海富
(西南科技大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 四川 621010)
在音視頻信號過程當(dāng)中,常常出現(xiàn)速度較慢或者失真等情況,使得在整個傳輸過程中效果較差,本文通過利用粒子群優(yōu)化算法對于音視頻信號中的關(guān)鍵因子進(jìn)行計算,從而使得其傳輸準(zhǔn)確度能夠提升,為其進(jìn)一步發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。
粒子群優(yōu)化算法;音視頻信號;傳輸
目前來說,音視頻信號傳輸由發(fā)射機(jī)和接收機(jī)組成,每對發(fā)射機(jī)和接收機(jī)有相同的頻率,可以傳輸彩色和黑白視頻信號,并可以有聲音通道。無線傳輸具有一定的穿透性,不需要布線,也常用于電視監(jiān)控系統(tǒng)。 而大功率設(shè)備又有可能干擾正常的無線電通訊受到限制。由于線路帶寬限制和視頻圖像數(shù)據(jù)量大的矛盾,傳輸?shù)浇K端的圖像都不連續(xù),而且分辯率越高,幀與幀之間的間隔就越長;反之,如果想取得相對連續(xù)的圖像,就必然以犧牲清晰度為代價。
粒子群算法,縮寫為 PSO。PSO 算法屬于進(jìn)化算法的一種,和模擬退火算法相似,它也是從隨機(jī)解出發(fā),通過迭代尋找最優(yōu)解,它也是通過適應(yīng)度來評價解的品質(zhì),但它比遺傳算法規(guī)則更為簡單,它沒有遺傳算法的“交叉”和“變異”操作,它通過追隨當(dāng)前搜索到的最優(yōu)值來尋找全局最優(yōu)。這種算法以其實(shí)現(xiàn)容易、精度高、收斂快等優(yōu)點(diǎn)引起了學(xué)術(shù)界的重視,并且在解決實(shí)際問題中展示了其優(yōu)越性,粒子群算法是一種并行算法,其源于對鳥群捕食的行為研究。該算法最初是受到飛鳥集群活動的規(guī)律性啟發(fā),進(jìn)而利用群體智能建立的一個簡化模型。粒子群算法在對動物集群活動行為觀察基礎(chǔ)上,利用群體中的個體對信息的共享,使整個群體的運(yùn)動在問題求解空間中產(chǎn)生從無序到有序的演化過程,從而獲得最優(yōu)解。 PSO同遺傳算法類似,是一種基于迭代的優(yōu)化算法。同遺傳算法比較,PSO的優(yōu)勢在于簡單容易實(shí)現(xiàn)并且沒有許多參數(shù)需要調(diào)整。目前已廣泛應(yīng)用于函數(shù)優(yōu)化,神經(jīng)網(wǎng)絡(luò)訓(xùn)練,模糊系統(tǒng)控制以及其他遺傳算法的應(yīng)用領(lǐng)域。
音視頻傳輸需要利用高碼流的技術(shù)應(yīng)用,在文件傳輸過程可采取上變換的措施對信號接口進(jìn)行針對性的設(shè)置,確保單聲道信號在變換的設(shè)置策略下得到采集。而對于完成播放聲音的視頻服務(wù)器同樣也要復(fù)合混合系統(tǒng)的要求,必須同時音視頻傳輸兩種信號,達(dá)到單聲道節(jié)過,文件可隨時轉(zhuǎn)變?yōu)槎嗦暤佬盘栞敵?。在另一方面,引入上下變換器技術(shù)運(yùn)用到聲音系統(tǒng)的實(shí)現(xiàn)中,可在不同的需求之下,針對性的進(jìn)行不同的設(shè)置方式進(jìn)而調(diào)整,進(jìn)而可實(shí)現(xiàn)單聲道與多聲道信號之間便捷的上下變換。并且,為了達(dá)到音視頻傳輸混合制播系統(tǒng)良好工作的效果,其中重要的一環(huán)即音視頻傳輸作品的播出模式必須針對性的進(jìn)行設(shè)計,既可以將多聲道作品和單聲道作品的播出系統(tǒng)分別管理,產(chǎn)生各自分立的多聲道、單聲道信號,分別進(jìn)行各自的獨(dú)立播出,也可以直接使用多聲道播出系統(tǒng)實(shí)現(xiàn)節(jié)目的錄制,而在輸出的過程中,利用清晰度轉(zhuǎn)換器完成多聲道向單聲道的轉(zhuǎn)變,進(jìn)而兼顧到部分無法實(shí)現(xiàn)多聲道播放的終端設(shè)備,此類音視頻傳輸轉(zhuǎn)換模式操作便捷,易于實(shí)現(xiàn),因此被廣泛的運(yùn)用在大部分作品的節(jié)目制作傳播。一般來說在錄制現(xiàn)場會選用高分辨率的采集與傳輸裝置,可能有時候會用模擬的錄音機(jī)來代替數(shù)字錄音機(jī),因?yàn)槟M音視頻傳輸裝置可以防潮、防摔,有利于在復(fù)雜的條件下使用,使得錄音的效果得到保證,如果用多聲道進(jìn)行錄制無法對于聲像進(jìn)行有效的定位,從而獲得較好的交叉混合效果,在播出的時候利用多聲道可以有效地把單個聲道當(dāng)中的音軌進(jìn)行混合,從而達(dá)到相應(yīng)的效果。使用立體聲的方式可以完成多樣的效果錄制,但是其主要取決于能否用解碼器來對我們所錄制的聲音進(jìn)行播放,一個較為成熟的模式來進(jìn)行播放,給人以身臨其境的體驗(yàn),模擬音視頻傳輸裝置也有了更快的發(fā)展。
音視頻傳輸可以通過多個聲道來實(shí)現(xiàn)較好的兼容性,它還提供了雙向立體聲播放的良好兼容性,其中從左和右揚(yáng)聲器再現(xiàn)可以形成立體聲中心,并且環(huán)繞從兩個揚(yáng)聲器再現(xiàn),以漫射方式發(fā)射音頻信號。一個簡單的四聲道解碼器可以簡單地向中心揚(yáng)聲器發(fā)送和信號(左聲道 + 右聲道),并將差分信號(左聲道-右聲道)發(fā)送到周圍。但是這樣的解碼器將在相鄰的揚(yáng)聲器通道之間無法提供較高精度的差分信號,因此用于中置揚(yáng)聲器的信號需要從左側(cè)和右側(cè)揚(yáng)聲器傳輸。然而,左右兩者之間以及中心和環(huán)繞通道之間存在著完全的分離。為了克服這個問題,電影解碼器使用差分電路來改善分離的情況。邏輯電路決定哪個揚(yáng)聲器通道具有最高信號電平并給予其優(yōu)先級,衰減饋送到相鄰?fù)ǖ赖男盘枴R驗(yàn)橄鄬νǖ乐g已經(jīng)存在完全分離,所以不需要衰減很多,實(shí)際上解碼器在左聲道和右聲道優(yōu)先級之間切換。這對杜比立體聲的混音造成了一些限制,并確保聲音混音器混合配樂,他們將通過杜比立體聲編碼器和解碼器串聯(lián)監(jiān)聽聲音組合。除了差分電路之外,環(huán)繞聲道還通過延遲,可調(diào)節(jié)高達(dá)100 ms的音頻,以適應(yīng)不同情況下的觀看,這利用了優(yōu)先效應(yīng)來將聲音定位到預(yù)期的方向。
在現(xiàn)代音視頻信號傳輸領(lǐng)域中,通過進(jìn)化算法得到測試數(shù)據(jù)已經(jīng)成為了當(dāng)前該領(lǐng)域的研究熱點(diǎn)。以往的利用進(jìn)化算法獲得測試數(shù)據(jù)的技術(shù),要求將全部的測試數(shù)據(jù)輸入其中,被測程序運(yùn)行后即可獲得個體適應(yīng)值。故此,已往的無算法所需要耗費(fèi)的時間是較長的,因此,為了能夠減少由于程序運(yùn)行而導(dǎo)致的時間損耗,利用基于粒子群優(yōu)化算法音視頻信號傳輸數(shù)據(jù)的生成方法。本文所提出的算法基本思想為:首先,需要通過一定的樣本實(shí)現(xiàn)對粒子群的有效訓(xùn)練,以實(shí)現(xiàn)對個體適應(yīng)值的有效模擬;在對測試數(shù)據(jù)進(jìn)行生成時,要求首先利用已經(jīng)經(jīng)過訓(xùn)練的粒子群實(shí)現(xiàn)對個體適應(yīng)值的大致估計,從中選擇具有較好適應(yīng)值的個體,隨后再運(yùn)行程序。應(yīng)當(dāng)認(rèn)識到,由于部分音視頻信號是極易被覆蓋的,故此,對于這部分音視頻信號而言,通過隨機(jī)法即可較為容易的得到測試數(shù)據(jù),因此是無須利用進(jìn)化算法的。在音視頻信號的傳輸當(dāng)中,需要用上下變換來對于作品當(dāng)中的聲音進(jìn)行采樣與分析和調(diào)整,但是在時空的分辨率轉(zhuǎn)換當(dāng)中可能會出現(xiàn)一定的損失,因此我們的系統(tǒng)當(dāng)中應(yīng)該加強(qiáng)其分辨和調(diào)整,使得上下變換技術(shù)能夠有效的實(shí)現(xiàn)聲音質(zhì)量的變換,盡量地減少損失,使得音色不失真。因此,幅型在進(jìn)行轉(zhuǎn)變的過程中,必須確保原聲音不進(jìn)行裁切形變,并可以通過增大信息量,例如擴(kuò)展傳輸帶寬可很好地降低質(zhì)量損失程度。在聲音技術(shù)實(shí)現(xiàn)的過程中,對于聲音的實(shí)現(xiàn),通常是采用鑲嵌的技術(shù)使其播放在聲音信號上。因此,對于多聲道環(huán)繞的作品信號的制作與傳播,應(yīng)該加強(qiáng)聲音所采用的形式、技術(shù)標(biāo)準(zhǔn)在單聲道節(jié)目中的應(yīng)用,我們的設(shè)備開發(fā)需要對于音色進(jìn)行調(diào)試和保護(hù),但是我國的成套開發(fā)體系還沒有成熟,因此我們必須對于傳統(tǒng)的模式來進(jìn)行改造,提升設(shè)備的智能化計算能力,使得音色能夠被有效地檢測出來。故此,在進(jìn)行音視頻信號選擇時,應(yīng)當(dāng)盡量選擇其中較難進(jìn)行覆蓋的,以實(shí)現(xiàn)對算法性能的有效分析。具體來講,首先需要通過隨機(jī)法得到測試數(shù)據(jù),將其作為輸入實(shí)現(xiàn)程序運(yùn)行,并且對數(shù)據(jù)出現(xiàn)的高維音視頻信號重復(fù)情況進(jìn)行分析;然后從中選擇沒有被覆蓋的音視頻信號,這部分音視頻信號即為目標(biāo)音視頻信號。此外,由于部分音視頻信號是不可導(dǎo)的,而這部分音視頻信號也無法實(shí)現(xiàn)對算法性能的有效評價。
同時,粒子群優(yōu)化算法為音視頻信號的傳輸技術(shù)發(fā)展提供了相關(guān)的保障,各種技術(shù)使得信息的采集與管理越來越方便,可以使得數(shù)據(jù)管理分析設(shè)備的使用更加方便,這些創(chuàng)新技術(shù)使得信號傳輸技術(shù)越來越成為各行業(yè)的重要發(fā)展趨勢,因此我們需要提升技術(shù)的可靠性,使其更好地為我們而服務(wù)。
[1]孫玉章.數(shù)字調(diào)制技術(shù)在音視頻信號傳輸中的應(yīng)用分析[J].信息化建設(shè),2015.
[2]梁亞峰.視頻眼鏡的視頻信號轉(zhuǎn)換及無線傳輸?shù)脑O(shè)計與實(shí)現(xiàn)[D].四川:電子科技大學(xué),2013.
[3]尹睿男.音視頻傳輸與傳輸系統(tǒng)設(shè)計[D].北京:北方工業(yè)大學(xué),2012.
[4]王巖.視頻信號采集與網(wǎng)絡(luò)傳輸系統(tǒng)的研究與實(shí)現(xiàn)[D].遼寧:大連海事大學(xué),2011.