孫鵬程
國家廣播電視總局203臺 內(nèi)蒙古 呼和浩特市 010070
覆蓋全球各地的中波、短波和調(diào)頻廣播是新聞、娛樂和信息傳播的重要載體,也是輿論宣傳的重要工具。國際電信聯(lián)盟(ITU)規(guī)定了廣播頻段用途劃分。 中波廣播頻率范圍526.5~1606.5kHz,短波廣播頻率范圍1.8~26.5MHz,中國短波廣播范圍2.3~26.1MHz,調(diào)頻廣播頻率范圍87~108MHz。廣播頻率帶寬中波9kHz,短波10kHz,立體聲調(diào)頻256kHz。廣播頻率間隔中波9kHz,短波5kHz,立體聲調(diào)頻100kHz。在沒有同頻的情況下,中波120個頻率,短波825個頻率,調(diào)頻210個頻率,同時還存不同地區(qū)使用相同頻率廣播的電臺,僅呼和浩特地區(qū)每季實際達(dá)到保證收聽的中、短波、調(diào)頻廣播電臺可以多達(dá)1000個以上。
為研究、協(xié)調(diào)頻率資源的更好利用,國際上ITU 成員國對無線電廣播進行監(jiān)測,并通過ITU 下設(shè)的國際頻率登記委員會(IFRB)和“世界無線電行政大會”(WARC)協(xié)調(diào)電波秩序。中國《無線電管理條例》也規(guī)定了無線電頻率資源使用和監(jiān)測的法規(guī),對無線電臺站進行檢查和監(jiān)測,保障無線電臺站的正常使用,維護正常的無線電波秩序。廣播電臺收測識別是這些研究協(xié)調(diào)管理的重要數(shù)據(jù)基礎(chǔ)。
廣播收測通過監(jiān)聽全部廣播頻點,全部時間的廣播,確定一周內(nèi)每天每個時間各個頻點都有哪些電臺在廣播。按照國際電聯(lián)無線電規(guī)則規(guī)定各種廣播應(yīng)該在整點前后5 分鐘內(nèi)播報識別信號,如果為避免節(jié)目中斷而沒有整點播報,則應(yīng)該在開播、停播時播發(fā)識別信號。對于四千多個可能的頻率點進行7 天×24 小時的監(jiān)測,這意味著有六十多萬條10 分鐘的記錄。這些記錄全部聽一遍要4600 多人天的工作量。所以自動廣播節(jié)目識別的方法將大大節(jié)約人力,及時為廣播監(jiān)測監(jiān)管、新聞輿論宣傳、無線電臺管理部門提供重要的基礎(chǔ)信息。
由于各個電臺在固定時刻,大多是整點,會用典型的間奏曲和語音播報電臺呼號和節(jié)目,自然人們希望通過不常變化的間奏曲和電臺播報音頻和廣播節(jié)目音頻匹配,從而自動識別廣播節(jié)目。但是電波經(jīng)過遠(yuǎn)距離傳播后,產(chǎn)生較大信道效應(yīng),從而使得不同時間,不同頻率廣播的相同節(jié)目在音頻波形上很大不同。
用同一臺接收機在同一天不同時間段,錄制不同頻率的“中國之聲”整點間奏曲開始0.5 秒的波形和時頻圖譜,如圖1 所示??梢钥吹缴厦娴囊纛l波形相當(dāng)不同,但是下面的時間-頻率二維圖譜非常接近。所以傳統(tǒng)上,可以通過比對不同音頻的時頻圖譜來做音頻識別。大多數(shù)情況這種時頻圖譜是通過短時傅里葉變換,將時域波形分割成前后部分重疊的短片段,再對各個短片段做傅里葉功率譜,就得到了信號在時間—頻率二維的分布圖譜。通常將這種二維分布用偽彩色圖片顯示。偽彩色圖譜里用不同顏色代表遞減的功率分布。圖中可以明顯看到各個頻率分量隨時間的變化和節(jié)奏。
在圖譜比對方法中,二維相關(guān)是一種傳統(tǒng)方法。但是由于接收機頻響不同,發(fā)射臺設(shè)備和配置不同,接收到的音頻在時頻圖譜上回帶有響應(yīng)頻率分布畸變,而這些畸變會顯著干擾相關(guān)計算的判決。
圖1 不同時間和頻率接收相同節(jié)目的音頻波形和時頻圖譜
基于時間頻率二維分布圖譜中包含大量音頻特征的顯示,本文作者設(shè)計了一種提取音頻特征而較好忽略無線電信道傳輸畸變和接收機頻譜響應(yīng)的方法。簡單來說,在時頻圖譜中尋找特征點,具體來說可以是時間、頻率局部區(qū)域的功率峰值。時頻圖譜中可以看出條狀的音頻信息和零散分布的噪聲。由于噪聲在頻域被圖譜分隔,不會影響有用音頻特征點的提取。
特征點提取后設(shè)計者提取特征信息并編碼。由于音頻主要信息在于頻率和時間,而不在于功率,所以僅僅提取特征點的頻率、時間,這樣正好避免了傳輸信道衰落變化和接收機頻響帶來的功率波動。設(shè)計者對特征點采用了相對時頻位置的編碼,這樣進一步去除了相對時間差異和整體頻率偏差帶來的干擾。這種特征編碼是一種長序列哈希編碼,事先采集足夠的節(jié)目開始曲短音頻,對每個模板生成哈希編碼,對于任何一個待識別錄音同樣進行哈希編碼,然后將待識別編碼和所有模板編碼匹配,得出各個模板的匹配分值,再通過最佳匹配得出識別結(jié)果。
如果最佳匹配分值高于置信門限,就軟件輸出識別結(jié)果。由于時頻分析基本上是一種線性變換,如果電臺串音,會表現(xiàn)為同時保留2 個節(jié)目的特征,所以軟件可以在識別成功時,再對第二匹配判斷,如果第二匹配分值合理,也會提出串音告知。
設(shè)計者從實際監(jiān)測錄音文件中提取了中國國際廣播電臺蒙古語、漢語及多種外語的播報音短音頻,制作了哈希碼模板,然后試驗用短波接收機錄制了一些整點播報的音頻。設(shè)計者編寫了軟件,對這些音頻進行編碼匹配。通過一段約2 分鐘的波斯語播報錄音及其和對應(yīng)模板匹配的結(jié)果,如圖2 所示。圖中上部是待識別錄音的時域曲線,中部是該錄音的時頻圖譜,下部是該錄音哈希碼和波斯語播報模板哈希碼的移動匹配分?jǐn)?shù)過程??梢钥闯霎?dāng)模板時間移動到待識別哈希碼對應(yīng)時段時,出現(xiàn)匹配峰值。
在2019年春季換頻之前,設(shè)計者錄制了某天多個時間段多個頻率的中國國際廣播電臺的整點播報錄音。選取可聽度較好的錄音樣本,時間為整點前30 秒到整點后90 秒。從互聯(lián)網(wǎng)資源和人工收測中挑取多個語種播報,生成模板序列,對這些錄音匹配識別。樣本總數(shù)85 個,扣除沒有合適模板匹配不上40 個,沒有模板誤報語種6 個,實際有效樣本39 個,其中準(zhǔn)確識別35 個約占90%,錯誤識別4 個,約占10%。而這4 個錯誤識別全是播報語種不在模板語種集合,預(yù)計各個語種播報模板完善后這種錯報可以消除。所以試驗結(jié)果證明基于哈希編碼匹配方法可以準(zhǔn)確的識別廣播節(jié)目。如表1 所示。
圖2 中國國際廣播電臺波斯語整點播報匹配
表1 樣本錄音識別結(jié)果表
本文提出的基于哈希編碼匹配方法來識別廣播節(jié)目的方法較好地克服了廣播信道畸變、不同接收機頻率響應(yīng)的影響有四點成果。第一,達(dá)到了不需要訓(xùn)練,不挑接收機的效果。第二,這種基于時頻特征編碼的方法具有較好的抗噪聲能力,對待識別的音頻質(zhì)量要求非常寬松。第三,這種方法適用于任何語言,并且同時提取語音和音樂特征,適用性較好。第四,基于時頻圖譜編碼的識別算法是一種順序處理算法,處理速度較快。