近日,標貝科技推出一項可商業(yè)落地的聲音轉(zhuǎn)換解決方案,可將任何一種聲音的音色,精準遷移至目標聲音的音色,實現(xiàn)聲音的轉(zhuǎn)換。
據(jù)介紹,上述聲音轉(zhuǎn)換解決方案是基于深度神經(jīng)網(wǎng)絡學習,應用語音信號處理和語音識別技術,可將原說話人的音色轉(zhuǎn)換成目標人音色。
目前,該解決方案已達到商業(yè)場景落地要求,如有聲閱讀、兒童教育、媒體、泛娛樂等多場景均可使用。
標貝科技語音技術相關負責人表示,聲音轉(zhuǎn)換和變聲器存在顯著不同,具體表現(xiàn)在4個方面。
一是聲音轉(zhuǎn)換效果。無論是變聲器軟件還是傳統(tǒng)變聲技術,合成的效果都存在機械味偏重問題,整體聽感不自然。而新聲音轉(zhuǎn)換方案,依托智能語音技術和深度學習技術,可以高度還原原說話人的語氣和韻律等。
二是交互體驗。傳統(tǒng)的變聲軟件輸出的聲音音色轉(zhuǎn)換較單調(diào),缺乏個性化的聲音表達。新聲音轉(zhuǎn)換技術方案能夠很好地解決傳統(tǒng)變聲的問題,可以達到高辨識度、高自然度、高流暢度的變聲效果,同時能夠保留原發(fā)音人的語氣、韻律節(jié)奏等特征,讓變換后的聲音更有層次,更有個性。
三是應用場景。為了適應不同場景需要,聲音轉(zhuǎn)換技術有針對性地進行輸出聲音的優(yōu)化訓練,進而可以更好地滿足用戶差異化的需求。
四是轉(zhuǎn)換價值。傳統(tǒng)變聲器輸出的效果很不穩(wěn)定,需要大量人工的調(diào)節(jié),整體音質(zhì)質(zhì)量只能滿足部分娛樂場景的需求。而新變聲技術,提供一站式轉(zhuǎn)換,無需人工參與,便可獲得穩(wěn)定的自然聲音效果。