張建明 陶 宏 王良民 詹永照 宋順林
摘要:唇動視覺語音特征提取是音視頻驅(qū)動的人臉動畫唇動表示和唇讀研究的關(guān)鍵技術(shù).首先針對彩色視頻圖像進行唇色增強,對增強后的灰度圖像進行閾值分割,獲取唇部包圍框,并根據(jù)口型發(fā)音的視覺特征進行初分類;然后進行尺度與灰度歸一化處理,對預(yù)處理后的圖像提取奇異值特征;最后采用基于歐氏距離的模板匹配法對該奇異值特征所包含的視覺語音信息進行測試試驗,結(jié)果表明該低維度特征包含了大量唇動視覺語音信息,可用于單個人在自然環(huán)境下的唇語口型識別.
關(guān)鍵詞:唇動;特征提??;SVD;唇讀
中圖分類號:TP391.4
文獻(xiàn)標(biāo)識碼:A
文章編號:1671—7775(2004)05—0426—04