国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能電視語音交互專利技術(shù)綜述

2018-06-06 05:28劉文靜黃懈
科技創(chuàng)新與應(yīng)用 2018年15期
關(guān)鍵詞:專利

劉文靜 黃懈

摘 要:語音交互是智能電視人機交互的重要發(fā)展方向,已成為國內(nèi)外智能電視相關(guān)企業(yè)、機構(gòu)創(chuàng)新競爭的重點。文章重點研究智能電視中語音交互技術(shù)的國內(nèi)外專利情況,對技術(shù)總體發(fā)展趨勢、專利布局、分支情況、重點發(fā)明人等進行分析。

關(guān)鍵詞:智能電視;語音交互;專利

中圖分類號:TP18 文獻標(biāo)志碼:A 文章編號:2095-2945(2018)15-0003-03

Abstract: Voice interaction is an important development direction of intelligent television human-computer interaction, and has become the focus of innovation competition of domestic and foreign intelligent television related enterprises and institutions. This paper focuses on the situation of domestic and foreign patent of voice interaction technology in intelligent television, and analyzes the overall development trend, patent layout, branch situation, key inventors and so on.

Keywords: intelligent TV; voice interaction; patent

引言

隨著2010年Google首款智能電視的面世,全球電視產(chǎn)業(yè)也隨之跨入智能化時代,世界IT巨頭和跨國電視企業(yè)都相繼投入巨資開發(fā)智能電視,傳統(tǒng)電視產(chǎn)業(yè)格局被打破,新興廠商與傳統(tǒng)電視企業(yè)開始博弈,爭奪市場。隨著網(wǎng)絡(luò)技術(shù)、芯片技術(shù)、軟件技術(shù)、顯示技術(shù)及云計算、物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展,全球智能電視產(chǎn)業(yè)得到了迅猛發(fā)展,智能電視已成為一種潮流,其發(fā)展勢頭不可阻擋。在智能電視各項關(guān)鍵技術(shù)中,人機交互技術(shù)是制約電視智能化發(fā)展和普及的重要瓶頸,其成為國際國內(nèi)智能電視相關(guān)企業(yè)、機構(gòu)創(chuàng)新競爭的重點,成為智能電視專利布局的重要方向[1]。語音是最自然最直接的獲取信息和交流信息的方式,語音信息的輸入、識別和執(zhí)行,能夠極大地降低用戶的溝通成本,豐富人機交互方式。隨著互聯(lián)網(wǎng)的快速發(fā)展和云計算的不斷成熟,以及智能電視時代的到來,語音技術(shù)在智能電視終端人機交互中的重要性也日漸凸顯。利用語音來控制終端已成為可能,即智能終端能夠聽懂用戶的語音,并根據(jù)用戶的語音指令做出快速響應(yīng),這將大大提升用戶的操作便捷性。語音交互式目前是最被業(yè)界看好的人機交互方式之一,微軟、蘋果、IBM等國際巨頭爭相投以巨資進行研發(fā),三星、松下、長虹、TCL等多個品牌所銷售的智能電視均已植入了語音識別功能。

1 智能電視語音交互技術(shù)原理及分支情況

語音交互流程[2]如圖1所示:通過語音輸入設(shè)備,如麥克風(fēng),進行語音數(shù)據(jù)的錄入;然后傳遞給智能電視系統(tǒng)層進行編碼;在將編碼后的語音數(shù)據(jù)傳輸至語音數(shù)據(jù)處理模塊對語音進行語音識別處理;識別成功后,將語音數(shù)據(jù)中包含的文字信息解析出來,并返回給智能電視;最后智能電視對返回的信息映射成控制命令或相關(guān)信息輸入來對智能電視進行相應(yīng)操作,比如更換頻道、打開第三方應(yīng)用等。

通過對智能電視語音交互技術(shù)的專利文獻收集、標(biāo)引和梳理,根據(jù)技術(shù)手段的不同,將該領(lǐng)域大致可以分為三個分支:語音輸入、語音處理、語音控制,如表1所示。

基于語音輸入的電視語音互動包括語音輸入設(shè)備和語音服務(wù)開啟。以遙控器、機頂盒、手機和TV內(nèi)置傳聲器為主的語音輸入設(shè)備,對模擬語音信號進行錄入、濾波、去噪、量化和編碼等步驟,實現(xiàn)語音信息的預(yù)處理及傳輸。為防止智能電視錯誤地識別周圍的環(huán)境噪音而產(chǎn)生不必要的不正常工作,采用特定的輸入語音命令或其他語音操作以開啟語音服務(wù),減少聲音輸出設(shè)備的聲音產(chǎn)生的錯誤識別。

基于語音處理的電視語音互動主要包括兩大部分[3]:語音識別和語義分析。語音識別是語音交互的基礎(chǔ),正確識別用戶的語音信息,是隨后語義分析和語音合成的前提。語音識別過程是對語音特征進行提取的過程,首先要確定語音識別單元,常見的語音識別單元有單詞、音節(jié)和音素三種,選擇何種識別單元取決于具體的研究內(nèi)容,之后對說話人語音進行檢測和降噪等預(yù)處理后,通過對輸入的音頻流進行分析,確定用戶說話起止,即端點檢測;根據(jù)識別單元中的信息進行關(guān)鍵特征的提取,通過壓縮信息、去除冗余信息,從語音信號中提取一組或多組能描述語音信號特征的參數(shù)。語義分析是語音交互技術(shù)中最靈活的一部分,語義分析是在語音識別引擎對語音數(shù)據(jù)進行識別解析后,將識別后的數(shù)據(jù)以某種特定的協(xié)議格式轉(zhuǎn)換成文本,并返回給終端應(yīng)用,并根據(jù)應(yīng)用要求轉(zhuǎn)換成相應(yīng)的邏輯或命令。

基于語音控制的電視語音互動是指用戶通過語音的對話形式,將指令發(fā)送給智能電視,令其自動執(zhí)行相應(yīng)的用戶操作,例如進行音量調(diào)節(jié)、換臺、切換模式等。隨著用戶的需求提升,借助于無所不能的互聯(lián)網(wǎng),能夠?qū)崿F(xiàn)更多的云端功能,例如打開第三方應(yīng)用、天氣查詢等服務(wù),提高了用戶體驗。

智能電視語音互動領(lǐng)域的申請總量為1323項,其中語音輸入、語音處理、語音控制三類的申請數(shù)分別為429項(32.43%)、341項(25.77%)、553項(41.80%)??梢钥闯?,一半以上的專利申請涉及基于語音控制,高于其他兩個分支。比重其次的是語音輸入,而最少的則是語音處理。其原因主要在于基于語音控制的電視互動是人們最自然和最方便的互動方式,因此越來越多的人更愿意由語音形式向電視下達控制命令,由于需求推動技術(shù)的發(fā)展,導(dǎo)致了該分支下的專利申請量也應(yīng)該是最多的。

2 智能電視語音交互技術(shù)專利現(xiàn)狀分析

截至本次檢索時間截止2017年12月,經(jīng)過檢索式檢索與簡單人工篩選,最終確定的涉及智能電視語音交互技術(shù)的全球?qū)@暾埞灿?323項,總計312位申請人,總體發(fā)展趨勢呈現(xiàn)增長狀態(tài)。

(1)全球?qū)@治?。圖2為智能電視語音交互技術(shù)在全球?qū)@暾堉鹉攴植稼厔輬D。從圖2中可以看出,就智能電視語音交互技術(shù)的申請量呈逐年上升趨勢,并在近幾年保持較高的申請量。在1999年以前,智能電視語音交互技術(shù)還處于萌芽階段,申請量很少,每年的申請量只有個位數(shù),申請人主要集中在日本和美國的電視通訊設(shè)備公司和電信公司。在2004年以后,申請量逐漸開始增長,說明此時智能電視語音交互技術(shù)已經(jīng)進入發(fā)展階段,開始受到人們重視,而主要申請人也從以前的日美轉(zhuǎn)為三星、LG等韓國公司。同時,中國的長虹、TCL等公司在該領(lǐng)域的申請也正式起步,雖然起步較晚,但增長顯著,到2010年以后該技術(shù)的申請量都維持在100件以上,說明該技術(shù)在這幾年開始迅猛發(fā)展。從圖中雖然顯示的2016和2017年的申請量呈下降趨勢,但是并不能說明該技術(shù)的熱度正在減少,相反的,該技術(shù)的熱度還會呈上升趨勢,其主要原因在于部分專利技術(shù)還未公開,所以并未被統(tǒng)計完全。

(2)申請的地域分布。圖3為基于智能電視語音交互技術(shù)主要申請國逐年分布趨勢。從圖3中可以看出,在2007年之前,日本的專利申請量一直都位于領(lǐng)先地位,年申請量都高于其他國家,在2003年-2015年,中國、日本、韓國、美國的申請量都呈逐年增長的趨勢。雖然中國在2005年左右才有了該領(lǐng)域的專利申請出現(xiàn),但在2008年后,中國在該領(lǐng)域的申請量顯著增長,2010年左右中國后來居上,智能電視語音交互技術(shù)發(fā)展迅猛,年申請量超過了其他幾個國家。一方面這是由于世界知名的廠商在中國有眾多的代工企業(yè),另一方面,我國在這一階段涌現(xiàn)出了大批優(yōu)秀的國內(nèi)電視廠商,如長虹、樂視、聯(lián)想、TCL等,這些電視廠商將語音交互技術(shù)應(yīng)用到電視中,這也成就了我國在該領(lǐng)域的專利申請量爆發(fā)式增長。

(3)主要申請人分布。圖4示出了智能電視語音交互技術(shù)全球主要申請人的分布和排名情況,這代表了各公司在該領(lǐng)域的技術(shù)儲備和技術(shù)實力。從圖4中可以看出,全球申請量排名前十五的多為國際知名跨國企業(yè),排名前五位的分別是三星電子、松下、索尼、LG和長虹。在排名前十五的申請人中,有五位申請人是日本企業(yè):索尼、松下、東芝、船井電機、日本廣播公司,這三家日本公司均以數(shù)碼影像、電視技術(shù)為主要業(yè)務(wù),并具有豐富的電視產(chǎn)品支持,足見日本在該領(lǐng)域中的領(lǐng)先優(yōu)勢。有兩位申請人是韓國企業(yè):三星電子和LG,這兩家公司也都具有雄厚的實力,并在電視互動領(lǐng)域有旺盛需求的公司。有兩位申請人是美國企業(yè):美國電話電報公司和nuance,三位申請人是中國企業(yè),一位申請人是歐洲企業(yè)。雖然排名前十五的申請人均是技術(shù)實力雄厚的公司,但是在智能電視語音交互技術(shù)領(lǐng)域中的申請的絕對量并不是很多,這十五家申請人的申請量的總和只占了申請總量的35%左右,因此該領(lǐng)域在全球范圍內(nèi)仍未形成具有絕對優(yōu)勢的申請人集團。而中國也有三家公司進入了前十五的行列,長虹是中國最為悠久的電視及相關(guān)行業(yè)的電視廠商,并且擁有實力雄厚的技術(shù)儲備,以聯(lián)想、樂視等為代表的互聯(lián)網(wǎng)公司在智能電視領(lǐng)域近幾年發(fā)展迅速。

(4)主要申請國家分布。圖5是智能電視語音交互技術(shù)全球?qū)@暾埖膰壹暗貐^(qū)分布圖。從圖5中可以看出,來自中國的專利申請占總申請量的28%,可見在該領(lǐng)域中雖然中國技術(shù)發(fā)展較晚,但是申請人的技術(shù)力量不容小覷。美國和日本的申請量緊接其后,其申請量占全球申請量的26%和25%,由于這兩個國家其在該領(lǐng)域發(fā)展最早,前期儲備了優(yōu)厚的技術(shù)作為基礎(chǔ),率先將該技術(shù)引入到電視互動中,擁有大量的基礎(chǔ)專利技術(shù),他們一直處于該領(lǐng)域的前列,引領(lǐng)行業(yè)發(fā)展趨勢,并大力發(fā)展這一在電視互動領(lǐng)域語音互動,可見日本和美國在該領(lǐng)域中的技術(shù)優(yōu)勢十分明顯。而韓國作為電視領(lǐng)域技術(shù)力量雄厚的國家,其在智能電視語音交互技術(shù)申請量也僅次于日本,可見對該領(lǐng)域的重視程度。

3 結(jié)束語

本文對智能電視語音互動領(lǐng)域的技術(shù)演進、專利申請狀況、重點專利等進行了分析。從整體來看,智能電視語音互動技術(shù)在全球和中國的申請量都在持續(xù)的增長,特別是近幾年進入了快速發(fā)展時期,智能電視語音互動技術(shù)主要的原創(chuàng)動力來自于中國、美國、韓國和日本,來自于日本和韓國的申請人具有較強的實力,中國和美國缺少領(lǐng)軍型的申請人,中國申請人與國外申請人在該領(lǐng)域的差距還比較明顯,應(yīng)當(dāng)加強在該領(lǐng)域的研發(fā)力度。

參考文獻:

[1]張文鳳.面向智能電視的個性化人機交互系統(tǒng)的設(shè)計與實現(xiàn)[D].哈爾濱工業(yè)大學(xué),2014.

[2]吳進強,蘇凱雄.基于智能電視的語音識別系統(tǒng)的設(shè)計與實現(xiàn)[J].電視技術(shù),2013,37(10):27-30.

[3]詹新明,黃南山,楊燦.語音識別技術(shù)研究進展[J].現(xiàn)代計算機,2008(9):43-45.

猜你喜歡
專利
王振義 放棄專利為患者
專利資產(chǎn)全壽命管理模式探討
華為三星專利大戰(zhàn)國內(nèi)大局已定
華為三星專利大戰(zhàn)國內(nèi)大局已定
USPTO裁定卡駱馳專利無效
蘋果收購泛泰11件專利
IBM2016年獲得超過7000項專利
滴滴購60余件導(dǎo)航技術(shù)基礎(chǔ)專利
2007年上半年專利授權(quán)狀況統(tǒng)計