国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能音箱在電信運營商業(yè)務的應用研究

2019-03-15 10:44蘇雨聃劉含宇
郵電設計技術 2019年2期
關鍵詞:音箱智能家居運營商

李 奧,梁 博,蘇雨聃,劉含宇

(1.中國聯(lián)通網(wǎng)絡技術研究院,北京100048;2.中國聯(lián)通系統(tǒng)集成有限公司,北京

100032)

0 引言

隨著人工智能相關技術飛速發(fā)展以及人們對生活品質(zhì)要求不斷提高,人工智能技術逐漸被引進智能家居產(chǎn)品中。語言是人類最重要最便捷的交流方式。通過語音交互技術實現(xiàn)智能音箱對智能家居產(chǎn)品的控制,是目前智能家居交互入口的目標。本文從技術和產(chǎn)業(yè)層面分析智能音箱的發(fā)展現(xiàn)狀和趨勢,研究智能音箱在電信運營商業(yè)務中的難點、對應解決方案和實際應用部署情況,展望電信運營商在智能音箱產(chǎn)業(yè)的發(fā)展策略。

1 智能音箱發(fā)展現(xiàn)狀及趨勢

1.1 智能音箱概述

智能音箱是一種由人工智能與傳統(tǒng)音箱結(jié)合的產(chǎn)品,擁有了解天氣、打電話、點歌等基礎功能。借助穩(wěn)定的網(wǎng)絡連接和良好的收音效果喚醒音箱,最終實現(xiàn)人機對話。目前市場上智能音箱的核心功能有4個,如表1所示。

隨著家居控制進入信息化、智能化時代,智能音箱逐漸成為市場熱點,其作為智能家居的入口,也將成為電信運營商們競爭的焦點。

表1 智能音箱的核心功能及其具體內(nèi)容

1.2 智能音箱核心技術

智能音箱擁有從聽(語音識別)到理解思考(語義理解)再到說(語音合成)的完整閉環(huán)能力?;镜闹悄芤粝湔Z音交互流程如圖1所示。

圖1 智能音箱語音交互流程圖[9]

1.2.1 語音識別技術

語音識別的原理圖如圖2所示。

圖2 語音識別原理圖[6]

預處理模塊:包含預濾波、采樣和量化、分幀、加窗、預加重、端點檢測等。其中,端點檢測(VAD)是語音喚醒的重要環(huán)節(jié),它標記語音信號的開始和結(jié)束,準確性直接影響語音識別的效果。智能音箱多采用基于隱馬爾可夫模型的語音喚醒模型。隱馬爾可夫模型(HMM)解決的3個問題如表2所示。

特征提取模塊:提取語音信號中反映語音特征的若干參數(shù)。常用的有線性預測系數(shù)(LPC)、線性預測倒譜系數(shù)(LPCC)、MEL頻率倒譜系數(shù)(MFCC)。LPCC從發(fā)音模型角度出發(fā),運算復雜度低,但是高頻干擾多、系統(tǒng)可靠性差;MFCC從聽覺模型出發(fā),與LPCC相比,MFCC有更好的系統(tǒng)識別性能。

訓練階段:用戶輸入訓練的語音,經(jīng)過預處理及特征提取后,每個詞條取得一個特征矢量參數(shù),并作為模板保存,建立特征模板庫,參與訓練的人越多,識別的魯棒性越好。

識別階段:將輸入的語音信號經(jīng)過特征矢量參數(shù)提取后,生成測試模板,與參考模板進行相似性比較,并根據(jù)一定的搜索和匹配策略找出一系列最優(yōu)的、與輸入語音信號匹配的模板,最后查表得出識別結(jié)果。

目前語音識別最常用的算法有:動態(tài)時間規(guī)整(DTW)算法(解決說話速度不均勻造成的識別困難)、矢量量化(VQ)、隱馬爾可夫模型(HMM)法(研究熱點)和人工神經(jīng)網(wǎng)絡(ANN)法(語音識別常用的神經(jīng)網(wǎng)絡有反向傳播(BP)算法神經(jīng)網(wǎng)絡、徑向基函數(shù)網(wǎng)絡(RGF)神經(jīng)網(wǎng)絡等,雖然可以處理一些環(huán)境復雜、知識背景不清楚、推理原則不明確的問題,但是不能很好地描述語音信號的時間動態(tài)性,所以多與傳統(tǒng)識別方法結(jié)合使用)。

表2 隱馬爾可夫模型要解決的3個問題及其解決方法和應用

1.2.2 語義理解技術

語義理解就是將自然語言文本轉(zhuǎn)化為用戶的意圖?;谏疃葘W習的自然語言處理(NLP)技術,可支持多個垂直領域的精準語義解析,可以進行新領域的快速擴展。建立基于感知機的中文分詞、詞性標注和命名實體識別框架,可以實現(xiàn)分詞、詞性標注和命名實體識別,還可以進行“在線學習”(或“增量訓練”)。最后將識別結(jié)果匹配到具體的操作指令中。

1.2.3 語音合成技術

語音合成技術使智能音箱能根據(jù)文本內(nèi)容發(fā)出人類的聲音。該技術涵蓋了語言學、聲音學、信號數(shù)字化處理等多種技術,具體流程如圖3。

語音合成的步驟如下:

圖3 語音合成流程圖[10]

a)文本整理、詞匯切分、語法意義分析,使智能音箱對文本信息完全理解。

b)解碼和韻律特征提取,為語音合成設計和規(guī)劃音頻特征(音長、音強、音調(diào)等)。

最后合成的語音可以正確表達語義,得到音頻輸出。

1.3 智能音箱產(chǎn)業(yè)

智能語音技術剛剛落地,還需要獲取大量用戶的數(shù)據(jù)資源,通過用戶數(shù)據(jù)不斷學習訓練,智能音箱才能更加智能。市場占有率和銷量會影響到智能音箱的體驗,也是智能音箱產(chǎn)品的重要影響因素。全球智能音箱的市場份額見圖4。

圖4 全球智能音箱的市場份額

如圖4所示,2014年11月首發(fā)的亞馬遜智能音箱(Echo)憑借其先發(fā)優(yōu)勢和豐富的產(chǎn)品,占據(jù)了市場41%的份額;2016年5月首發(fā)的谷歌智能音箱(google home)通過其低、中、高產(chǎn)品矩陣和用戶基礎,占據(jù)了市場28%的份額,2017年7月首發(fā)的阿里巴巴智能音箱(天貓精靈)占據(jù)7%的份額,2018年2月首發(fā)的蘋果智能音箱(HomePod)占據(jù)5.9%的份額,2015年5月首發(fā)的京東智能音箱(叮咚)占據(jù)2.2%的份額,其他品牌共占據(jù)16%的份額。

1.4 智能音箱發(fā)展趨勢分析

1.4.1 技術發(fā)展趨勢

語音識別系統(tǒng)已進入商品化階段,但是機器與人自然交流的終極目標目前仍未實現(xiàn)。需要繼續(xù)研究解決的技術難點見表3。

語義理解技術是自然語言理解領域研究的熱點,目前需要繼續(xù)研究解決的技術難點見表4。

表3 語音識別技術難點及其對應解決方案

表4 語義理解技術難點及其對應解決方案

語音合成技術未來還需要提升自然度(從句子到篇章這一級的自然度),豐富合成語音的表現(xiàn)力(增加年齡特征、性別特征及語氣語速特征);降低語音合成技術的復雜度,減小音庫容量;增加多語種語音合成,容納不同地域的方言。

1.4.2 產(chǎn)業(yè)發(fā)展趨勢

智能音箱是一個潛在而又龐大的市場,也是家庭娛樂的延伸領域。國外市場中如亞馬遜、谷歌等互聯(lián)網(wǎng)企業(yè)多采用“走量”策略,通過大量設備搶占市場份額。未來智能音箱市場不但重視硬件銷量,還重視挖掘新盈利模式,如口播廣告、內(nèi)容訂閱服務(音樂訂閱、高級會員服務和企業(yè)解決方案)等。相比2018年美國智能音箱市場亞馬遜、谷歌和蘋果“三足鼎立”的態(tài)勢,國內(nèi)市場則更復雜,京東、阿里都有相應產(chǎn)品,在2017年底,百度、騰訊也參與進來。

國內(nèi)智能音箱產(chǎn)業(yè)在未來仍需要深入研究解決以下問題。

a)如何提高智能家居普及率以促進智能音箱在家居控制中的循環(huán)發(fā)展。

b)中西方生活方式差異對智能音箱的使用率有何影響,如國外的應用場景主要在客廳和廚房,國內(nèi)則是客廳和臥室。

c)廠商在開拓語音交互技術過程中如何提升用戶體驗。

d)智能音箱可能會收集越來越多的敏感數(shù)據(jù),如通話記錄、電子郵件信息、生活習慣等,如何保障用戶隱私安全也是問題之一。

e)智能等級不清晰,外界不能以量化的方式合理評估智能音箱能力。

2 電信運營商智能音箱應用研究

2.1 電信運營商使用智能音箱發(fā)展業(yè)務的難點

國內(nèi)電信運營商正在尋找新的收入增長領域,目前,市場上主流的智能家居產(chǎn)品均需聯(lián)網(wǎng),對于擅長做“管道”的運營商而言,進入智能家居的門檻并不高,特別是對于技術、硬件和內(nèi)容整合都不占優(yōu)勢的國內(nèi)電信運營商而言,聚焦智能音箱以打通智能家居交互入口是一個好的選擇,但是目前仍面臨以下難點,其中難點d)和e)為國內(nèi)電信運營商特有,其他為國內(nèi)外運營商共有。

a)價格影響。互聯(lián)網(wǎng)公司相對更早進入智能音箱市場,擁有更成熟的技術、更豐富的配套智能家居產(chǎn)品,多采用低價“走量”策略。在低價策略下,電信運營商很難與互聯(lián)網(wǎng)公司推出的智能音箱搶占市場,難以形成一定的規(guī)模,降低成本難度較大。

b)盈利策略。電信運營商的盈利模式是通過智能音箱控制智能家居產(chǎn)品以實現(xiàn)流量變現(xiàn),這促使電信運營商將智能音箱與IPTV類產(chǎn)品進行融合。但是音箱類產(chǎn)品完全不同于傳統(tǒng)電視視頻,其仍需要大量數(shù)據(jù)建模分析及運營優(yōu)化工作來滿足廣泛的用戶需求,以此增強用戶黏性,進而達到開拓用戶、匯聚流量的目的,最終實現(xiàn)流量變現(xiàn),為電信運營商帶來更大的盈利。

c)互聯(lián)網(wǎng)生態(tài)。與互聯(lián)網(wǎng)企業(yè)相比,電信運營商缺乏豐富的生態(tài)內(nèi)容和強大的消費硬件物聯(lián)網(wǎng)。

d)捆綁補貼政策。國內(nèi)電信運營商對智能音箱的銷售主要采取與寬帶業(yè)務捆綁補貼的政策,保證用戶能以更低的價格買到高端音箱。補貼有助于國內(nèi)電信運營商的智能音箱普及,但是如果不能快速帶來相應的增量收入,則會陷入成本泥潭。

e)“運營”策略。如何平衡國內(nèi)電信運營商和智能音箱硬件廠商的利益仍需要考慮,這關乎到雙方的盈利策略。國內(nèi)電信運營商不愿僅僅替硬件廠商銷售設備,變成智能音箱硬件廠商的零售渠道商,而智能音箱硬件廠商更愿意把產(chǎn)品拿到互聯(lián)網(wǎng)公司的電商平臺上銷售。

f)標準規(guī)范。各電信運營商都在做自己的智能音箱規(guī)范,但是目前并沒有一個統(tǒng)一的規(guī)范,而各電信運營商自己的規(guī)范可能不全面,或多或少地缺乏完善的智能等級評測、安全條例、防廣告規(guī)范。

g)技術水平。相較于互聯(lián)網(wǎng)企業(yè),擅長做“管道”的電信運營商的優(yōu)勢在于其擁有成熟的通信網(wǎng)絡技術,劣勢在于其涉足人工智能相關技術較晚且技術能力較弱,即便擁有自研的人工智能平臺,運營商在語音識別、自然語言處理等模型構(gòu)建、訓練方面仍然與互聯(lián)網(wǎng)企業(yè)存在一定差距。

2.2 電信運營商使用智能音箱發(fā)展業(yè)務的建議方案

根據(jù)上文提及的電信運營商難點,提出了如下的解決方案。

為了避免陷入成本泥潭,國內(nèi)電信運營商可以加大運營力度,提升流量變現(xiàn)能力;控制智能設備的補貼水平(如對高值用戶和戰(zhàn)略業(yè)務可以適當加大補貼力度),這既體現(xiàn)了經(jīng)營的向?qū)?,也是一種客戶經(jīng)營的差異化手段,同時也會提升用戶的感知度,盡量避免贈送后用戶感知度低、使用率低的局面。

為了縮小與互聯(lián)網(wǎng)企業(yè)的價格差距,同時擴展規(guī)模,電信運營商可以采用與光貓、機頂盒類似的手段,統(tǒng)一標準,一起降低成本。

國內(nèi)電信運營商可以向德國電信學習,與智能音箱硬件廠商合作,通過類似于收取商場或者商家租金的模式,從設備商的銷售收入中獲得分成,。

電信運營商可以充分利用產(chǎn)業(yè)鏈資源,提出相關的標準規(guī)范。運營商可以利用自己的品牌優(yōu)勢,作為安全保障者或第三方機構(gòu)為智能音箱產(chǎn)品做測評、評級、認證,與互聯(lián)網(wǎng)企業(yè)聯(lián)合起草評估規(guī)范(評估規(guī)范包括語音識別、語音交互、語音合成、安全服務等測試),共同完成對音箱整體智能化能力的評估,為用戶的選擇提供量化依據(jù)。

電信運營商可以與互聯(lián)網(wǎng)企業(yè)合作,利用互聯(lián)網(wǎng)企業(yè)豐富的技術資源、生態(tài)內(nèi)容等,共同打造一款智能音箱,并集全國之力進行線上線下的銷售,保持一致性、穩(wěn)定性的銷售政策,從而可以匯聚流量,實現(xiàn)流量變現(xiàn),達到互利共贏的目標。

電信運營商需要發(fā)掘智能音箱與傳統(tǒng)IPTV業(yè)務在內(nèi)容處理和推薦業(yè)務邏輯上的差異,短期內(nèi)對用戶使用數(shù)據(jù)進行深度分析,并依次優(yōu)化內(nèi)容運營工作,從而盡可能滿足更多用戶的需求,為電信運營商匯聚更多流量,實現(xiàn)流量變現(xiàn),帶來更大的盈利。

2.3 電信運營商基于智能音箱的應用

目前國內(nèi)外電信運營商在智能音箱產(chǎn)業(yè)上均部署了相應的應用。

中國聯(lián)通自主研發(fā)的智能音箱可以由語音控制IPTV機頂盒實現(xiàn)視頻點播、頻道切換、系統(tǒng)控制等功能,智能家居的其他智能設備控制、VoWiFi等能力將被進一步整合融入,從而打造中國聯(lián)通智慧家庭智能語音生態(tài)。同時中國聯(lián)通也在積極參加智能音箱評測標準的制定工作。

中國電信與科大訊飛合作,運用科大訊飛語音識別技術研發(fā)出智能音箱小翼。這款音箱是基于中國電信光纖寬帶網(wǎng)絡能力,可進行語音操控的智能化終端。該音箱集4K機頂盒、高清攝像頭和藍牙音箱于一體。

中國移動自主研發(fā)的智能AI音箱(咪咕Home音箱)具備獨特的多輪語音操控功能。另外音箱還與移動通信業(yè)務相結(jié)合,通過Andlink快速連接智能家居,成為智能家居的控制入口。中國移動也在參加智能音箱評測標準的制定工作。

德國電信發(fā)布了一款具備語音助理功能的智能音箱Magenta。該智能音箱的定位是連接智能家庭、電視和其他在線服務的樞紐。該智能音箱可以支持EntertainTV及Magenta SmartHome智能家居服務,該音箱還能與亞馬遜的智能語音助理Alexa服務互聯(lián)。

3 電信運營商智能音箱業(yè)務發(fā)展策略

電信運營商可以通過加大運營力度來提升流量變現(xiàn)的能力,控制智能設備的補貼水平和力度,提升客戶感知度,進而避免陷入成本泥潭。另外,互聯(lián)網(wǎng)公司的智能音箱多以線上銷售為主,電信運營商的智能音箱銷售服務政策需要保持一定的穩(wěn)定性和一致性,集全國之力聚焦某幾款重點銷售,在形成規(guī)模后,進而降低成本,匯聚流量,實現(xiàn)流量變現(xiàn)。電信運營商可以建立標準規(guī)范,增強對智能音箱的量化評級力度,最終才能夠真正實現(xiàn)“以智能音箱為統(tǒng)一入口,以智能家居產(chǎn)品群為核心載體,以智慧化運營為運營邏輯和流量變現(xiàn)手段,以智能家居產(chǎn)品的合作伙伴群為生態(tài)圈”。

4 結(jié)束語

電信運營商應該抓住人工智能行業(yè)快速發(fā)展的契機,學習互聯(lián)網(wǎng)企業(yè)的商業(yè)模式,大力推動以智能音箱為首的智能家居產(chǎn)品的應用,進而搶占智能家居市場,變現(xiàn)流量,提高收益。同時電信運營商也應該積極關注智能音箱的安全隱患,增大對系統(tǒng)安全的投入,并推動建立相關行業(yè)標準(如智能音箱接口、智能度測評等)。

猜你喜歡
音箱智能家居運營商
KEF推出新一代LS50 Wireless Ⅱ音箱
Polk(普樂之聲)推出高端Reserve系列音箱
基于PLC的智能家居控制系統(tǒng)研究
小音箱,大精彩 B&W 805 D3尊貴版書架音箱
多一對音箱,多一份驚喜Marantz AV8805
基于Zigbee的無線通信技術在智能家居中的應用
智能家居發(fā)展或?qū)崿F(xiàn)彎道超車
取消“漫游費”只能等運營商“良心發(fā)現(xiàn)”?
第一章 在腐敗火上烤的三大運營商
三大運營商換帥不是一個簡單的巧合