王虓,成斌
(廣州南方學(xué)院,廣東廣州,510970)
人工智能技術(shù)作為現(xiàn)代技術(shù)的集大成者,其可以說是近年來最受關(guān)注的新技術(shù)之一,并且逐漸在各個(gè)領(lǐng)域得到了有效應(yīng)用。尤其是隨著萬物互聯(lián)時(shí)代、5G時(shí)代的到來,人工智能技術(shù)得以在無人駕駛汽車、人臉識別、機(jī)器翻譯、聲紋識別、智能客服機(jī)器人、智能外呼機(jī)器人、智能音箱、個(gè)性化推薦、醫(yī)學(xué)圖像處理、圖像搜索等方面得到不同程度應(yīng)用,為人們的生活與工作帶來了巨大便捷,也推動(dòng)著現(xiàn)代智慧社會建設(shè)進(jìn)程的逐步推進(jìn)。人工智能技術(shù)在電視上的應(yīng)用,使得電視功能更加強(qiáng)大,能夠?qū)崿F(xiàn)語音操作、學(xué)習(xí)用戶使用及搜索習(xí)慣、人性化推薦用戶喜好內(nèi)容等功能,帶給用戶前所未有的良好體驗(yàn)。其中人機(jī)交互是影響和決定用戶體驗(yàn)的關(guān)鍵,也是人工智能技術(shù)應(yīng)用效果的體現(xiàn),有必要圍繞其展開研究和探討。
隨著人工智能電視的快速發(fā)展,智能化人機(jī)交互已經(jīng)成為消費(fèi)者選擇電視產(chǎn)品的重要因素。消費(fèi)者往往十分關(guān)注個(gè)性化的交互能力,著重挑選電視搭載的實(shí)力雄厚、技術(shù)先進(jìn)的AI語音系統(tǒng),而且強(qiáng)調(diào)交互的便攜性。對人工智能在電視人機(jī)交互中的實(shí)踐方式進(jìn)行分析,并基于此探索構(gòu)建符合消費(fèi)者需求的人機(jī)交互方式。
(1)基本優(yōu)勢。對人工智能電視而言,語音交互可謂是標(biāo)準(zhǔn)配置。在移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)快速發(fā)展的當(dāng)下,語音交互功能已經(jīng)被廣泛應(yīng)用于智能冰箱、智能電視、智能手機(jī)、智能音箱等領(lǐng)域,可以說是連接智慧生活的重要方式。對智能電視而言,語音交互能夠大幅提高輸入效率。電視受限于遙控器這一輸入裝置,在文字輸入方面往往速度較慢,而語音輸入的速度本就比傳統(tǒng)鍵盤輸入速度要快得多,且具有門檻低、對用戶要求低的優(yōu)勢,較基于電視遙控器的文字輸入速度更是有明顯的優(yōu)勢。與此同時(shí),語音交互還能實(shí)現(xiàn)跨空間便捷化交互。在遠(yuǎn)場語音技術(shù)的支持下,用戶即便離麥克風(fēng)的距離很遠(yuǎn),也能實(shí)現(xiàn)精準(zhǔn)、便捷、有效的語音交互,進(jìn)一步提高語音輸入的效率,強(qiáng)化便捷性。而且語音交互還支持組合指令輸出,即用戶可以一次性下達(dá)多條指令,然后由人工智能電視識別并分別執(zhí)行這些指令的意圖,這使得輸入效率得到進(jìn)一步提升。更為關(guān)鍵的是,智能電視的人機(jī)語音交互能夠有效解放用戶的雙手和雙眼,用戶能夠在家中一邊做其他事一邊和電視實(shí)現(xiàn)有效交互,不用再到處找遙控器或者中斷正在做的事,能夠帶給用戶絕佳的人機(jī)交互體驗(yàn)。另外人工智能電視的語音交互往往還能實(shí)現(xiàn)對更多聲學(xué)信息的有效處理,對用戶語音中包含的聲紋信息、身份信息、性別信息、年齡信息、情感信息等進(jìn)行解析,從而更加全面、智能地與用戶進(jìn)行交互。
(2)語音對話。實(shí)際上智能電視早就上市并受到了廣泛青睞,但其語音交互方式較為死板,往往只能對固定指令進(jìn)行識別,無法理解固定指令之外的其他用戶語音,更無法進(jìn)行自我學(xué)習(xí)。而隨著近年來人工智能技術(shù)在電視這中的廣泛應(yīng)用,智能語音交互才逐漸成為主流。智能語音交互意味著人工智能電視能夠?qū)τ脩舻恼Z音進(jìn)行全方位識別,不僅能夠理解方言內(nèi)容,還能對一些復(fù)雜指令和信息進(jìn)行處理,就像是真的有人在電視中和用戶進(jìn)行交互一樣。最為關(guān)鍵的是人工智能電視可以實(shí)現(xiàn)聯(lián)機(jī)自我學(xué)習(xí),在不斷學(xué)習(xí)中逐步提高智能化水平,更加有效地理解用戶意圖,為用戶提供更具個(gè)性化的服務(wù)?,F(xiàn)如今人工智能電視已經(jīng)能夠通過語音和用戶實(shí)現(xiàn)多輪對話,即在用戶發(fā)出語音指令后,電視能夠在響應(yīng)指令的同時(shí)對用戶接下來的意圖進(jìn)行推測,并進(jìn)一步展開對話,而非干巴巴地和用戶進(jìn)行一問一答,可以帶給用戶更為良好的語音服務(wù)體驗(yàn)。
(3)遠(yuǎn)場語音。近年來遠(yuǎn)場語音逐漸取代傳統(tǒng)的按鍵語音交互方式,意味著用戶可以真正實(shí)現(xiàn)“解放雙手”,甚至可以在不知道遙控位置的情況下和人工智能電視進(jìn)行語音交互,省去了不少麻煩。遠(yuǎn)場語音功能的實(shí)現(xiàn)主要是基于麥克風(fēng)陣列,即通過至少兩顆麥克風(fēng)來對用戶語音波形進(jìn)行識別,再通過波束成形技術(shù)實(shí)現(xiàn)定向收聲,達(dá)到不管用戶在什么位置都能和人工智能電視進(jìn)行原廠語音交互的效果。通常來說,人工智能電視中麥克風(fēng)陣列的麥克風(fēng)數(shù)量越多,定向精度就越高。這是由于麥克風(fēng)陣列主要包含線性布局和環(huán)形布局兩種布局方式,前者主要適用于2或者4顆麥克風(fēng)的情況,后者主要適用于4或者6顆麥克風(fēng)的情況。在麥克風(fēng)數(shù)量與布局形式的雙重作用下,數(shù)量較多的環(huán)形布局麥克風(fēng)陣列在定向精度方面更占優(yōu)勢,能夠更加精準(zhǔn)地對用戶位置進(jìn)行定位,從而保障遠(yuǎn)場語音交互的穩(wěn)定性和可靠性。
(4)人工智能語音交互應(yīng)用存在的不足。雖然人工智能語音交互在電視人機(jī)交互中的應(yīng)用有著巨大優(yōu)勢,目前在實(shí)際應(yīng)用方面也受到了廣大用戶的青睞和推崇,但在應(yīng)用中依舊有著一些亟待解決的問題。首先,噪聲抑制能力需進(jìn)一步加強(qiáng)。電視的主要使用場景為家電場景,家中的大量家電設(shè)備如冰箱、空調(diào)等都可能發(fā)出強(qiáng)噪音,這些噪音會對電視人機(jī)語音交互造成不小影響,導(dǎo)致語音識別率下降。就目前來看,部分人工智能電視在家電強(qiáng)噪音環(huán)境下的語音識別準(zhǔn)確率并未達(dá)到90%,無法滿足用戶實(shí)際需求,也會嚴(yán)重影響人機(jī)交互體驗(yàn)。其次,遠(yuǎn)距離交互的識別準(zhǔn)確率需進(jìn)一步提高。遠(yuǎn)距離交互是智慧生活背景下人工智能電視實(shí)現(xiàn)人機(jī)交互的重要方式,是帶給用戶良好交互體驗(yàn)的必要形式。不過隨著距離的增加,遠(yuǎn)場語音識別能力往往會逐漸削弱,識別準(zhǔn)確率會有所下降。尤其是對一些麥克風(fēng)數(shù)量較少、線性布局的麥克風(fēng)陣列而言,人工智能電視的遠(yuǎn)場語音識別準(zhǔn)確率無法達(dá)到95%的標(biāo)準(zhǔn),自然會影響語音交互的實(shí)際應(yīng)用效果。然后,回聲消除能力需進(jìn)一步增強(qiáng)。在智能音箱等喇叭發(fā)出高音量噪聲的情況下,人工智能電視對人聲的識別很容易受到影響。尤其是在95DB高音量嘈雜環(huán)境下,智能音箱等發(fā)出的聲音以及相應(yīng)的回聲會產(chǎn)生不小干擾,導(dǎo)致喚醒率低于92%,嚴(yán)重影響用戶體驗(yàn)。最后為提高全方位感知定位精度。隨著人工智能電視的進(jìn)一步發(fā)展,10°的感知定位精度已經(jīng)不能完全滿足用戶需求
從本質(zhì)上來說,人機(jī)交互只是一種方式,交互的內(nèi)容才是關(guān)鍵所在。只有通過交互滿足用戶需求,為用戶提供令他們滿意的優(yōu)質(zhì)內(nèi)容,基于人工智能技術(shù)的人機(jī)交互才具有意義。
(1)基于語音交互的內(nèi)容提供。人工智能電視給予了用戶多樣化的交互選擇,用戶可根據(jù)自身實(shí)際需求選擇適合的交互方式,如遙控交互、語音交互、攝像頭交互等。其中語音交互是目前最受用戶青睞和推崇的方式,不但可以大幅提高用戶的輸入效率,也能降低使用門檻,簡化使用操作。而與傳統(tǒng)遙控交互相比,語音交互的內(nèi)容提供需要更加智能化。傳統(tǒng)遙控交互往往是基于“所見即所得”的原則進(jìn)行,用戶在電視界面上使用遙控選擇自身需要的功能,便可得到相應(yīng)內(nèi)容。而在語音交互模式下,用戶的輸入指令可能較為模糊不清,需要基于人工智能技術(shù)實(shí)現(xiàn)對用戶指令的智能化識別,從而提供令用戶滿意的優(yōu)質(zhì)服務(wù)。
(2)智能化、個(gè)性化內(nèi)容推薦。內(nèi)容推薦是人工智能技術(shù)應(yīng)用于電視領(lǐng)域帶來的用戶體驗(yàn)飛越,其能夠真正做到為用戶提供、打造私人化、個(gè)性化的影音庫。在人工智能技術(shù)的支持下,不少電視都能夠?qū)崿F(xiàn)對用戶喜好習(xí)慣的總結(jié),從而針對性地推送相應(yīng)優(yōu)質(zhì)內(nèi)容。例如在人機(jī)語音交互中,用戶接觸到了他之間從未接觸過的內(nèi)容類型,并不知不覺間被吸引,驚呼:“原來這個(gè)真這么好看?!贝藭r(shí)用戶自身可能都沒意識到自己需要進(jìn)一步獲取更多同一類型的優(yōu)質(zhì)內(nèi)容,而人工智能電視則能通過語音交互實(shí)現(xiàn)對用戶語音內(nèi)容以及情感信息進(jìn)行分析、整理,并在后續(xù)的系統(tǒng)推薦中為用戶推薦相關(guān)優(yōu)質(zhì)內(nèi)容,滿足用戶實(shí)際需求。依托于人工智能技術(shù),標(biāo)簽體系能夠真正做到智能化,基于廣大用戶的實(shí)際體驗(yàn)對影音內(nèi)容打上多元化且貼合用戶需求的標(biāo)簽,并針對性地為用戶推薦合適的相關(guān)標(biāo)簽內(nèi)容。這種標(biāo)簽體系與傳統(tǒng)依賴運(yùn)營人員進(jìn)行標(biāo)簽制定、匹配和推薦算法優(yōu)化的體系相比,無疑更能貼近用戶真實(shí)需求,保障個(gè)性化推薦的合理性與有效性。另外在人工智能技術(shù)的加持下,視頻圖譜檢索+多輪對話、音樂圖譜檢索、短視頻新聞檢索、圖像識別、百科知識等內(nèi)容也成為了電視人機(jī)交互中的重要內(nèi)容,可以滿足用戶不同需求。
隨著智慧生活的不斷發(fā)展,人工智能電視在智慧家庭中所發(fā)揮的作用不僅僅局限于提供內(nèi)容,更是要作為家庭助手的大屏終端,連接家庭中的所有家電,為用戶提供更加便捷、高效的服務(wù),真正推動(dòng)家庭生活智慧化發(fā)展。在此過程中,電視人機(jī)交互的發(fā)展將進(jìn)一步得到創(chuàng)新與拓展,除了人機(jī)語音交互水平進(jìn)一步提高之外,人機(jī)內(nèi)容交互將得到全方位延伸。用戶能夠通過電視機(jī)獲得需要對內(nèi)容和信息,也能獲得完善的服務(wù)支持,如控制智能電器設(shè)備、設(shè)置鬧鐘、線上購物等。