汽車(chē)語(yǔ)音交互模型及設(shè)計(jì)策略

2022-05-27 03:56:28吳彥希楊隨先劉行

包裝工程 2022年10期

吳彥希，楊隨先，劉行

吳彥希，楊隨先，劉行

（四川大學(xué) 機(jī)械工程學(xué)院，成都 610065）

在智能技術(shù)飛速發(fā)展、用戶需求不斷增長(zhǎng)的背景下，以用戶體驗(yàn)為中心，探索汽車(chē)工業(yè)“新四化”趨勢(shì)下的汽車(chē)語(yǔ)音交互新形態(tài)，重構(gòu)汽車(chē)語(yǔ)音交互模型，針對(duì)性地提出交互設(shè)計(jì)策略。分析車(chē)載語(yǔ)音系統(tǒng)與用戶之間的信息交流過(guò)程，構(gòu)建汽車(chē)語(yǔ)音界面架構(gòu)和交互模型。通過(guò)“新四化”趨勢(shì)下汽車(chē)語(yǔ)音交互在信息主體、信息范圍和信息內(nèi)容等方面的變化綜述，運(yùn)用信息處理流程理論開(kāi)展汽車(chē)語(yǔ)音交互模型和設(shè)計(jì)策略研究。根據(jù)車(chē)載語(yǔ)音系統(tǒng)的信息處理流程，提出了以功能層、內(nèi)容層、形式層、情感層為信息架構(gòu)的汽車(chē)語(yǔ)音界面，構(gòu)建了基于信息交流的汽車(chē)語(yǔ)音交互模型。基于語(yǔ)音界面的信息架構(gòu)理論，提出了未來(lái)的汽車(chē)語(yǔ)音交互在功能拓展、內(nèi)容豐富、形式優(yōu)化和情感滿足等方面的設(shè)計(jì)策略。從信息交流角度開(kāi)展的汽車(chē)語(yǔ)音交互設(shè)計(jì)研究，對(duì)車(chē)載語(yǔ)音系統(tǒng)交互設(shè)計(jì)和體驗(yàn)優(yōu)化具有參考意義。

汽車(chē)語(yǔ)音交互；語(yǔ)音界面；交互模型；設(shè)計(jì)策略

語(yǔ)音交互是以自然語(yǔ)言為載體進(jìn)行信息傳遞的交互方式，其具有自然、便捷等特性，近年來(lái)被逐漸應(yīng)用于汽車(chē)人機(jī)交互領(lǐng)域中。在汽車(chē)語(yǔ)音交互之前，人們通過(guò)操作物理按鍵實(shí)現(xiàn)了對(duì)車(chē)輛的控制，駕駛員能夠由觸覺(jué)通道直接感受到操作完成的反饋，使交互過(guò)程更加準(zhǔn)確、可靠，但缺乏一定的靈活性。隨后，中控屏的出現(xiàn)逐漸取代了傳統(tǒng)的物理按鍵，并演變?yōu)橹饕能?chē)內(nèi)交互方式，特別是觸摸屏的應(yīng)用進(jìn)一步豐富了汽車(chē)中控的功能，體現(xiàn)出信息可拓展的優(yōu)勢(shì)。信息量的增加給駕駛員造成了一定的干擾與負(fù)擔(dān)，影響了駕駛的效率與安全[1]，語(yǔ)音交互對(duì)聽(tīng)覺(jué)通道的利用，在很大程度上緩解了這一問(wèn)題。若駕駛員在動(dòng)態(tài)駕駛環(huán)境中需要發(fā)起交互，如修改導(dǎo)航地點(diǎn)、查詢當(dāng)前位置等，語(yǔ)音輸入能夠盡量避免對(duì)駕駛員雙手或雙眼的占用，減少對(duì)駕駛過(guò)程的打斷，從而保障汽車(chē)人機(jī)交互的安全性與高效性。語(yǔ)言作為人們?nèi)粘Ｉ钪凶顬槠毡榈慕涣鞣绞?，減少了語(yǔ)音交互的學(xué)習(xí)成本，提高了信息交流的自然感，因此，語(yǔ)音交互在車(chē)載場(chǎng)景中具有非常大的應(yīng)用潛力。

當(dāng)前，大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)在交通領(lǐng)域的應(yīng)用，促發(fā)了汽車(chē)工業(yè)的第4次變革，即汽車(chē)工業(yè)的“新四化”（智能化、網(wǎng)聯(lián)化、共享化和電動(dòng)化）。在“新四化”趨勢(shì)中，智能網(wǎng)聯(lián)是核心內(nèi)容，也是汽車(chē)交互形態(tài)更新的主要?jiǎng)恿Α！肮蚕砘焙汀半妱?dòng)化”分別改變了汽車(chē)的出行模式和動(dòng)力系統(tǒng)。在汽車(chē)行業(yè)轉(zhuǎn)型升級(jí)的同時(shí)，用戶日益增長(zhǎng)的安全、效率及情感等需求提高了用戶體驗(yàn)的滿意度閾值。目前的汽車(chē)語(yǔ)音交互研究，較少涉及理論層面的汽車(chē)語(yǔ)音交互體驗(yàn)及設(shè)計(jì)研究。筆者以“智能化”和“網(wǎng)聯(lián)化”為研究重點(diǎn)，通過(guò)對(duì)車(chē)載語(yǔ)音系統(tǒng)與用戶的信息交流過(guò)程進(jìn)行分析，構(gòu)建并升級(jí)汽車(chē)語(yǔ)音交互模型，從而優(yōu)化語(yǔ)音交互體驗(yàn)。

1 汽車(chē)語(yǔ)音交互中的信息交流

人機(jī)交互是信息交流的過(guò)程，在汽車(chē)語(yǔ)音交互設(shè)計(jì)之前，有必要對(duì)人機(jī)之間的信息交流過(guò)程進(jìn)行研究，獲取用戶認(rèn)知、用戶體驗(yàn)與汽車(chē)語(yǔ)音交互設(shè)計(jì)的關(guān)聯(lián)，以此找到更優(yōu)的信息組織與表達(dá)路徑。

1.1 車(chē)載語(yǔ)音系統(tǒng)中的信息傳遞

1.1.1 信息的接收

汽車(chē)語(yǔ)音界面是車(chē)載語(yǔ)音系統(tǒng)與用戶間進(jìn)行信息傳遞的重要渠道，用戶通過(guò)語(yǔ)音界面對(duì)汽車(chē)進(jìn)行控制與交流。在信息接收階段，用戶將需求以語(yǔ)音指令的形式輸出，被汽車(chē)語(yǔ)音界面接收，并進(jìn)行簡(jiǎn)單的前端處理，包括語(yǔ)音喚醒、聲源定位、聲紋識(shí)別、端點(diǎn)檢測(cè)等。例如北汽新推出的汽車(chē)ARCFOX αT，其各個(gè)車(chē)座都搭載了四麥克風(fēng)PIC聲場(chǎng)定位裝置，在多人交流的情況下也能夠識(shí)別用戶的身份和方位，提升了信息獲取的準(zhǔn)確性。語(yǔ)音指令接收完畢后，汽車(chē)語(yǔ)音界面會(huì)將語(yǔ)音信息傳遞到后臺(tái)處理器。

1.1.2 信息的處理

信息處理階段包含語(yǔ)意識(shí)別、功能匹配、內(nèi)容確定、語(yǔ)音反饋等重要環(huán)節(jié)。后臺(tái)處理器的語(yǔ)音識(shí)別模塊先將前端過(guò)濾出的語(yǔ)音信息編碼為向量矩陣，通過(guò)聲學(xué)、詞匯和語(yǔ)言模型將單個(gè)向量解碼為對(duì)應(yīng)的音素、詞匯、語(yǔ)句，并輸出為文本信號(hào)。由自然語(yǔ)言理解模塊對(duì)文本信息進(jìn)行領(lǐng)域（Domain）、語(yǔ)意（Intent）、位置（Slot）的3級(jí)拆分，幫助計(jì)算機(jī)理解用戶意圖并與系統(tǒng)功能相匹配，從而確定反饋信息的類(lèi)型與內(nèi)容。通過(guò)對(duì)話管理和語(yǔ)義生成模塊生成語(yǔ)法通順的反饋文本，最后語(yǔ)音合成為可以聽(tīng)懂的、類(lèi)似人類(lèi)聲音的信息后再進(jìn)行輸出[2]。

1.1.3 信息的反饋

在汽車(chē)語(yǔ)音交互中，語(yǔ)音是主要的但不是唯一的反饋方式，除了語(yǔ)音反饋外，中控屏界面是最主要的反饋形式。視覺(jué)界面在信息表達(dá)上具有豐富性、完整性、可重復(fù)性，能夠很好地彌補(bǔ)語(yǔ)音信息在認(rèn)知特性上的不足。針對(duì)不斷增加的交互信息量，汽車(chē)語(yǔ)音交互可以通過(guò)提示音、表情、動(dòng)效、燈光等方式，實(shí)現(xiàn)更加高效可靠的信息反饋，見(jiàn)圖1。

圖1 汽車(chē)中“語(yǔ)音+界面/表情/動(dòng)效/燈光”的反饋示例

1.2 用戶認(rèn)知與用戶體驗(yàn)的形成

認(rèn)知神經(jīng)科學(xué)把人們對(duì)周?chē)h(huán)境的認(rèn)知過(guò)程看作是一種信息加工過(guò)程。參考王熙元[3]提出的信息傳達(dá)結(jié)構(gòu)模型，可將用戶的信息處理過(guò)程理解為用戶通過(guò)聽(tīng)覺(jué)、視覺(jué)、觸覺(jué)等通道感知信息，并經(jīng)過(guò)大腦的記憶、理解、思考等認(rèn)知行為形成反應(yīng)（行為反應(yīng)和心理反應(yīng)）。行為上的反應(yīng)指輸出決策，包括停止或繼續(xù)對(duì)話、執(zhí)行動(dòng)作等。心理上的反應(yīng)指用戶在多次認(rèn)知后形成一種面向汽車(chē)語(yǔ)音交互的主觀感受，即用戶體驗(yàn)，包括感官體驗(yàn)、行為體驗(yàn)和情感體驗(yàn)。感官體驗(yàn)來(lái)自汽車(chē)語(yǔ)音交互的不同反饋形式，包括聽(tīng)覺(jué)體驗(yàn)、視覺(jué)體驗(yàn)、觸覺(jué)體驗(yàn)等。聽(tīng)覺(jué)體驗(yàn)與反饋語(yǔ)音的聲音質(zhì)量、聲學(xué)特征、語(yǔ)音內(nèi)容等因素相關(guān)，視覺(jué)體驗(yàn)主要受中控屏反饋界面中文字、色彩、圖像等因素的影響。行為體驗(yàn)取決于用戶是否能輕松、自然地進(jìn)行語(yǔ)音控制，以及車(chē)載語(yǔ)音系統(tǒng)是否能準(zhǔn)確、高效、可靠地完成交互任務(wù)。情感體驗(yàn)來(lái)自用戶在行駛過(guò)程中的思考、聯(lián)想、回憶等意識(shí)活動(dòng)，是在感官體驗(yàn)和行為體驗(yàn)的基礎(chǔ)上產(chǎn)生的心理感受的總和，包括安全感、信任感、愉悅感、掌控感等。

2 汽車(chē)語(yǔ)音交互模型構(gòu)建

2.1 汽車(chē)語(yǔ)音界面架構(gòu)

在用戶認(rèn)知中，汽車(chē)語(yǔ)音界面是語(yǔ)音交互信息組織和功能實(shí)現(xiàn)的主要平臺(tái)，代表的是整個(gè)車(chē)載語(yǔ)音系統(tǒng)。汽車(chē)語(yǔ)音界面的信息架構(gòu)與車(chē)載語(yǔ)音系統(tǒng)中的信息傳遞過(guò)程相關(guān)，可分為功能層、內(nèi)容層和形式層。

1）功能層體現(xiàn)的是用戶語(yǔ)音指令涉及的交互功能。根據(jù)對(duì)現(xiàn)有車(chē)載語(yǔ)音場(chǎng)景的分析，可將汽車(chē)語(yǔ)音交互功能歸納為車(chē)載導(dǎo)航、車(chē)輛控制、車(chē)況監(jiān)控、多媒體娛樂(lè)、日常資訊等。車(chē)載語(yǔ)音系統(tǒng)通過(guò)對(duì)指令文本的理解與分類(lèi)，來(lái)定位相關(guān)功能、調(diào)取應(yīng)用界面、確定信息類(lèi)型。車(chē)載系統(tǒng)中搭載的應(yīng)用軟件，也可以通過(guò)云服務(wù)平臺(tái)來(lái)提供網(wǎng)絡(luò)信息。

2）在功能層的基礎(chǔ)上，內(nèi)容層根據(jù)用戶意圖來(lái)確定內(nèi)容范圍、細(xì)化反饋信息。語(yǔ)音交互中的信息類(lèi)型包括車(chē)輛信息、路況信息、環(huán)境信息、娛樂(lè)信息、社交信息、網(wǎng)絡(luò)信息等。例如，當(dāng)用戶詢問(wèn)“還有多久到目的地”時(shí)，匹配的是車(chē)載導(dǎo)航功能，對(duì)應(yīng)車(chē)輛信息中的車(chē)速、行駛路線和環(huán)境信息中的GPS定位等內(nèi)容，系統(tǒng)通過(guò)計(jì)算后可以告知用戶剩余的行程時(shí)間。除此之外，汽車(chē)語(yǔ)音界面的內(nèi)容層還包括任務(wù)狀態(tài)信息的反饋，如任務(wù)進(jìn)行狀態(tài)、任務(wù)錯(cuò)誤環(huán)節(jié)等。

3）形式層指汽車(chē)語(yǔ)音交互中不同的反饋形式。車(chē)載語(yǔ)音系統(tǒng)會(huì)根據(jù)反饋的信息類(lèi)型與內(nèi)容，對(duì)不同的感官通道中的信息量進(jìn)行分配，將交互信息以純語(yǔ)音或“語(yǔ)音+”的形式反饋給用戶。

2.2 汽車(chē)語(yǔ)音交互模型

目前汽車(chē)語(yǔ)音交互系統(tǒng)中信息交流的主體分別為用戶（駕駛員和乘客）和車(chē)輛，用戶輸入的語(yǔ)音指令是信息交流的起點(diǎn)，汽車(chē)語(yǔ)音界面接收到指令后，將調(diào)取對(duì)應(yīng)的功能進(jìn)行顯示，同時(shí)向用戶反饋信息的處理狀態(tài)，并根據(jù)信息內(nèi)容以多種形式輸出反饋結(jié)果?；谝陨戏治?，構(gòu)建汽車(chē)語(yǔ)音交互模型，以圖像化表達(dá)汽車(chē)語(yǔ)音交互系統(tǒng)中的信息交流過(guò)程。目前的汽車(chē)語(yǔ)音交互模型見(jiàn)圖2。

圖2 目前的汽車(chē)語(yǔ)音交互模型

3 汽車(chē)語(yǔ)音交互設(shè)計(jì)策略

2020年2月，國(guó)家發(fā)改委提出智能網(wǎng)聯(lián)汽車(chē)已成為全球汽車(chē)產(chǎn)業(yè)發(fā)展的戰(zhàn)略方向。在以智能網(wǎng)聯(lián)為主的“新四化”發(fā)展趨勢(shì)下，汽車(chē)語(yǔ)音交互中的信息交流發(fā)生了變化。

1）信息交流主體數(shù)量增加。同一輛車(chē)會(huì)向不同的駕駛員和乘客提供出行服務(wù)，道路中的行人、車(chē)輛、信號(hào)燈等主體也會(huì)參與到信息交流中。

2）信息交流主體角色轉(zhuǎn)換。用戶不再是唯一的交互發(fā)起者，汽車(chē)可以基于用戶信息主動(dòng)響應(yīng)用戶需求。

3）信息交流范圍擴(kuò)大。駕駛場(chǎng)景中的用戶能夠通過(guò)汽車(chē)語(yǔ)音界面與家居、辦公等場(chǎng)景進(jìn)行跨設(shè)備、跨空間的信息交流。

4）信息內(nèi)容多樣化。隨著信息主體的增加、信息范圍的擴(kuò)大以及情感交流的加入，車(chē)載語(yǔ)音系統(tǒng)可獲得的信息內(nèi)容更加豐富。

基于以上變化，對(duì)目前的汽車(chē)語(yǔ)音交互模型進(jìn)行升級(jí)重構(gòu)，提出未來(lái)的汽車(chē)語(yǔ)音交互模型，并以此討論汽車(chē)語(yǔ)音交互的設(shè)計(jì)策略，見(jiàn)圖3。不管汽車(chē)語(yǔ)音交互的信息交流網(wǎng)如何變化，語(yǔ)音界面作為汽車(chē)與用戶的信息交流平臺(tái)，始終是語(yǔ)音交互的核心，因此，汽車(chē)語(yǔ)音交互設(shè)計(jì)策略必須面向語(yǔ)音界面的各個(gè)信息層。

面部識(shí)別、機(jī)器學(xué)習(xí)、無(wú)線通信等新技術(shù)的應(yīng)用，增加了車(chē)載語(yǔ)音系統(tǒng)獲取信息的渠道，豐富了信息內(nèi)容，為主動(dòng)響應(yīng)、自動(dòng)駕駛、駕駛行為監(jiān)控、個(gè)性化服務(wù)、智能互聯(lián)等交互場(chǎng)景的拓展提供了實(shí)現(xiàn)基礎(chǔ)。在汽車(chē)“新四化”趨勢(shì)下，汽車(chē)語(yǔ)音交互涉及的交互信息類(lèi)型見(jiàn)表1。

圖3 未來(lái)的汽車(chē)語(yǔ)音交互模型

表1 汽車(chē)語(yǔ)音交互中涉及的交互信息類(lèi)型

Tab.1 Types of interactive information involved in in-vehicle voice interaction

3.1 面向功能層的設(shè)計(jì)策略

3.1.1 主動(dòng)響應(yīng)用戶需求

主動(dòng)響應(yīng)的內(nèi)涵在于車(chē)載系統(tǒng)能夠主動(dòng)感知用戶、環(huán)境等信息的變化，預(yù)測(cè)用戶的行為與意圖，從而主動(dòng)響應(yīng)用戶需求[5]。汽車(chē)語(yǔ)音交互的主動(dòng)性體現(xiàn)在功能引導(dǎo)、主動(dòng)交流、安全提醒等方面。對(duì)于“新手用戶”，車(chē)載語(yǔ)音交互系統(tǒng)能夠主動(dòng)介紹其語(yǔ)音功能及流程，從而引導(dǎo)用戶正確使用，還能持續(xù)記錄用戶的交互過(guò)程，在易錯(cuò)的環(huán)節(jié)主動(dòng)給予語(yǔ)音幫助[6]。主動(dòng)交流指在某些特定的場(chǎng)景（如長(zhǎng)途駕駛或道路擁堵等）中，結(jié)合用戶信息、場(chǎng)景變化和上下文語(yǔ)境，汽車(chē)主動(dòng)發(fā)起關(guān)于旅途景點(diǎn)、當(dāng)日新聞等符合用戶偏好的話題交流，從而增加行駛過(guò)程的趣味性。安全提醒指車(chē)載語(yǔ)音交互系統(tǒng)及時(shí)將車(chē)輛、路況中的不安全因素報(bào)告給用戶，如油量偏低、前方陡坡等，從而提升駕駛安全性。此外，主動(dòng)響應(yīng)還可以與駕駛行為監(jiān)控、自動(dòng)駕駛、個(gè)性化服務(wù)、情感交互等功能相融合，幫助用戶完成信息收集、分析等工作，有利于減輕用戶的認(rèn)知負(fù)荷[7]，并提升其駕駛體驗(yàn)[8]。

3.1.2 提供人機(jī)協(xié)作交流平臺(tái)

自動(dòng)駕駛意味著駕駛員會(huì)將部分或全部的汽車(chē)控制權(quán)讓渡給車(chē)輛。針對(duì)自動(dòng)駕駛的控制權(quán)轉(zhuǎn)換流程，語(yǔ)音交互可以發(fā)揮建議與確認(rèn)的作用，使用戶將控制權(quán)的轉(zhuǎn)換當(dāng)作人機(jī)協(xié)作的一種形式，從而減少控制權(quán)缺失帶來(lái)的不安全感等負(fù)面情緒。如在控制權(quán)移交前，語(yǔ)音告知用戶在當(dāng)前情境下進(jìn)行自動(dòng)駕駛的可行性與安全性，并給出相關(guān)建議，使用戶在充分認(rèn)知的情況下自主掌握開(kāi)啟自動(dòng)駕駛模式的時(shí)機(jī)?？刂茩?quán)移交后，以“語(yǔ)音+”的形式給予用戶接管成功的肯定答復(fù)，并隨時(shí)匯報(bào)自動(dòng)駕駛的運(yùn)行情況。汽車(chē)語(yǔ)音交互提供的人機(jī)協(xié)作交流平臺(tái)，能夠有效提高以掌控感為代表的用戶行為體驗(yàn)。

3.1.3 調(diào)整用戶駕駛狀態(tài)及駕駛行為

由于技術(shù)和制度的限制，目前自動(dòng)駕駛汽車(chē)還未達(dá)到推廣應(yīng)用的標(biāo)準(zhǔn)，駕駛?cè)蝿?wù)依然是未來(lái)較長(zhǎng)時(shí)間內(nèi)駕駛員的主要任務(wù)。車(chē)載語(yǔ)音交互系統(tǒng)通過(guò)對(duì)用戶的聲音情緒、面部表情、視覺(jué)注意、生理信號(hào)等信息進(jìn)行監(jiān)測(cè)，來(lái)實(shí)現(xiàn)狀態(tài)測(cè)量及行為監(jiān)控[9]，其可以將結(jié)果轉(zhuǎn)換為語(yǔ)音提醒，使用戶集中駕駛注意力，也可以通過(guò)播放歡快的音樂(lè)，幫助用戶保持清醒。同時(shí)，車(chē)載語(yǔ)音交互系統(tǒng)會(huì)對(duì)用戶駕駛行為（換道、轉(zhuǎn)向、控制車(chē)速等）進(jìn)行持續(xù)關(guān)注，能夠在問(wèn)題發(fā)生前通過(guò)語(yǔ)音提醒用戶，并給出修正建議。

3.1.4 提供個(gè)性化語(yǔ)音服務(wù)

當(dāng)前，綠色出行、低碳生活等理念催生出了共享出行的產(chǎn)業(yè)形態(tài)，包括汽車(chē)租賃、共享服務(wù)等。當(dāng)同一輛車(chē)被不同的駕駛員使用時(shí)，控制權(quán)轉(zhuǎn)換與個(gè)性化服務(wù)將成為車(chē)內(nèi)交互的重點(diǎn)。在語(yǔ)音交互技術(shù)的支持下，車(chē)輛可以通過(guò)聲紋信息識(shí)別用戶的身份，自動(dòng)切換到對(duì)應(yīng)的個(gè)人賬號(hào)，與共享系統(tǒng)核對(duì)后打開(kāi)控制權(quán)限，并根據(jù)賬號(hào)中記錄的行為偏好和歷史操作等信息，設(shè)置、調(diào)整車(chē)內(nèi)軟硬件，從而營(yíng)造出用戶熟悉的駕駛氛圍。車(chē)載系統(tǒng)可以對(duì)用戶畫(huà)像、行為偏好、行駛軌跡等信息進(jìn)行全方位的分析和個(gè)性化的推薦，并適當(dāng)調(diào)整語(yǔ)音順序，優(yōu)先表達(dá)用戶更關(guān)注的信息，保證用戶對(duì)關(guān)鍵信息的準(zhǔn)確感知。此外，語(yǔ)音系統(tǒng)還應(yīng)支持汽車(chē)語(yǔ)音形象的個(gè)性化定制，以滿足用戶自我塑造、追求獨(dú)特的交互需求。在提供個(gè)性化語(yǔ)音服務(wù)的同時(shí)，車(chē)載系統(tǒng)還需要保護(hù)用戶的個(gè)人隱私。

3.1.5 連接多設(shè)備多空間的信息交流

在單車(chē)智能升級(jí)的同時(shí)，無(wú)線通信技術(shù)搭建了車(chē)與車(chē)、車(chē)與人、車(chē)與環(huán)境之間的信息傳輸網(wǎng)絡(luò)，使汽車(chē)從一個(gè)交通工具轉(zhuǎn)變?yōu)橹悄艿囊苿?dòng)空間和應(yīng)用終端。汽車(chē)語(yǔ)音交互不僅包括車(chē)內(nèi)人機(jī)交互，還包括汽車(chē)與行人、車(chē)輛、道路設(shè)施甚至家居、辦公等空間的交互。在駕駛場(chǎng)景中，用戶通過(guò)語(yǔ)音界面獲知周?chē)?chē)輛與行人的位置信息，以車(chē)外顯示或協(xié)議通信的形式傳遞自身的行駛意圖，通過(guò)多向交流提高交通的有序性。以道路設(shè)施中的信號(hào)燈為例，汽車(chē)通過(guò)接收行駛路段中每一處信號(hào)燈的信息，提前語(yǔ)音提示或輔助用戶控制車(chē)速，從而減少擁堵情況的發(fā)生[10]。除了駕駛場(chǎng)景之外，用戶還可以通過(guò)語(yǔ)音控制家居、辦公等空間中的設(shè)備，或通過(guò)汽車(chē)語(yǔ)音界面與醫(yī)療、政務(wù)、旅游等場(chǎng)景產(chǎn)生互動(dòng)。

3.2 面向內(nèi)容層的設(shè)計(jì)策略

3.2.1 復(fù)雜信息的有效組織與表達(dá)

隨著汽車(chē)的智能化轉(zhuǎn)型，汽車(chē)語(yǔ)音交互涉及的信息量和復(fù)雜度都大大提升，但正如諾曼所說(shuō)，優(yōu)秀的設(shè)計(jì)并不是減少?gòu)?fù)雜，而是管理復(fù)雜[11]。汽車(chē)語(yǔ)音交互設(shè)計(jì)應(yīng)該以提供復(fù)雜但易用的交互為目標(biāo)。為了降低用戶的認(rèn)知負(fù)荷，汽車(chē)語(yǔ)音交互內(nèi)容層可以將用戶的行為邏輯作為信息組織架構(gòu)[12]，整合有可能與語(yǔ)音指令產(chǎn)生關(guān)聯(lián)的各類(lèi)信息內(nèi)容，通過(guò)分析、計(jì)算、篩選等步驟，先對(duì)用戶疑問(wèn)進(jìn)行回應(yīng)，再將相關(guān)信息作為補(bǔ)充進(jìn)行表達(dá)。例如，當(dāng)用戶詢問(wèn)“現(xiàn)在幾點(diǎn)”時(shí)，匹配的是日常資訊功能中的時(shí)間信息，但車(chē)載系統(tǒng)通過(guò)相同時(shí)間點(diǎn)的歷史操作信息，可判斷出用戶正處于下班準(zhǔn)備回家的狀態(tài)，從而預(yù)測(cè)出用戶的下一步行為可能是詢問(wèn)擁堵情況及返程時(shí)間，因此，可回應(yīng)用戶“現(xiàn)在是晚上6點(diǎn)，前方路況暢通，大約30 min后可到家哦”。

3.2.2 錯(cuò)誤操作的人性化反饋

語(yǔ)音交互在車(chē)載場(chǎng)景中的應(yīng)用仍處于發(fā)展階段，因此，交互錯(cuò)誤是不可避免的，需建立錯(cuò)誤操作的應(yīng)對(duì)機(jī)制來(lái)優(yōu)化汽車(chē)語(yǔ)音交互設(shè)計(jì)，以提高產(chǎn)品的容錯(cuò)性[13]。車(chē)載語(yǔ)音系統(tǒng)可以先告知用戶具體的錯(cuò)誤環(huán)節(jié)，然后給出解決方法，使用戶感知到系統(tǒng)處理交互錯(cuò)誤的積極態(tài)度。若語(yǔ)音識(shí)別環(huán)節(jié)錯(cuò)誤，可建議用戶按照規(guī)定語(yǔ)序重新輸入指令；若功能匹配環(huán)節(jié)錯(cuò)誤，可建議用戶嘗試使用系統(tǒng)的其他功能；若動(dòng)作執(zhí)行環(huán)節(jié)錯(cuò)誤，可引導(dǎo)用戶以手動(dòng)等形式完成操作。另外，為了避免重復(fù)的錯(cuò)誤反饋導(dǎo)致用戶負(fù)面情緒的增加，需要設(shè)計(jì)多個(gè)人性化的語(yǔ)音腳本，以提高汽車(chē)語(yǔ)言表達(dá)的靈活性，或通過(guò)增加表情等內(nèi)容來(lái)提高語(yǔ)音的情緒效價(jià)[14]。

3.3 面向形式層的設(shè)計(jì)策略

3.3.1 優(yōu)化汽車(chē)語(yǔ)音形象

汽車(chē)語(yǔ)音形象是用戶根據(jù)聲音、語(yǔ)調(diào)、對(duì)話內(nèi)容等要素形成的對(duì)汽車(chē)語(yǔ)音的擬人化印象，能夠幫助汽車(chē)在人格層面上與用戶建立關(guān)聯(lián)，提升用戶的情感體驗(yàn)。汽車(chē)語(yǔ)音形象包括性別、年齡、人機(jī)關(guān)系和性格特征等擬人化特質(zhì)，其設(shè)計(jì)需遵循匹配性、相似性和一致性原則。性別、年齡、人機(jī)關(guān)系的設(shè)定需要與用戶的個(gè)人喜好相匹配，如女性音色匹配男性用戶、管家型角色匹配駕駛新手。用戶對(duì)與自身性格近似的語(yǔ)音形象擁有更高的喜好度與信任度[15]。系統(tǒng)可通過(guò)分析用戶人格特征為其選擇性格相似的汽車(chē)語(yǔ)音形象，并保持?jǐn)M人化特質(zhì)之間的一致性，尤其是避免人機(jī)關(guān)系與性格特征的不適配。

3.3.2 促進(jìn)多通道反饋融合

隨著信息量的增加，汽車(chē)語(yǔ)音交互難以適應(yīng)各種信息的反饋要求，多通道反饋不僅能彌補(bǔ)語(yǔ)音信息認(rèn)知的不足，而且有利于減輕用戶在單一通道中的認(rèn)知負(fù)荷，使用戶對(duì)駕駛空間形成全面的認(rèn)知[16]。針對(duì)不同的交互場(chǎng)景，系統(tǒng)可根據(jù)汽車(chē)語(yǔ)音界面的功能層和內(nèi)容層確定反饋信息的范圍，篩選出語(yǔ)音信息不能表達(dá)或難以表達(dá)的內(nèi)容，以界面、氛圍燈、振動(dòng)、香氛等形式進(jìn)行輔助呈現(xiàn)，如通過(guò)中控臺(tái)燈光來(lái)持續(xù)傳達(dá)自動(dòng)駕駛的運(yùn)行狀態(tài)。

3.4 面向情感層的設(shè)計(jì)策略

智能技術(shù)的應(yīng)用與發(fā)展，使汽車(chē)越來(lái)越像人們的出行伙伴。汽車(chē)語(yǔ)音交互將從信息交互轉(zhuǎn)向情感交互，在語(yǔ)音界面中，可以從情緒感知和情感表達(dá)2個(gè)方面來(lái)增加情感設(shè)計(jì)，從而提升用戶的情感體驗(yàn)。情緒感知即“察言觀色”，車(chē)載語(yǔ)音系統(tǒng)通過(guò)語(yǔ)音指令的韻律特征、音質(zhì)特征和頻譜特征來(lái)分析語(yǔ)音情感，結(jié)合用戶的面部表情、生理信號(hào)等信息來(lái)判斷用戶實(shí)時(shí)的情緒狀態(tài)，以此調(diào)整汽車(chē)語(yǔ)音的語(yǔ)調(diào)、語(yǔ)速等，使其表現(xiàn)出與用戶相似的情緒，從而拉近人機(jī)關(guān)系。人性化的語(yǔ)音形象是汽車(chē)情感表達(dá)的一大助力。此外，車(chē)載語(yǔ)音系統(tǒng)還可以通過(guò)上下車(chē)問(wèn)候、節(jié)日祝福等形式，讓用戶獲得被陪伴、被關(guān)愛(ài)的感覺(jué)，使用戶對(duì)汽車(chē)產(chǎn)生依賴(lài)感。

4 結(jié)語(yǔ)

目前，車(chē)載語(yǔ)音已成為智能汽車(chē)的基本配置，人工智能等技術(shù)的發(fā)展，使用戶對(duì)未來(lái)的汽車(chē)語(yǔ)音交互場(chǎng)景抱有更高的期待，推動(dòng)著汽車(chē)語(yǔ)音交互設(shè)計(jì)不斷向前發(fā)展。筆者從信息交流的角度，概述了汽車(chē)語(yǔ)音交互的形成，以及其在智能化、網(wǎng)聯(lián)化等趨勢(shì)下的變化，通過(guò)對(duì)未來(lái)汽車(chē)語(yǔ)音交互模型的構(gòu)建，提出了從功能、內(nèi)容、形式、情感4個(gè)方面來(lái)完善汽車(chē)語(yǔ)音交互體驗(yàn)的設(shè)計(jì)策略，為車(chē)載語(yǔ)音系統(tǒng)交互設(shè)計(jì)和體驗(yàn)優(yōu)化提供了參考。

[1] 李云輝. 智能網(wǎng)聯(lián)汽車(chē)人機(jī)交互研究及多通道交互設(shè)計(jì)[D]. 北京: 北京理工大學(xué), 2016.

LI Yun-hui. Research on Human-machine Interaction of Intelligent Connected Vehicle and Multimodal Interaction Design[D]. Beijing: Beijing Institute of Technology, 2016.

[2] 陳艷華. 基于智能交互的車(chē)載語(yǔ)音系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 北京: 北京交通大學(xué), 2020.

CHEN Yan-hua. Design and Implementation of Car VoiceBased on Intelligent Interaction[D]. Beijing: Beijing Jiao-tong University, 2020.

[3] 王熙元. 交互設(shè)計(jì)中的信息傳達(dá)研究[J]. 包裝工程, 2010, 31(12): 12-14.

WANG Xi-yuan. Research on Information Transmission in Interaction Design[J]. Packaging Engineering, 2010, 31(12): 12-14.

[4] 文晗. 基于情境感知的汽車(chē)人機(jī)交互界面設(shè)計(jì)研究[D]. 長(zhǎng)沙: 湖南大學(xué), 2016.

WEN Han. Study on Automotive Human Machine Interface Design Based on Context Awareness[D]. Changsha: Hunan University, 2015.

[5] 李璟璐, 孫效華, 郭煒煒. 基于智能交互的汽車(chē)主動(dòng)響應(yīng)式交互設(shè)計(jì)[J]. 圖學(xué)學(xué)報(bào), 2018, 39(4): 668-674.

LI Jing-lu, SUN Xiao-hua, GUO Wei-wei. Proactive HMIDesign Based on Smart Interaction[J]. Journal of Graphics, 2018, 39(4): 668-674.

[6] 竇金花, 齊若璇. 基于情境分析的適老化智能家居產(chǎn)品語(yǔ)音用戶界面設(shè)計(jì)策略研究[J]. 包裝工程, 2021, 42(16): 202-210.

DOU Jin-hua, QI Ruo-xuan. Research on Elderly-Adap-ta-bility Voice User Interface Design Strategy of Smart Home Products Based on Context Analysis[J]. Packaging Engineering, 2021, 42(16): 202-210.

[7] SCHMIDT M, HELBIG D, BHANDARE O, et al. Assessing Objective Indicators of Users' Cognitive Load During Proactive In-Car Dialogs[C]. New York: Association for Computing Machinery, 2019.

[8] IMAI R, WATANABE K, TSUBOUCHI K, et al. Proactive Car Navigation: How Can Destination Prediction Give us New Navigation Experience?[C]. New York: Asso-ciation for Computing Machinery, 2019.

[9] COUGHLIN J F, REIMER B, MEHLER B. Monitoring, Managing, and Motivating Driver Safety and Well-Being [J]. IEEE Pervasive Computing, 2011, 10(3): 14-21.

[10] 張茫茫. 基于汽車(chē)的多主體多通道交互模型研究[J]. 包裝工程, 2017, 38(20): 7-12.

ZHANG Mang-mang. Multi-Agent & Multi-channel Interaction Design Based on Vehicle[J]. Packaging Engineering, 2017, 38(20): 7-12.

[11] NORMAN D A. Living with Complexity[M]. Boston: The MIT Press, 2010.

[12] 賀孝梅, 李劍鈺. 人機(jī)交互中認(rèn)知負(fù)荷的成因分析與設(shè)計(jì)策略研究[J]. 包裝工程, 2020, 41(10): 24-30.

HE Xiao-mei, LI Jian-yu. Cause Analysis and Design Strategies of Cognitive Load in Human-computer Interaction[J]. Packaging Engineering, 2020, 41(10): 24-30.

[13] 楊隨先, 劉行, 康慧, 等. 互聯(lián)網(wǎng)+智能設(shè)計(jì)背景下的交互設(shè)計(jì)與體驗(yàn)[J]. 包裝工程, 2019, 40(16): 1-13.

YANG Sui-xian, LIU Xing, KANG Hui, et al. Interactive Design and Experience under the Background of Internet and Intelligent Design[J]. Packaging Engineering, 2019, 40(16): 1-13.

[14] 陳蒼, 程鯤, 王文軍. 表情符號(hào)在語(yǔ)音交互錯(cuò)誤反饋中的作用研究[J].包裝工程, 2021, 42(18): 159-164.

CHEN Cang, CHENG Kun, WANG Wen-jun. The Role of Emojis in Voice Interaction Error Feedback[J]. Packa-ging Engineering, 2021, 42(18): 159-164.

[15] BRAUN M, MAINZ A, CHADOWITZ R, et al. At Your Service: Designing Voice Assistant Personalities to Improve Automotive User Interfaces[C]. New York: The 2019 CHI Conference, 2019.

[16] 譚浩, 孫家豪, 關(guān)岱松, 等. 智能汽車(chē)人機(jī)交互發(fā)展趨勢(shì)研究[J]. 包裝工程, 2019, 40(20): 43-53.

TAN Hao, SUN Jia-hao, GUAN Dai-song, et al. Development Trend of Human-Computer Interaction in Intelligent Vehicles[J]. Packaging Engineering, 2019, 40(20): 43-53.

In-Vehicle Voice Interaction Model and Design Strategies

WU Yan-xi, YANG Sui-xian, LIU Xing

(School of Mechanical Engineering, Sichuan University, Chengdu 610065, China)

Under the background of rapid development of intelligent technology and the continuous growth of user requirement, this paper targets to focus on user experience and explore the new form of in-vehicle voice interaction with the "new four modernizations" trend of automotive industry. Also, it aims to reconstruct the in-vehicle voice interaction model and put forward the targeted design strategies. At the first, it discussed the process of information communication between the in-vehicle voice system and user, and proposed the in-vehicle voice interface structure and interaction model. After that, the changes of in-vehicle voice interaction in information subject, range and content under "new four modernizations" trend are summarized, and the in-vehicle voice interaction model as well as design strategies are studied with information processing theory. According to the procedure of information processing in the in-vehicle voice system, the in-vehicle voice interface composed of function layer, content layer, form layer and emotion layer is suggested. And then, models of in-vehicle voice interaction based on information exchanging are constructed. Finally, basing on the theory of voice interface information structure, the strategies of in-vehicle voice interaction design in the future are presented in terms of function expansion, content enrichment, form optimization, and emotion satisfaction. The research of in-vehicle voice interaction design from the perspective of information exchanging is of reference significance to the interaction design and user experience optimization of in-vehicle voice system.

in-vehicle voice interaction; voice interface; interaction model; design strategy

TB472

1001-3563(2022)10-0073-07

10.19554/j.cnki.1001-3563.2022.10.008

2021-12-11

四川省高校哲學(xué)社會(huì)科學(xué)重點(diǎn)研究基地工業(yè)設(shè)計(jì)產(chǎn)業(yè)研究中心課題（GYSJ2021-006）

吳彥希（1997—），女，碩士生，主攻交互設(shè)計(jì)。

楊隨先（1965—），男，博士，教授，主要研究方向?yàn)楫a(chǎn)品設(shè)計(jì)理論、工業(yè)設(shè)計(jì)。

責(zé)任編輯：馬夢(mèng)遙

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

汽車(chē)語(yǔ)音交互模型及設(shè)計(jì)策略

1 汽車(chē)語(yǔ)音交互中的信息交流

1.1 車(chē)載語(yǔ)音系統(tǒng)中的信息傳遞

1.2 用戶認(rèn)知與用戶體驗(yàn)的形成

2 汽車(chē)語(yǔ)音交互模型構(gòu)建

2.1 汽車(chē)語(yǔ)音界面架構(gòu)

2.2 汽車(chē)語(yǔ)音交互模型

3 汽車(chē)語(yǔ)音交互設(shè)計(jì)策略

3.1 面向功能層的設(shè)計(jì)策略

3.2 面向內(nèi)容層的設(shè)計(jì)策略

3.3 面向形式層的設(shè)計(jì)策略

3.4 面向情感層的設(shè)計(jì)策略

4 結(jié)語(yǔ)