国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人機(jī)語音交互存在的問題研究

2017-04-04 16:43葉子
科技傳播 2017年1期

葉子

摘 要 隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人機(jī)交互形式已經(jīng)發(fā)展到自然交互界面。語音交互就屬于自然交互方式的一種。但是目前來看,人機(jī)語音交互仍存在局限性,并不能算 非常自然的交互方式。本文將以諾曼在《設(shè)計(jì)心理學(xué)》提出的“匹配原則”為出發(fā)點(diǎn),并從“操作層”“功能層”“情感層”幾個方面探討研究目前語音交互中存在的問題。

關(guān)鍵詞 語音交互;自然交互;匹配原則

中圖分類號 TP3 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2017)178-0031-02

1 語音交互發(fā)展概況

隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人和計(jì)算機(jī)的交互已經(jīng)從早期的手工作業(yè)階段、作業(yè)控制語言及交互命令行界面階段(CLI)、圖形用戶界面階段(GUI)、發(fā)展到如今的的自然用戶界面階段(NUI)。自然用戶界面是一種“對用戶隱形計(jì)算機(jī)用戶界面”,即是指用戶可以擺脫傳統(tǒng)的鼠標(biāo)和鍵盤等物理機(jī)器設(shè)置,用最自然的方式與機(jī)器互動。自然交互的概念由此而來。所謂自然交互,關(guān)鍵在于“自然”,它是指在用戶在與產(chǎn)品的交互過程中,能利用自身的固有認(rèn)知和生活行為習(xí)慣以一種非精確的自然行為與產(chǎn)品進(jìn)行溝通交流并能夠被理解的交互方式[ 1 ]。人機(jī)語音交互就是屬于當(dāng)前自然交互的一種,指的是人通過語音的方式與計(jì)算機(jī)進(jìn)行交流互動,來完成自己的任務(wù)。

2011年蘋果公司在iPhone4s中開創(chuàng)了Siri智能語音助手,在全球引發(fā)了語音熱潮,用戶只需要對著手機(jī)的麥克風(fēng)說幾句話,系統(tǒng)就能跳過繁瑣的操作步驟喚起并實(shí)現(xiàn)用戶想要的功能;現(xiàn)如今的智能手機(jī)中都已經(jīng)集成了語音交互功能,例如蘋果手機(jī)的Siri、谷歌在安卓平臺上推出的Google Now、微軟公司的Cortana等。語音交互的價(jià)值也愈發(fā)凸顯,通過聽覺的方式作用于用戶能夠在很大程度上緩解用戶的視覺疲勞,從而降低因?yàn)槠诙l(fā)的誤操作,提高了輸入的效率,讓輸入更加簡單、便捷;對于老人、視覺障礙人士等輸入有困難的群體而言,語音交互幫助他們擺脫了復(fù)雜的鍵盤操作,減少了產(chǎn)品的使用障礙。

語音輸入成為繼鍵盤、鼠標(biāo)之后我們與機(jī)器交流的又一重要方式,并且在聲控命令、操作方式以及人工智能方面均有望產(chǎn)生更大的價(jià)值,但在達(dá)到這個期望階段之前,語音交互仍有一段很長的路要走,就目前而言,語音交互并不能算作是非常自然的一種交互方式,它仍然存在著很多問題。

2 語音交互存在的問題研究

在如何設(shè)計(jì)出好的產(chǎn)品這個問題上,美國設(shè)計(jì)心理學(xué)學(xué)者諾曼(Norman)在他所著的《設(shè)計(jì)心理學(xué)》提出了匹配原則[ 2 ]。他指出匹配是指兩種事物之間的適應(yīng)關(guān)系。他認(rèn)為用戶頭腦中有一個心智模型,產(chǎn)品的設(shè)計(jì)者頭腦中也有一個心智模型,在系統(tǒng)里應(yīng)該讓這兩者盡可能的匹配,從而讓用戶容易學(xué)習(xí)、使用產(chǎn)品,來實(shí)現(xiàn)較高的效率和滿意度。例如,Windows系統(tǒng)桌面上的“回收站”,其外形與現(xiàn)實(shí)生活中的垃圾桶很相似,讓用戶能夠?qū)⒒厥照九c生活中的垃圾桶對比,便能自然地聯(lián)想出回收站是將廢棄的文件丟掉的地方。

在筆者看來,自然匹配就是指在用戶和產(chǎn)品之間有一個明確又良好的映射,用戶在操作產(chǎn)品時可以依據(jù)固有的知識和經(jīng)驗(yàn)?zāi)芎苋菀椎孛靼兹绾问褂卯a(chǎn)品,并且能從操作本身看出它產(chǎn)生的結(jié)果。從某個角度來講就是指操作是否與用戶的心理預(yù)期一致,并且兩者越一致,用戶對產(chǎn)品的滿意度就越高。受諾曼“匹配原則”的啟發(fā),筆者嘗試從心理匹配的角度去分析當(dāng)前人機(jī)語音交互中的一些局限性。并從產(chǎn)品設(shè)計(jì)3個層次“操作層”“功能層”“情感層”來對語音交互目前存在的問題進(jìn)行分析研究。

2.1 操作層匹配

語音交互從誕生之日起就被委以“解放雙手”的重任。但目前來看,語音并沒有十分有效地“解放雙手”,例如蘋果手機(jī)用戶需要長按主屏Home鍵才可以喚起Siri語音助手,在同Siri交流時也需要多次用手進(jìn)行操作。對于“沒有解放雙手”的原因,筆者認(rèn)為,語音交互本質(zhì)上是人和計(jì)算機(jī)的溝通交流,就像我們平常的對話一樣,而這種交流應(yīng)該是沒有屏障的。那么人機(jī)之間存在的界面就是對這種自然對話的違背。雖然都說“語音交互解放了雙手”,但實(shí)際上,界面的存在是不可能完全解放雙手的。

在界面統(tǒng)領(lǐng)一切的計(jì)算機(jī)時代,用戶似乎已經(jīng)習(xí)慣在界面上處理一切事物,但界面旳存在,實(shí)際上大大阻礙了人機(jī)交互的通暢,因?yàn)榻缑娌⒉淮砣蝿?wù)本身。在現(xiàn)實(shí)的人機(jī)交互情境中,人們迫于壓力和約束,又必須把自己的某一部分心智和精力,放到各種復(fù)雜的界面識別和操作當(dāng)中,人的思維、情緒很容易被一個沒有任何變化任何起伏的設(shè)備所打斷,從而有可能損耗互動效率。就語音發(fā)展的長遠(yuǎn)性來看,要想真正徹底地解放雙手,必須盡量降低我們在使用語音功能時對界面的依賴程度。

2.2 功能層匹配

雖然Siri引爆了語音市場,語音識別系統(tǒng)進(jìn)入商品化階段,但是就目前的發(fā)展水平看,還遠(yuǎn)沒有達(dá)到人類與機(jī)器自然交流的終極目標(biāo)。語音識別的精確度不高是制約語音交互發(fā)展的最大障礙之一。而語音識別技術(shù)是解決人機(jī)語音交互問題的關(guān)鍵核心技術(shù)之一,雖然取得了一定的發(fā)展,但仍有很多問題亟待解決。目前語音識別面臨的技術(shù)難點(diǎn)主要包括:1)語音中語法語義規(guī)則的建立和理解很困難,尤其對于中文一詞多意的語言來說更為困難;2)方言、口音嚴(yán)重影響語音的正確識別;3)字母、單詞等發(fā)音很容易受到上下文環(huán)境的影響,音調(diào)、因素、重音等可能都會有很大的差別;4)環(huán)境噪聲和干擾童顏能夠嚴(yán)重影響語音的識別率;5)對于情感識別而言,語言中的情感過于微妙,就目前技術(shù)來說,想要識別是有點(diǎn)不切實(shí)際的[ 3 ]。

語音識別精確度不高,就會妨礙用戶去完成任務(wù),甚至?xí)?dǎo)致哭笑不得的結(jié)果。例如微博上曾經(jīng)的有一條熱門就是山東大漢在開車時與智能車載語音對話,因語音技術(shù)對方言或口音的識別能力不佳,而導(dǎo)致車載系統(tǒng)對山東大漢所報(bào)的電話號碼數(shù)字一直識別不了而鬧出了一些笑話。在面對這種不能避免的錯誤的情況時,系統(tǒng)應(yīng)該提供相應(yīng)的錯誤機(jī)制,提醒用戶切換方式,避免用戶反復(fù)進(jìn)行自己的操作而不能完成任務(wù)。而當(dāng)前大多數(shù)語音交互系統(tǒng)錯誤操作的應(yīng)對能力并不好,而且系統(tǒng)反饋不佳,導(dǎo)致用戶很容易對產(chǎn)品喪失信心。因此,在人機(jī)交互時,語音系統(tǒng)應(yīng)該及時向用戶提供反饋,讓用戶知道某一操作是否已經(jīng)完成以及操作所產(chǎn)生的結(jié)果;在面對用戶的誤操作時,也要有相應(yīng)的錯誤機(jī)制幫助用戶了解發(fā)生的錯誤。例如用戶在進(jìn)行語音輸入時,被外部環(huán)境突然打斷,系統(tǒng)就應(yīng)該在被打斷時有相應(yīng)的錯誤機(jī)制,當(dāng)用戶下次重新錄入時,系統(tǒng)應(yīng)該保存了之前的輸入;或者如果不能有這樣的保存,也應(yīng)該有所反饋,提醒用戶上次的輸入曾被打斷,并表示如果要繼續(xù),請重新開始。

2.3 情感層匹配

語音交互的操作層匹配和功能層匹配都不是特別好,可想而知其情感層面的匹配性也不好。情感層的設(shè)計(jì)關(guān)注的是產(chǎn)品是否滿足了人們的感性心理需求。人機(jī)交互設(shè)計(jì)不僅是交互界面、功能模塊、操作方式等的“有形”設(shè)計(jì),同時也是涉及到人的知覺、態(tài)度以及情感等的“無形”的設(shè)計(jì)?!坝行巍钡脑O(shè)計(jì)是基礎(chǔ),“無形”的設(shè)計(jì)是用戶感到滿意的關(guān)鍵所在,只有“有形”和“無形”之間相當(dāng)?shù)钠鹾喜拍軐?shí)現(xiàn)高質(zhì)量的人機(jī)交互[ 4 ]。人機(jī)語音交互亦是如此。只有在操作層面、功能層面滿足了用戶的期望,并到達(dá)情感層后,用戶才會在產(chǎn)品易用、高效基礎(chǔ)上覺得很有趣,進(jìn)而把自己的情感投射到產(chǎn)品中。只有在產(chǎn)品和用戶之間建立起了情感的紐帶,產(chǎn)品的價(jià)值才會得以體現(xiàn)。

例如,2014年科幻電影《她》中主人公就因?yàn)槁曇魫凵狭瞬僮飨到y(tǒng),而聲音的表演者斯嘉麗也僅憑聲音摘得影后桂冠。在一切智能自然化的未來社會中(即一切都滿足“自然匹配”),這種情況是有可能發(fā)生的。我們不去探討這種情況可能引發(fā)的“計(jì)算機(jī)恐慌”,僅就軟件系統(tǒng)而言,逼真的、無時不在、知曉一切的智能語音操作系統(tǒng)確實(shí)讓使用者產(chǎn)生了共鳴,并使其漸漸產(chǎn)生感情。也就是說,包括語音交互在內(nèi)的人機(jī)交互設(shè)計(jì)應(yīng)當(dāng)追求的終極理想是,使用戶高效、準(zhǔn)確地完成目標(biāo)后,還能給用戶帶來心靈上的愉悅和共鳴,滿足其情感性需求,使產(chǎn)品的價(jià)值得以彰顯。

3 結(jié)論

綜上所述,目前的語音交互確實(shí)存在很多“不自然”的問題。筆者以諾曼的“匹配原則”為出發(fā)點(diǎn),從操作層、功能層、情感層3個維度分析了當(dāng)前語音交互的局限性。根據(jù)前面的分析,我們可以嘗試通過減少界面操作(取消界面)、提升語音識別技術(shù)、提供錯誤機(jī)制和反饋機(jī)制等幾個方面來提升語音交互的各方面體驗(yàn)。雖然目前的語音交互仍存在很多問題,但毋庸置疑的是語音一定會有一個良好的發(fā)展前景,隨著技術(shù)的提升,未來的智能語音人機(jī)交互將會像電影《她》所展現(xiàn)的那樣給人類帶來全新的智能生活方式。

參考文獻(xiàn)

[1]孫傳祥.基于自然交互方式的移動終端產(chǎn)品交互設(shè)計(jì)研究[D].濟(jì)南:山東大學(xué),2012.

[2]唐納德·諾曼.設(shè)計(jì)心理學(xué)[M].北京:中信出版社,2003.

[3]袁彬,肖波,侯玉華,等.移動智能終端語音交互技術(shù)現(xiàn)狀及發(fā)展趨勢[J].信息通信技術(shù),2014(2):39-43.

[4]程彬,趙宏梅.匹配原則在人機(jī)交互設(shè)計(jì)上的應(yīng)用探討[J].包裝工程,2008,29(11):125-127.

泽普县| 新津县| 区。| 观塘区| 潞西市| 新昌县| 鞍山市| 小金县| 阿坝| 光山县| 志丹县| 台安县| 开江县| 前郭尔| 万年县| 峨边| 旬邑县| 台中市| 屯门区| 容城县| 丰镇市| 平山县| 青龙| 玛曲县| 綦江县| 会泽县| 湖口县| 武安市| 朝阳市| 宜君县| 汶上县| 和硕县| 博罗县| 梁河县| 陈巴尔虎旗| 黄骅市| 柳州市| 曲松县| 南华县| 白沙| 锦屏县|