国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文本聊天機器人對話回復策略研究

2020-11-30 09:02:22譚孟華潘曉彥
軟件 2020年9期
關(guān)鍵詞:人工智能

譚孟華 潘曉彥

摘? 要: 探究以用戶為中心的聊天機器人對話回復策略。通過設(shè)計思維中的用戶體驗方式,運用發(fā)散-收斂的聚類分析方式分析6款聊天機器人的對話策略,從解決問題層面和人工智能層面針對30個問題進行測試和打分,并評估6款聊天機器人面對6類問題的回答,計算其均值并分析數(shù)據(jù)?;谌喚垲惡筇崛〉?9條優(yōu)秀的回復策略和12條差勁的回復策略,提出在日常表達層面、情感化層面的以用戶為中心的對話回復策略,提出機器人在日常對話中應該避免的關(guān)鍵點,如避免機器人和用戶聊天時的自娛自樂和答非所問等。從用戶角度規(guī)范機器人的對答回復策略并探究可能的改進方向,為未來聊天機器人對話回復準則的建立了基礎(chǔ)。

關(guān)鍵詞: 人工智能;聊天機器人;以用戶為中心;對話回復

中圖分類號: TP18? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2020.09.014

本文著錄格式:譚孟華,潘曉彥. 文本聊天機器人對話回復策略研究[J]. 軟件,2020,41(09):5155

【Abstract】: Explore a user-centered chatbot conversation response strategy. Based on the user experience in design thinking, this paper analyzes the dialogue strategies of 6 chat robots by using the divergence convergence clustering analysis method, then test and score 30 problems from the problem-solving level and artificial intelligence level, and evaluates the answers of 6 chat robots from 6 kinds of questions. Based on the 3 rounds clustering of 19 excellent recovery strategies and 12 poor recovery strategies, puts forward the user-centered dialogue reply strategy in the daily expression level and emotional level, as well as the key points that the robot should avoid in the daily conversation, such as avoiding self-entertainment and non-answers. From the user's point of view, this paper standardizes the robot' reply strategy and explores the possible improvement direction, which establishes the basis for the future chat robots reply rule.

【Key words】: Artificial intelligence; Chat robot; User-centric; Conversation reply

0? 引言

近年來,針對人工智能的研究尤為重要,人工智能技術(shù)在醫(yī)療、交通、環(huán)境等領(lǐng)域?qū)崿F(xiàn)飛速的發(fā)展,可以預見的是人工智能未來會對各領(lǐng)域產(chǎn)生巨大的革新和變革。尤其是在自然語言處理(Natural Language Processing,NLP)領(lǐng)域,NLP現(xiàn)在已經(jīng)被預測為人工智能(Artificial Intelligence,AI)應用程序最重要的技能。在日漸重視用戶的今天,用戶體驗在AI中的表現(xiàn)也被日漸重視。然而現(xiàn)階段聊天機器人問答系統(tǒng)的回答在表達、思想和理解層面都有所欠缺。因此,本文運用聚類分析的用戶體驗方法,研究聊天機器人對話回復策略如何設(shè)定才能夠有效提升用戶體驗。通過對八款人工智能聊天機器人提問相同的30個問題(問題來自6個維度),并記錄他們的對話回復,分析他們的回復并進行打分和評估,從用戶體驗角度探究“優(yōu)秀的”和“差勁的”對話回復策略的表現(xiàn)形式,分析他們出現(xiàn)的原因,改進文本聊天機器人的用戶體驗。

1? 研究背景

聊天機器人作為NLP領(lǐng)域的重要組成部分,它可以為用戶提供框架性的即時消息傳遞服務(wù),也可以為用戶提供快速的機器會話服務(wù),解決用戶工作和生活中的問題。本文基于純文本的聊天機器人研究,相比于復雜的聊天機器人,用戶和簡單的文本機器人聊天產(chǎn)生的負面影響較小,較難對用戶造成強烈的心理、生理反應[1]。因此基于文本聊天機器人的研究,能夠在影響因素較小的情況下,較好地研究用戶對機器不同回答的不同感受,更好地研究聊天機器人回答策略。

2? 相關(guān)研究

2.1? 聊天機器人

最早的聊天機器人可以追溯到1966年。麻省理工學院的Joseph Weizenbaum開發(fā)了一款可以在臨床治療中模仿心理醫(yī)生的聊天機器人。經(jīng)過60多年的發(fā)展,聊天機器人的功能設(shè)計在不斷被重視。除了針對聊天機器人技術(shù)的研究,幾十年來,聊天機器人的圖形界面研究主要被應用在個人助理和公司服務(wù)中,如蘋果Siri和亞馬遜Alexa研發(fā)的個人助理等。

21世紀以來,人機交互開始關(guān)注人的感受,注重使機器適應人而不是人適應機器[2]。雖然近幾年,人機交互領(lǐng)域研究轉(zhuǎn)向了通過字符串交流的自然語言用戶界面[3],但是文本聊天機器人作為人機交互(Human– Computer Interaction,HCI)領(lǐng)域的基礎(chǔ)研究,針對它的研究仍然具有必要性。因此,本文將基于以用戶為中心的聊天機器人,研究如何基于對話回復策略,提升用戶的體驗。

2.2? 以用戶為中心的聊天機器人

現(xiàn)階段以用戶為中心的聊天機器人研究,主要分為用戶體驗因素研究、人機交互方式研究和聊天機器人設(shè)計三類。用戶體驗的研究方法也可以應用在AI的聊天機器人研究中。

用戶體驗因素研究指針對機器人不同表現(xiàn)形式的研究。通過針對某一聊天機器人某一變量的實驗設(shè)計,運用訪談、問卷等定性定量相結(jié)合的用戶研究方式調(diào)查用戶,探究其不同表現(xiàn)形式對用戶滿意度的影響,進而提升聊天機器人的用戶體驗。人機交互方式研究主要聚焦人與機器的交互方式。聊天機器人設(shè)計更多地側(cè)重于具體應用場景的機器人設(shè)計,如Cameron等人在醫(yī)療領(lǐng)域研發(fā)了可以幫助維持心理健康、在線學習、閱讀心理健康相關(guān)書籍的聊天機器人[4]。現(xiàn)階段針對聊天機器人對話回復的研究較少,因此本研究將基于聊天機器人對話回復進行。

2.3? 聊天機器人的對話回復

如何設(shè)計基于用戶問題的聊天機器人的回復是十分重要的。但是現(xiàn)階段針對聊天機器人對話回復研究集中在單一的因素,如Fang研究對話對吸引力的影響[5],缺少針對策略的研究,且聊天機器人對用戶回復的好壞影響用戶體驗,因此本文最終落腳于以用戶為中心的文本聊天對話策略研究。

同時,在針對聊天機器人的可用性研究整理中,Ren等人曾采用系統(tǒng)制圖的可用性研究方式,整理170條引文和19篇文章,度量聊天機器人的用戶體驗情況[6]。然而,在聊天機器人對話回復相關(guān)研究中,還沒有發(fā)現(xiàn)運用設(shè)計思維方法的研究。設(shè)計思維是一個由可行性、可取性和可用性三個重疊的空間組成的系統(tǒng)思考方式[7-8],發(fā)散-收斂作為設(shè)計思維的方法之一,發(fā)散有助于產(chǎn)生更多靈感,收斂有助于聚焦某一問題,一個有效的設(shè)計思維過程也需要有發(fā)散和收斂兩種模式。由于目前還沒有運用發(fā)散-收斂式的聚類分析方法來解決人工智能領(lǐng)域問題的相關(guān)研究,因此,本研究計劃運用設(shè)計思維中的聚類分析方法,研究以用戶為中心的聊天機器人對話回復策略。

3? 研究設(shè)定

3.1? 研究對象

基于六款文本聊天機器人,分別為小冰機器人、小度機器人、小明機器人、小影機器人、小i機器人、trio機器人。六款聊天機器人的應用涉及個性對話、智能聊天、開放域?qū)υ?、情感聊天、專業(yè)服務(wù)和企業(yè)服務(wù)等。小冰機器人是微軟于2014年在中國推出的一款個性化聊天機器人[9],小度機器人是由百度于2014年研發(fā)的智能聊天機器人,小明機器人是由字節(jié)跳動研發(fā)的專業(yè)服務(wù)聊天機器人,小影機器人是由竹間智能科技公司研發(fā)的一款情感聊天機器人,小i機器人是由智臻智能科技公司研發(fā)的企業(yè)服務(wù)機器人,Trio機器人是由三角獸科技公司推出的開放域?qū)υ捔奶鞕C器人。通過對不同應用的聊天機器人進行測試,能夠全面地測試現(xiàn)階段聊天機器人的應用水平,了解其現(xiàn)階段用戶體驗情況。

本研究使用六款聊天機器人的微信公眾號作為測試平臺。微信公眾號能為聊天機器人提供第三方平臺服務(wù),并能為Chatbot開發(fā)者和運營商保護數(shù)據(jù)隱私,相比購買聊天機器人實體進行測試,微信公眾號具有便捷方便、成本低的特點。其中,小冰機器人、trio機器人、小明機器人、小影機器人和小i機器人在各自的微信公眾號進行測試,小度機器人由于微信接口暫時停用,故使用接入了小度機器人接口的trio001微信公眾號平臺進行測試。

3.2? 研究設(shè)計

研究問題的設(shè)定選擇參考了由中國電子標準化研究院和中國電子音箱行業(yè)協(xié)會頒布的《消費電子產(chǎn)品智能音箱評測及標準化研究報告》[10],最終選定6個維度,30個問題進行測試(見圖1)。日常生活對話問題和助手類問題主要考察機器人解決日常生活的能力,如是否能解答用戶的天氣問題和交通問題,擔任用戶的生活管家,滿足用戶生活中的日?;拘枨蟮?。模糊檢測和智能推薦則研究聊天機器人是否聰明,如在歌手和歌手的歌曲不相對應的時候機器人能否反應過來,能否及時修改用戶的問題并理解用戶真實的需求等。

評分設(shè)定主要關(guān)注解決問題和人工智能兩個層面。按照程度不同將它們劃分為四個等級,并按照1分到4分,從低到高給它們進行評分。在解決問題層面中,劃分標準為是否有效解決用戶問題。1分為解決不了問題,并回答錯誤;2分為解決不了問題,但推薦其它功能;3分為引導用戶換種問法解決問題;4分為有效解決問題。在人工智能層面,劃分標準為回答是否親切和擬人。1分為回答干巴;2分為回答親切;3分為回答擬人不親切;4分為回答親切且擬人。綜合評分為解決問題層面和人工智能層面的評分均值。

針對打分策略,例如歌手歌曲名稱正確但是不相互對應的模糊檢測問題“播放林俊杰的《來自天堂的魔鬼》”,小冰機器人第一次回答“目前沒找到哎,別急,回頭一找到就告訴你”,第二次回答“哪里?咳咳,要不咱換首別的吧←(其實是沒找到這首)”,第三次回答“這首歌可不好找啊,以后找到了告訴你[心]”。綜合評價小冰機器人的三次回答,從解決問題層面來看,由于這個問題本身就沒有正確答案,《來自天堂的魔鬼》是歌手鄧紫棋所唱,并不是林俊杰所唱,因此小冰回答“沒找到這首歌”是沒有錯誤的,所以小冰回答有效解決了問題,且暗示可能是因為用戶的問法不對,繼而導致沒找到歌曲。因此綜合三次回答,解決問題層面評分為4分。從人工智能層面來看,小冰的回答運用 “哎”、“咳咳”等多種擬聲詞,使回答更具親和力,且小冰在知道自己無法很好地解決問題的時候,通過“要不咱換首別的吧”、“別急”等詞語轉(zhuǎn)移用戶注意力,調(diào)節(jié)用戶情緒,具有較高的擬人化傾向,故人工智能層面評分為4分。小冰機器人在該問題的綜合評分為均值4。

3.3? 研究步驟

詳細的研究步驟見圖2。通過給六款人工智能聊天機器人發(fā)送三次同樣的問題,記錄同樣問題下機器人的對話回答,依照評分標準對其進行打分,并將分數(shù)進行匯總統(tǒng)計,計算其綜合平均值并分析數(shù)據(jù),生成以用戶為中心的聊天機器人的對話策略。

例如,在針對“星座運勢”的問題中, 給六款聊天機器人同時發(fā)送“處女座今天的運勢?”這個問題,不同聊天機器人有不同的回復策略,6種聊天機器人對話回復見圖3。

結(jié)合人工智能層面評分和解決問題層面評分,本研究在分析數(shù)據(jù)的過程中,運用聚類分析歸納總結(jié)得分高和得分低的對話特征,通過三輪聚類,針對聊天機器人對話中“優(yōu)秀的點”和“差勁的點”,總結(jié)其規(guī)律,得出以用戶為中心的文本聊天機器人對話回復策略。

4? 研究分析和結(jié)果

4.1? 研究分析

六款聊天機器人的評分如下(見表1)。

基于評分對機器人對話進行三輪聚類分析。第一輪聚類分析是將每個問題中綜合評分最高和綜合評分最低的聊天機器人回復全部分別歸納總結(jié),將其“優(yōu)秀的點”和 “差勁的點”的原因通過定性的方式分別總結(jié),分析綜合評分高的“優(yōu)秀的點”和綜合評分低的“差勁的點。歸納過程中注意查漏補缺,確保已經(jīng)總結(jié)過規(guī)律的點,不再總結(jié)第二遍,沒有總結(jié)過的規(guī)律,則將其補上,直到再也無法發(fā)現(xiàn)新的“優(yōu)秀的點”和“差勁的點”為止。

例如,助手問題中的提醒問題為“提醒我15分鐘后摘面膜”和取消提醒問題的“不要提醒我了”。針對“優(yōu)秀的點”,小冰機器人的回答是“歐啦~我會在2019年6月26日 18點41分提醒你:摘面膜”和“3、2、1……成功刪除(·ω·)?”,得分4分。經(jīng)過分析,小冰機器人高分原因有:第一,賣萌。通過顏文字形式的賣萌方式,增加用戶對小冰機器人的好感度,提升用戶和聊天機器人對話溝通的體驗。第二,有代入感且口語化。借助“歐拉”“3、2、1”等擬聲詞,營造人與人溝通中的口語化情境氛圍,增添親和力。第三,識別了問題且擬人化抒發(fā)了感情。小冰機器人準確識別用戶需求,并給予準確時間點反饋,有效解決用戶需求。針對“差勁的點”,小明機器人的回答是“她跪地40分鐘,膝蓋破了都不顧,就為…這是我見過最美的傷疤!”和“國家貨運平臺第一時間向震區(qū)貨車司機發(fā)送提醒”,得分1分。經(jīng)過分析,小明機器人低分原因有:第一,答非所問。小明機器人的回答不僅沒有解決用戶的提醒需求,且提供了跟用戶期待完全相反的回答,十分影響用戶體驗。第二,給用戶不想要的幫助。用戶跟小明機器人聊天是希望得到提醒服務(wù),而小明機器人提供了新聞服務(wù),與用戶期待不相關(guān)。因此,在第一輪聚類分析中,將“賣萌”“有代入感且口語化”和“識別了問題且擬人化抒發(fā)了感情”放入“優(yōu)秀的點”,將“答非所問”和“給用戶不想要的幫助”放入“差勁的點”。其它問題依次類推,最后得出第一輪聚類分析下的“優(yōu)秀的點”和“差勁的點”。

在第二輪聚類分析中,將“優(yōu)秀的點”和“差勁的點”進一步精簡,將長句轉(zhuǎn)變?yōu)槎叹渥印@?,將“有代入感且口語化”拆分為“代入感”和“口語化”,其它長句依次類推。針對不同表達但意思相同的重復長句,取最能概括其主旨的長句并將其簡化。第三輪聚類分析主要是針對簡化過后的短句合并同類項,將第二輪聚類后“優(yōu)秀的點”和“差勁的點”中相似性較高的放進一組,做到組內(nèi)對象相似性較高、組間對象相似性較低,如“口語化”“代入感”“提建議”和“發(fā)相關(guān)(歌曲、新聞)給用戶”同屬于日常表達層面,故將其放入同一類別。第三輪聚類后得到的19條“優(yōu)秀的點”和12條“差勁的點”即為以用戶為中心的對話策略,詳見 圖4。

4.2? 研究結(jié)論

由表2可知,小冰機器人和小影機器人均分最高,達到2.7分,緊隨其后的是小i機器人、小度機器人、trio機器人和小明機器人。除小明機器人得分較低,其它機器人評分差異不大。通過上述分析,以用戶為中心的對話策略應該做到:

(1)在表達層面,要讓人工智能的表達更具口語化,讓用戶有代入感。當聊天機器人遇到難回答問題時,可以給用戶發(fā)一些相關(guān)的歌曲或新聞,轉(zhuǎn)移用戶注意力,通過巧妙地引發(fā)新話題,化解矛盾,提升聊天機器人對話的用戶體驗,使用戶和聊天機器人交互有更好的滿足感。聊天機器人也可以在對話過程中,通過給用戶提一些小建議,例如建議用戶換一種聊天機器人能理解的方式提問,或者換一種話題,提升用戶對聊天機器人的驚喜度。

(2)在情感化層面,賣萌、幽默的回復方式,能提升用戶對聊天機器人的好感。聊天機器人在對話過程中,適當?shù)馁u萌能夠緩解尷尬,使用戶更加喜歡跟聊天機器人聊天。且逗比、幽默的性格,能使用戶愿意持續(xù)跟聊天機器人聊天,也能使用戶更容易原諒和忽視現(xiàn)階段聊天機器人在功能服務(wù)面上的缺陷。如果聊天機器人可以擬人化地抒發(fā)感情、引導用戶與之互動,使用戶體驗到智能化聊天機器人服務(wù),也能提升用戶對聊天機器人的喜愛。聊天機器人也可以在對話中增添部分情感化回復,如使用“親愛的”“愛你”等詞語,拉近和用戶之間的距離。

(3)避免機器人的自娛自樂和答非所問,聊天機器人可以主動引導用戶談?wù)摍C器人熟悉的話題。聊天機器人可以在表達層面拒絕官方話術(shù)和尷尬聊天,避免讓用戶產(chǎn)生距離感。所以避免機器人的自娛自樂,是我們需要關(guān)注的一個問題。其次,在理解層面,聊天機器人首先應該做到不要答非所問和頻繁推送跟用戶需求不相關(guān)的信息。當面對沒有準確回答的問題時,聊天機器人可以跟用戶解釋暫時不知道如何回答這個問題,主動引導用戶開展新的話題,并推薦用戶自己熟練的功能,將用戶的話題引到聊天機器人熟悉的領(lǐng)域中,提升用戶體驗,實現(xiàn)聊天機器人體驗的良性循環(huán)。

5? 結(jié)語

本文運用設(shè)計思維的發(fā)散-收斂法,創(chuàng)新性地研究聊天機器人的對話策略,經(jīng)過三輪聚類提出以用戶為中心的對話策略。由于策略來源于科學的、計劃的評分設(shè)定,且研究過程緊跟機器人對話,依據(jù)三輪聚類分析,研究結(jié)論具有極強的可實踐性和可操作性,可以運用到醫(yī)療、企業(yè)服務(wù)、生活助手等領(lǐng)域的聊天機器人對話回復策略設(shè)計中。通過改進聊天機器人對話回復策略,可以使聊天機器人進一步擬人化,進一步提升用戶和聊天機器人對話過程中的滿意度。

在未來的研究中,可以從評分設(shè)定、打分、評估方面進一步改進對話策略。在評分設(shè)定中,可以增加新的評分指標,從多方角度來評估聊天機器人的對話,在打分環(huán)節(jié),可以邀請更多被試者參與給聊天機器人的打分,通過計算多人的評分均值,降低誤差,使結(jié)論更加趨于穩(wěn)定。在評估方面,可以邀請專家和用戶共同評估,從聊天機器人使用者和聊天機器人生產(chǎn)者兩個角度來改進聊天機器人對話策略。通過優(yōu)化聊天機器人對話策略,并邀請各行各業(yè)專家、機構(gòu)參與評定,在未來可逐漸形成如尼爾森十大交互原則[11]一般的聊天機器人對話策略準則,規(guī)范全球聊天機器人對話回復策略設(shè)計。同樣,未來也可以同醫(yī)療領(lǐng)域相結(jié)合,針對老年人用戶,研發(fā)專業(yè)型、應用型的聊天機器人對話,提供智能醫(yī)療聊天機器人對話服務(wù),滿足他們在疾病治療、健康養(yǎng)生等方面的需求。

參考文獻

[1]Ciechanowski L, Przegalinska A, Magnuski M, & Gloor P. (2019). In the shades of the uncanny valley: An experimental study of human–chatbot interaction. Future Generation Computer Systems, 92, 539-548.

[2]Bullinger H J, Ziegler J, & Bauer W. (2002). Intuitive human-computer interaction-toward a user-friendly information society. International Journal of Human-Computer Interaction, 14(1), 1-23.

[3]F?lstad A, & Brandtz?g P B. (2017). Chatbots and the new world of HCI. interactions, 24(4), 38-42.

[4]Cameron G, Cameron D, Megaw G, Bond R, Mulvenna M, ONeill, S., ... & McTear, M. (2018, July). Best practices for designing chatbots in mental healthcare–A case study on iHelpr. In Proceedings of the 32nd International BCS Human Computer Interaction Conference 32 (pp. 1-5).

[5]Fang H. (2019). Building A User-Centric and Content-Driven Socialbot (Doctoral dissertation).

[6]Ren R, Castro J W, Acu?a S T, & de Lara J. (2019, July). Usability of chatbots: A systematic mapping study. In Proc. 31st Int. Conf. Software Engineering and Knowledge Engineering (pp. 479-484).

[7]Chasanidou D, Gasparini A, & Lee E. (2014, October). Design thinking methods and tools for innovation in multidisciplinary teams. In Workshop Innovation in HCI. Helsinki, Finland: NordiCHI (Vol. 14, No. 2014, pp. 27-30).

[8]Chasanidou, D., Gasparini, A. A., & Lee, E. (2015, August). Design thinking methods and tools for innovation. In International Conference of Design, User Experience, and Usability (pp. 12-23). Springer, Cham.

[9]劉蓉, 陳波. 基于微信公眾平臺的招生咨詢智能聊天機器人[J]. 軟件, 2018, 39(6): 49-57.

[10]消費電子產(chǎn)品智能音箱評測及標準化研究報告[R]. 北京:中國電子技術(shù)標準化研究院, 2018: 1-61.

[11]Nielsen J. (1995). 10 usability heuristics for user interface design. Nielsen Norman Group, 1(1).

猜你喜歡
人工智能
我校新增“人工智能”本科專業(yè)
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業(yè)
基于人工智能的電力系統(tǒng)自動化控制
人工智能,來了
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
泽库县| 梁山县| 神农架林区| 渝北区| 潍坊市| 阿图什市| 东方市| 恩施市| 榆树市| 浠水县| 通河县| 新营市| 黔江区| 石柱| 会泽县| 胶州市| 堆龙德庆县| 岑溪市| 三穗县| 杭锦后旗| 莱西市| 上蔡县| 岑巩县| 察雅县| 绵竹市| 文山县| 临潭县| 得荣县| 潍坊市| 抚宁县| 华亭县| 祥云县| 偃师市| 昌江| 柘荣县| 瑞丽市| 兴化市| 紫金县| 竹北市| 乐东| 曲靖市|