孔祥杰,劉玉慶,安 明,劉 相,胡福超,張 喆
(1.中國航天員科研訓(xùn)練中心人因工程國防科技重點(diǎn)實(shí)驗(yàn)室,北京100094;2.中國航天員科研訓(xùn)練中心,北京100094)
體驗(yàn)質(zhì)量是指用戶對于系統(tǒng)或應(yīng)用喜歡或者厭惡的程度,取決于應(yīng)用或服務(wù)實(shí)現(xiàn)用戶期望的程度,并受到用戶個性和當(dāng)前狀態(tài)的影響。體驗(yàn)質(zhì)量受到系統(tǒng)因素、環(huán)境因素和用戶因素3個方面因素的綜合影響[1]。
目前,體驗(yàn)質(zhì)量的研究主要在音頻、視頻等領(lǐng)域,且已經(jīng)建立了一些評價(jià)的標(biāo)準(zhǔn)或框架,如ITU-T提出的PSQM[2]和PESQ[3]方法;ITU-R提出的DSCQS[4]方法,思科及IneoQuest技術(shù)公司提出的MDI指標(biāo)[5]。在立體圖像、視頻體驗(yàn)質(zhì)量評價(jià)方面,齊峰等從雙眼感知一致性特征來展開對體驗(yàn)質(zhì)量的評價(jià)[6];Kazuhisa等通過視頻質(zhì)量、深度質(zhì)量、不適和疲勞等指標(biāo)來評價(jià)3D視頻的體驗(yàn)質(zhì)量[7]。關(guān)于虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)這種新媒體的體驗(yàn)質(zhì)量,已經(jīng)有了少量的研究,以主觀評價(jià)為主要手段[8-9]。
虛擬現(xiàn)實(shí)技術(shù)已經(jīng)被應(yīng)用于各國航天員訓(xùn)練之中,為了滿足航天員在多艙段空間站內(nèi)導(dǎo)航訓(xùn)練和操作訓(xùn)練任務(wù)不斷多樣化的需求,中國航天員科研訓(xùn)練中心也開發(fā)了一套虛擬現(xiàn)實(shí)仿真訓(xùn)練系統(tǒng)[10],為航天員的訓(xùn)練帶來了新的體驗(yàn)和超越傳統(tǒng)地面模擬設(shè)備的可能性。但是,系統(tǒng)開發(fā)人員往往只關(guān)注系統(tǒng)功能的實(shí)現(xiàn),而忽略了用戶的使用感受。本文以體驗(yàn)質(zhì)量為目標(biāo),從用戶的角度對航天員虛擬訓(xùn)練系統(tǒng)展開主觀評價(jià),以發(fā)現(xiàn)系統(tǒng)中可能存在的影響體驗(yàn)質(zhì)量的問題。
用戶體驗(yàn)質(zhì)量強(qiáng)調(diào)對用戶體驗(yàn)?zāi)稠?xiàng)產(chǎn)品結(jié)果的關(guān)注,為了充分和全面地了解用戶在使用虛擬訓(xùn)練系統(tǒng)過程中的實(shí)際感受和滿意程度,從而給出系統(tǒng)優(yōu)化的合理化建議,需要建立全面合理的評價(jià)指標(biāo)體系。
本文首先制定體驗(yàn)質(zhì)量的評價(jià)策略,然后在這些策略的指導(dǎo)下,完成評價(jià)指標(biāo)體系的設(shè)計(jì)。本文將策略歸納為三點(diǎn):關(guān)注用戶需求、強(qiáng)化系統(tǒng)特性和重視情感體驗(yàn)。
關(guān)注用戶需求是指用戶對產(chǎn)品的需求是一個由工具實(shí)體向精神追求的拓展、由物質(zhì)到精神的過程,對于不同的系統(tǒng),用戶的需求可能是實(shí)用性,或者享樂性,在制定評價(jià)指標(biāo)時應(yīng)該區(qū)別對待;強(qiáng)化系統(tǒng)特性則是指評價(jià)指標(biāo)要重點(diǎn)關(guān)注系統(tǒng)本身的特異性,在評價(jià)過程中重點(diǎn)圍繞實(shí)現(xiàn)用戶需求設(shè)計(jì)評價(jià)指標(biāo),弱化和用戶需求關(guān)聯(lián)弱的系統(tǒng)特性。最后一個策略是重視情感體驗(yàn),在產(chǎn)品功能滿足用戶需求的情況下,操作是否直觀易學(xué)、人機(jī)界面是否易于理解等都會影響用戶的情感體驗(yàn),充分重視細(xì)節(jié)和人文關(guān)懷能夠帶給用戶強(qiáng)烈的情感認(rèn)同,在很大程度上影響體驗(yàn)質(zhì)量[11-12]。
這三個策略重點(diǎn)考慮了系統(tǒng)和用戶這兩個體驗(yàn)質(zhì)量的影響因素,而對于特定的應(yīng)用系統(tǒng)和用戶,其使用環(huán)境在很大程度上也就被確定了下來,所以基于這三個策略設(shè)計(jì)評價(jià)指標(biāo)能夠保證指標(biāo)的科學(xué)性和完備性。
本文結(jié)合虛擬訓(xùn)練系統(tǒng)的特征和虛擬現(xiàn)實(shí)應(yīng)用體驗(yàn)質(zhì)量評價(jià)策略,設(shè)計(jì)了航天員虛擬訓(xùn)練系統(tǒng)體驗(yàn)質(zhì)量評價(jià)指標(biāo),包括任務(wù)負(fù)荷、界面可用性、臨場感、副作用和有用性5個指標(biāo),如圖1。針對每一個指標(biāo),采用一套問卷來給出評價(jià),為了使結(jié)果更加可靠,盡量采用標(biāo)準(zhǔn)化問卷或者根據(jù)實(shí)際情況對標(biāo)準(zhǔn)化問卷做出修訂,并保證修訂后問卷的信度。各指標(biāo)的設(shè)計(jì)依據(jù)和參數(shù)獲取方法如下:
任務(wù)負(fù)荷:任務(wù)負(fù)荷是基于用戶需求和系統(tǒng)特性設(shè)計(jì)的指標(biāo)。從用戶角度來說,用戶希望以盡量輕松的方式完成訓(xùn)練任務(wù)并掌握相關(guān)技能;而從系統(tǒng)角度來說,作為一套輔助技能獲取的系統(tǒng),必須要設(shè)定合理的訓(xùn)練方法和任務(wù)難度。對于相同的任務(wù),不同的訓(xùn)練方法可能導(dǎo)致明顯的績效差異[13],而對于用戶來說,這就意味著不同的任務(wù)負(fù)荷,所以需要對任務(wù)負(fù)荷進(jìn)行評估;任務(wù)負(fù)荷采用NASA-TLX量表[14]進(jìn)行評估,該量表由腦力需求、體力需求、時間需求、業(yè)績水平、努力程度、受挫程度6個維度構(gòu)成,每個維度均為100分,受試者通過在數(shù)軸上做標(biāo)記來打分,各維度的權(quán)重基于受試者對這些維度的重要性兩兩比較的結(jié)果進(jìn)行計(jì)算,本文使用了Sharek開發(fā)的一套可以在線評分的NASA-TLX應(yīng)用[15]。
界面可用性:可用性指系統(tǒng)在易學(xué)、易用和界面信息等方面的屬性,是用戶對系統(tǒng)的基本需求。界面可用性采用基于整體評估可用性問卷(Post-study System Usability Questionnaire,PSSUQ)問卷第3版[16]修訂而來問卷進(jìn)行測量,PSSUQ信息簡明,分?jǐn)?shù)計(jì)算方便,該問卷為7點(diǎn)制量表,包含16個項(xiàng)目,分為3個子量表:系統(tǒng)質(zhì)量、信息質(zhì)量和界面質(zhì)量,3個分量表信度分別為0.9,0.91和0.83,整體問卷信度為0.94。根據(jù)Lewis的研究,完整的和不完整的PSSUQ問卷均值差異很小[17],對于其3個子量表,問卷結(jié)果的完整性既沒有顯著的主效應(yīng),也沒有顯著的交互效應(yīng),也就是說,只采用原問卷中的部分問題,對最終結(jié)果不會產(chǎn)生顯著的影響。因此,本文刪除了原問卷中對航天員虛擬訓(xùn)練系統(tǒng)意義不大的題項(xiàng),并增加了一項(xiàng)系統(tǒng)信息一致性的問題(Q6),最終形成了一份包含10個問題的界面可用性問卷,為了和其它問卷保持一致,將原問卷修改為5點(diǎn)量表,1到5分代表從完全不同意到完全同意。采用Cronbach′s Alpha系數(shù)法對修訂問卷進(jìn)行信度測量,問卷整體信度α=0.85,Landauer的研究指出,問卷測量信度在0.7~0.8是可接受的[18],可見修訂后的問卷仍然保持較高的信度。修訂后的問卷,仍然包括系統(tǒng)質(zhì)量、信息質(zhì)量和交互界面質(zhì)量3個子量表,各子量表分值為該量表各項(xiàng)評分的算術(shù)平均值,界面可用性分值為1~10題得分的算術(shù)平均值。
臨場感:臨場感是虛擬現(xiàn)實(shí)技術(shù)最重要的特征之一,臨場感一方面可以評價(jià)虛擬表現(xiàn)水平,另一方面,良好的臨場感意味著受訓(xùn)者感覺自己置身于系統(tǒng)構(gòu)建的虛擬環(huán)境中,那么用戶在實(shí)際任務(wù)中的表現(xiàn)將會更好[19]。臨場感問卷基于PQ問卷[20]修訂而來,原問卷包含32項(xiàng)問題,Witmer等在論文中指出,其中3項(xiàng)有降低問卷信度的趨勢而被棄用,結(jié)合航天員虛擬訓(xùn)練系統(tǒng)特異性,進(jìn)一步對問卷項(xiàng)目做了篩選,最終,臨場感問卷包括22項(xiàng)問題。采用Cronbach′s Alpha系數(shù)法測量修訂后問卷信度為0.905,可見修訂后問卷可靠性較高。根據(jù)Witmer等人的研究,PQ問卷因子結(jié)構(gòu)包括4個因子:參與感、適應(yīng)性、感官逼真度和虛擬界面質(zhì)量,取各因子對應(yīng)問題的算術(shù)均值作為該因子得分,所有問題均值作為臨場感評分(PQ)。
有用性:有用性問卷共包含6個問題,可以歸結(jié)為實(shí)用性和享樂2個方面,有用性分值為各題得分的算術(shù)平均值。其中實(shí)用性是受訓(xùn)者最基本也是最重要的需求,愉悅感則可視為是對用戶情感體驗(yàn)的評價(jià)。有用性問卷基于航天員訓(xùn)練實(shí)際需求設(shè)計(jì),考察虛擬訓(xùn)練系統(tǒng)的實(shí)用性和用戶使用過程中的愉悅感。采用Cronbach′s Alpha系數(shù)法測量本問卷信度為0.809,可見問卷可靠性較高。
副作用:根據(jù)Stanney和Kennedy的總結(jié)研究,基于頭盔式顯示器生成的虛擬環(huán)境下,80%~95%的受試者會出現(xiàn)不同程度的生理不適感,可見副作用是虛擬現(xiàn)實(shí)系統(tǒng)普遍性問題。副作用對用戶的體驗(yàn)影響巨大,在評價(jià)過程中必須考慮到。本文使用模擬機(jī)疾病調(diào)查(Simulator Sickness Questionnaire,SSQ)問卷評價(jià)虛擬環(huán)境下受試者的生理不適[21]。原量表為4點(diǎn)量表,評分為0~3分,包含疲勞、惡心、暈眩等16個可能產(chǎn)生的不良反應(yīng)癥狀。為了和本次試驗(yàn)其它量表一致,這里修改評分為1~5分,分別表示沒有、輕微、中度、明顯和嚴(yán)重。另外,根據(jù) Kennedy等人的研究[22],SSQ量表可以進(jìn)一步歸結(jié)為3個子量表,分別是惡心、動眼神經(jīng)紊亂和失方向,并給出了計(jì)算SSQ分值及子量表的方法、各子量表評分為與之最相關(guān)各項(xiàng)評分的加權(quán)和,SSQ總分為3個子量表得分的總和,SSQ總分越高,代表不適感越強(qiáng)烈。本文基于Kennedy等人的方法處理SSQ問卷,且SSQ問卷須在試驗(yàn)前后分別填寫。
試驗(yàn)共招募志愿者26名,男性,年齡22到30歲(平均年齡24.85,標(biāo)準(zhǔn)差1.87),全部為大學(xué)在讀研究生或本單位科研人員,受試者要求視力正常或矯正后視力正常,身體健康,在試驗(yàn)前保持良好的精神狀態(tài)。全部受試者均為第一次體驗(yàn)航天員虛擬現(xiàn)實(shí)訓(xùn)練系統(tǒng),并在試驗(yàn)開始前簽署試驗(yàn)知情同意書,告知受試者本次試驗(yàn)?zāi)康氖菍ο到y(tǒng)進(jìn)行評估而不是對用戶的評估。
為了全面地評價(jià)虛擬現(xiàn)實(shí)訓(xùn)練系統(tǒng)的體驗(yàn)質(zhì)量,需要安排受試者盡可能全方位地體驗(yàn)和使用虛擬訓(xùn)練系統(tǒng),為此,本文設(shè)計(jì)了兩個典型的試驗(yàn)任務(wù):空間站內(nèi)導(dǎo)航任務(wù)和用于交互操作流程訓(xùn)練的質(zhì)量測量儀裝配任務(wù),每個任務(wù)都包括練習(xí)和考核兩種模式。
3.2.1 空間站內(nèi)導(dǎo)航任務(wù)
虛擬空間站在結(jié)構(gòu)上包含11個艙段,三維立體結(jié)構(gòu),外部結(jié)構(gòu)如圖2,且搭建了逼真的艙內(nèi)虛擬環(huán)境,如圖3。空間站內(nèi)導(dǎo)航任務(wù)是控制虛擬航天員從當(dāng)前位置移動到目標(biāo)位置的過程,旨在讓航天員體驗(yàn)空間站中任意視覺垂向下的導(dǎo)航過程。在虛擬空間站內(nèi)創(chuàng)建了一個虛擬人,受訓(xùn)者通過頭盔顯示器獲得該虛擬人的視野,通過轉(zhuǎn)動頭部可以觀察虛擬空間站內(nèi)部環(huán)境。同時受訓(xùn)者通過三維鼠標(biāo)控制虛擬人在虛擬空間站內(nèi)完成從起始艙到目標(biāo)艙的訓(xùn)練任務(wù),在此過程中,需要受訓(xùn)者熟悉路徑上各艙段內(nèi)部環(huán)境和布局,形成僅依靠視覺線索定位定向的能力。在練習(xí)模式下,可見一條藍(lán)色導(dǎo)航線連接起點(diǎn)艙和目標(biāo)艙,指引受訓(xùn)者,同時任務(wù)欄實(shí)時顯示受訓(xùn)者當(dāng)前所在艙段名稱。在考核模式下,用戶控制的虛擬人被隨機(jī)置于任意艙段,任務(wù)欄僅顯示目標(biāo)艙名稱,受訓(xùn)者首先定位自身所在艙段,然后根據(jù)空間站結(jié)構(gòu),規(guī)劃路徑,到達(dá)目標(biāo)艙。
圖2 虛擬空間站外部構(gòu)型Fig.2 Structure of the virtual space station
圖3 艙內(nèi)虛擬環(huán)境Fig.3 Scenes in the module
3.2.2 質(zhì)量測量儀裝配任務(wù)
裝配任務(wù)是為了訓(xùn)練航天員對于裝配流程和各組件配合關(guān)系的記憶。在裝配任務(wù)過程中,受訓(xùn)者可以訓(xùn)練區(qū)域內(nèi)移動,艙內(nèi)虛擬人通過位置跟蹤獲得和受訓(xùn)者一致的運(yùn)動,受訓(xùn)者使用手柄操作虛擬環(huán)境中的物品并將其“安裝”在相應(yīng)位置上。在練習(xí)模式下,系統(tǒng)提示受訓(xùn)者每一步應(yīng)該操作的組件和該組件的安裝位置,受訓(xùn)者在系統(tǒng)提示下完成裝配;在考核模式下,受訓(xùn)者則根據(jù)記憶,按照練習(xí)的步驟,在沒有提示的情況下完成裝配,同時如果受訓(xùn)者不能完成,則可以通過菜單選擇提示,系統(tǒng)會給出相應(yīng)的提示。質(zhì)量測量儀裝配練習(xí)場景如圖4,虛擬環(huán)境中試驗(yàn)臺上的物體為待裝配的組件,左側(cè)半透明模型為相應(yīng)組件待裝配位置的提示,不透明模型為已安裝組件。
圖4 裝配任務(wù)場景Fig.4 Assembly scene
試驗(yàn)流程分為4個階段:試驗(yàn)準(zhǔn)備、交互操作體驗(yàn)階段、導(dǎo)航任務(wù)階段和試驗(yàn)后數(shù)據(jù)采集。在試驗(yàn)準(zhǔn)備階段,需要告知受試者試驗(yàn)內(nèi)容,向受試者介紹虛擬空間站外部構(gòu)型,進(jìn)行手柄和三維鼠標(biāo)操作培訓(xùn)等,在受試者簽署知情同意書并填寫試驗(yàn)前問卷后,幫受試者佩戴頭盔顯示器,然后試驗(yàn)正式開始。受試者先完成一次質(zhì)量測量儀裝配任務(wù),包括練習(xí)和考核,用時約10 min,然后開始空間站內(nèi)導(dǎo)航任務(wù),用時約30 min。試驗(yàn)結(jié)束后,受試者稍作休息,完成問卷數(shù)據(jù)采集,到此試驗(yàn)全部結(jié)束。
試驗(yàn)在一個寬敞且安靜的實(shí)驗(yàn)室中展開,試驗(yàn)過程室內(nèi)溫濕度適宜,無外界噪聲干擾,且受試者有足夠的活動空間,能最大程度避免外部環(huán)境干擾造成的沉浸感損失。試驗(yàn)軟硬件平臺基于HTC VIVE解決方案構(gòu)建,包括用于跟蹤定位的Lighthouse系統(tǒng)、手柄控制器、三維鼠標(biāo)和頭戴顯示器等。該方案定位系統(tǒng)理論定位精度可達(dá)毫米級,跟蹤效果優(yōu)秀,VIVE頭戴式顯示器提供單眼1080×1200像素分辨率和 90 Hz刷新率、110°視場角,為系統(tǒng)體驗(yàn)質(zhì)量提供了優(yōu)良的基礎(chǔ)。試驗(yàn)過程中,整個試驗(yàn)系統(tǒng)運(yùn)行在一臺裝備有NVIDIA GeForce 1080顯卡的HP Z820圖形工作站上,系統(tǒng)配置超過VIVE運(yùn)行的建議配置,能夠有效避免平臺計(jì)算能力不足帶來的卡頓、丟幀等問題,保證了虛擬訓(xùn)練系統(tǒng)的穩(wěn)定運(yùn)行。
受試者關(guān)于TLX量表的打分情況如圖5所示。由圖可見,除努力程度略高于50分外,各項(xiàng)評分均值都低于50分,說明本次試驗(yàn)任務(wù)負(fù)荷相對合理,既沒有太難以執(zhí)行,也沒有過于簡單。對于各維度,本次試驗(yàn)任務(wù)主要是艙內(nèi)環(huán)境熟悉和交互操作流程記憶,主要需求為腦力需求,幾乎沒有體力消耗任務(wù),但由于受試者在試驗(yàn)過程中生理不適,體力需求仍然達(dá)到了一定的水平。此外,不論是腦力需求還是體力需求,數(shù)據(jù)散布程度都比較高,說明個體差異較大。對于腦力需求,個體空間能力對環(huán)境熟悉任務(wù)影響較大,空間能力越強(qiáng)的個體,完成任務(wù)越容易[22],報(bào)告的腦力需求則更低;對于體力需求,受試者訪談結(jié)果表明,忍受惡心想吐的不適感消耗較多的體力,對虛擬環(huán)境耐受性好的個體,不適感較低,則體力需求評分很低,而耐受性不好的個體,則因?yàn)槿淌軓?qiáng)烈的不適而消耗更多的體力。
任務(wù)負(fù)荷評價(jià)結(jié)果表明,本次試驗(yàn)任務(wù)負(fù)荷設(shè)置合理,這種任務(wù)設(shè)置模式可以作為訓(xùn)練任務(wù)設(shè)置的參考,但應(yīng)該適當(dāng)降低任務(wù)時長或在中間安排休息。
圖5 任務(wù)負(fù)荷量表打分情況Fig.5 Scores of the NASA-TLX scale
界面可用性問卷受試者打分情況如表1所示,由表可見,各項(xiàng)目得分均值都不低于3.5,系統(tǒng)質(zhì)量、信息質(zhì)量(包括其相關(guān)各題項(xiàng))以及界面可用性整體評分均值不低于4分。單樣本t檢驗(yàn)(雙側(cè),α=0.05)結(jié)果表明,所有項(xiàng)目評分顯著高于中位數(shù)3分,95%置信區(qū)間下線也高于3分;系統(tǒng)質(zhì)量、信息質(zhì)量(包括其相關(guān)各題項(xiàng))以及界面可用性整體評分都顯著高于3.5,95%置信區(qū)間下限也高于3.5分(Q8最低,3.64)。由此,可以認(rèn)為在界面可用性方面,系統(tǒng)達(dá)到了良好的水平,特別是在系統(tǒng)質(zhì)量和信息質(zhì)量兩個方面表現(xiàn)優(yōu)秀。
另外,界面質(zhì)量(包括其相關(guān)各題項(xiàng))評分相對較低,受試者訪談的結(jié)果表明,該題評分低的原因有2個方面:一是三維鼠標(biāo)各自由度間的耦合導(dǎo)致虛擬人運(yùn)動控制不能完全符合預(yù)期;二是模型精度和頭盔分辨率不夠高導(dǎo)致的視覺顯示質(zhì)量不夠高、存在像素感等,這2個方面應(yīng)該作為系統(tǒng)界面可用性改進(jìn)的主要方向。
臨場感問卷得分情況如表2,由表可見,4個因子和臨場感總分平均值都大于3.5,單樣本t檢驗(yàn)(雙側(cè),α=0.05)結(jié)果表明,除界面質(zhì)量外,其余各項(xiàng)均具有顯著性。值得注意的是,感官逼真度平均評分達(dá)到了4.365,說明系統(tǒng)擁有優(yōu)秀的虛擬表現(xiàn)水平,能夠提供給用戶逼真的虛擬環(huán)境。
從臨場感問卷評分情況來看,虛擬訓(xùn)練系統(tǒng)能夠在視覺上提供給用戶逼真的虛擬環(huán)境,給用戶身臨其境的感覺。其中,感官逼真度和適應(yīng)性評分較高,說明系統(tǒng)場景渲染逼真,用戶可以輕易地適應(yīng)虛擬環(huán)境;而界面質(zhì)量和參與感評分相對較低,說明交互設(shè)備滿足用戶需求的程度不高,用戶需要分散更多的注意力在交互設(shè)備的使用上,從而降低了用戶的沉浸感和參與感。用戶訪談結(jié)果表明,交互設(shè)備使用不夠自然和精確以及控制延時這些問題干擾了試驗(yàn)任務(wù),是降低用戶臨場感的重要原因,可以考慮開發(fā)更加自然的交互方式以提升用戶的臨場感。
有用性問卷打分情況如表3,單樣本t檢驗(yàn)(雙側(cè),α=0.05)結(jié)果表明,實(shí)用性評分顯著高于3.5分,可見系統(tǒng)在實(shí)用性方面得到了受試者高度的認(rèn)可。而在享樂性方面,整體評價(jià)均值為2.96,小于中位數(shù)3分。其中,12名受試者給出了中立評價(jià),8名受試者給出了負(fù)面評價(jià),只有6名受試者給出了正面評價(jià),給出中立或負(fù)面評價(jià)的受試者占總?cè)藬?shù)的76.9%,說明系統(tǒng)顯示使用系統(tǒng)存在降低用戶精神愉悅度的風(fēng)險(xiǎn),且具有一定的普遍性。通過受試者訪談得知,系統(tǒng)降低用戶精神愉悅度的原因是環(huán)境熟悉試驗(yàn)引起的惡心、暈眩等生理不適。
有用性評價(jià)結(jié)果表明,一方面,用戶主觀感知虛擬訓(xùn)練有實(shí)際效用,另一方面,虛擬環(huán)境帶來的不適感降低用戶精神愉悅感,雖然可以通過減少用戶暴露在虛擬環(huán)境下的時間來降低不適感,但顯然必要的訓(xùn)練時間是掌握技能的基礎(chǔ),訓(xùn)練時間不能太短。
圖6為受試者在裝配任務(wù)中練習(xí)和考核所用的時間,配對t檢驗(yàn)結(jié)果顯示練習(xí)模式和考核模式用時差異顯著(雙側(cè),α=0.05,sig=0.022),可見在裝配任務(wù)中,受試者在考核模式下用時顯著減少,說明受試者熟練程度提高,證實(shí)了受試者的主觀感知,即虛擬訓(xùn)練確實(shí)有一定的實(shí)際效用。
圖6 裝配任務(wù)完成時間Fig.6 Time used for assembly
副作用問卷受試者打分情況如圖7所示。由圖可見,試驗(yàn)后總體不適、惡心和想吐3項(xiàng)的平均評分超過了3分,達(dá)到了中度不適甚至更高,說明這3項(xiàng)癥狀變化最為顯著。采用配對t檢驗(yàn)(雙側(cè),α=0.05)對評分變化的顯著性進(jìn)行檢驗(yàn),各項(xiàng)癥狀均變化顯著(P<0.01)。此外,由圖可見頭疼、眼睛疲勞、聚焦困難、唾液分泌增加、出汗、注意力難以集中、視覺模糊、目眩和打嗝等項(xiàng),數(shù)據(jù)散布程度很高,說明虛擬環(huán)境下生理不適個體差異非常明顯。
圖7 試驗(yàn)前后SSQ評分情況Fig.7 Scores of the SSQ before and after experiment
SSQ三個子量表的評分和SSQ總體不適感評分如圖8所示。由圖可見,試驗(yàn)后受試者在惡心(N)、動眼神經(jīng)紊亂(O)和失方向(D)三個方面均感受到了強(qiáng)烈的不適。試驗(yàn)前三個子量表得分情況為O>D>N,試驗(yàn)后則變?yōu)镹>D>O,這一結(jié)果與Kennedy等人在1997年的研究結(jié)果一致:“太空病的特征是大量惡心和失方向,但動眼神經(jīng)紊亂相對較少(即N>D>O)”[23]。
圖8 SSQ子量表評分Fig.8 Scores of the SSQ subscale
從各問卷分析可見,本文的評價(jià)指標(biāo)并不是相互獨(dú)立的,如臨場感問卷和界面可用性問卷都涉及到對界面質(zhì)量的評價(jià),評分分別為:臨場感3.667±0.699,界面可用性 3.538±0.774,配對 t檢驗(yàn)(雙側(cè),α=0.05,sig=0.451)結(jié)果未顯示顯著差異,表明選擇標(biāo)準(zhǔn)化問卷帶來更高的可靠性。如前文所述,相比其他指標(biāo),界面質(zhì)量評分相對較低,原因是用戶對于交互設(shè)備的不適應(yīng)或不滿意,在開發(fā)出新的交互方式前,讓用戶學(xué)習(xí)并適應(yīng)現(xiàn)有的交互方式是提升用戶體驗(yàn)質(zhì)量的一個重要方面。
試驗(yàn)后用戶訪談過程我們了解到,多數(shù)受試者認(rèn)為在試驗(yàn)過程中忍受了不適感,特別是惡心想吐,引起了體力消耗。用戶評分結(jié)果驗(yàn)證了用戶訪談結(jié)果,Pearson相關(guān)系數(shù)分析表明,體力需求和SSQ癥狀中的總體不適,想吐兩項(xiàng)顯著相關(guān)(P<0.05),和SSQ量表總分也顯著相關(guān)(P<0.01)。表4給出了各評價(jià)指標(biāo)之間的相關(guān)系數(shù),可見副作用與任務(wù)負(fù)荷呈顯著正相關(guān),而與臨場感呈顯著負(fù)相關(guān),與有用性呈負(fù)相關(guān)。結(jié)合上文分析,有理由認(rèn)為生理不適引起用戶體力消耗,加重了用戶的負(fù)荷,且用戶需要分散精力忍受這些不適,顯著地影響到了用戶的臨場感,并在一定程度上降低了用戶感知有用性,破壞了用戶的體驗(yàn)。
目前,關(guān)于虛擬現(xiàn)實(shí)副作用產(chǎn)生的原因,尚無統(tǒng)一的認(rèn)識,比較流行的觀點(diǎn)是感官沖突理論[24]。該理論認(rèn)為在虛擬環(huán)境下,前庭和視覺傳遞給中樞神經(jīng)的信息不一致而導(dǎo)致暈動癥;同時該理論還指出,人們可以通過學(xué)習(xí)以適應(yīng)暈動癥,這表明可以通過訓(xùn)練增強(qiáng)人對虛擬環(huán)境的適應(yīng)性和耐受度。
表4 指標(biāo)相關(guān)系數(shù)矩陣Table 4 Correlation matrix of the metrics
航天員虛擬訓(xùn)練系統(tǒng)是用于航天員訓(xùn)練的工具,盡管其實(shí)用性得到了用戶的認(rèn)可,但引起生理不適也降低了用戶的愉悅感和使用欲望。研究表明,虛擬環(huán)境下的不適感強(qiáng)烈程度,隨著用戶暴露在虛擬環(huán)境下時間的增長而增加[25]。本次試驗(yàn)持續(xù)約40 min,且中間沒有安排休息,雖然任務(wù)負(fù)荷量表中時間需求平均分低于50,但從各維度之間對比來看,時間需求評分較高,所以,在實(shí)際訓(xùn)練中,應(yīng)該適當(dāng)安排休息,避免用戶暴露在虛擬環(huán)境下的時間過長。
本文通過用戶測試的方法,主要使用主觀評價(jià)法,對航天員艙內(nèi)導(dǎo)航與操作虛擬訓(xùn)練體驗(yàn)質(zhì)量進(jìn)行了評價(jià)。本文基于任務(wù)負(fù)荷、界面可用性、臨場感、副作用和有用性5個指標(biāo)設(shè)計(jì)了評價(jià)量表。整體來看,系統(tǒng)體驗(yàn)質(zhì)量達(dá)到了較好的水平。用戶評分結(jié)果表明,系統(tǒng)在界面可用性、臨場感和有用性方面表現(xiàn)良好,能滿足用戶期望;試驗(yàn)任務(wù)負(fù)荷適中,可以為訓(xùn)練任務(wù)設(shè)置提供參考。
系統(tǒng)存在的問題主要有2個方面:一是多數(shù)用戶在體驗(yàn)過程中遭受了生理不適,降低了用戶的體驗(yàn)質(zhì)量,且對試驗(yàn)任務(wù)造成了干擾;二是用戶對于交互設(shè)備的不適應(yīng)和不滿意。減少訓(xùn)練時間能夠降低用戶的不適感,但訓(xùn)練時間太短則不能達(dá)到預(yù)期的訓(xùn)練效果,所以設(shè)置合理的訓(xùn)練時間非常必要。另外,雖然用戶可以學(xué)習(xí)并逐漸適應(yīng)交互方式和虛擬環(huán)境下的暈動癥,但尋找解決這兩個問題的技術(shù)手段更為關(guān)鍵。