周維逸,周仁來
(南京大學心理系,南京 210023)
長期在軌生活,生物節(jié)律紊亂現(xiàn)象會慢慢出現(xiàn),這對航天員的生理、心理健康以及認知能力都存在不同程度的損害[1-3]。空間環(huán)境的特殊性會對航天員的睡眠和生物節(jié)律產(chǎn)生重要影響。據(jù)統(tǒng)計,幾乎所有航天員的主觀報告都顯示在執(zhí)行航天任務時存在睡眠嚴重不足的現(xiàn)象[4]。有研究表明,航天員的生物節(jié)律紊亂與相應的睡眠障礙會導致警覺性水平和認知功能的下降[5]。
警覺性又稱持續(xù)注意能力,是指在一段較長的時間內(nèi)對同一刺激保持覺察和反應的準備狀態(tài)[6]。晝夜規(guī)律的改變會引起長期在軌生活的航天員生理節(jié)律失調(diào),加之太空失重環(huán)境、在軌期間工作負荷強度高以及時間感缺失等問題的影響,都可能會導致航天員警覺性下降[7-8]。研究人員對某次在軌飛行任務前和返回后3 名航天員的警覺度進行測試發(fā)現(xiàn),與飛行前第一次精神運動警覺任務(Psychomotor Vigilance Task,PVT)結(jié)果相比,有1 名航天員無明顯改變,2 名航天員在飛行后有較大改變,其中1 名航天員PVT 均值在飛行后降低,而另一名升高[9]。
個體往往很難對自身的警覺性水平做出客觀的評價[10-11]。目前,警覺性檢測技術的局限性制約了研究人員對于航天員警覺性水平變化的系統(tǒng)研究。傳統(tǒng)的警覺性檢測手段分為主觀檢測和客觀檢測。主觀檢測主要使用量表評分,例如卡羅琳斯卡嗜睡量表(Krolinska Sleepiness Scale,KSS)[12]以及斯坦福嗜睡量表(Stanford Sleepiness Scale,SSS)[13],量表評分操作簡單靈活,但是信效度不理想。警覺性水平的降低并非孤立存在,其往往與任務表現(xiàn)相關聯(lián),因此傳統(tǒng)的客觀檢測方法主要通過行為范式進行,公認的最常用且最有效的行為范式為PVT[14]。PVT 是一項操作簡單但是漫長單調(diào)的簡單反應時任務,需要受試者長時間關注一個刺激物的出現(xiàn)并且在刺激物出現(xiàn)時盡可能快速地做出反應。
隨著認知神經(jīng)科學技術的發(fā)展,神經(jīng)生理測試逐漸引入到了認知功能的檢測當中,因為生理指標的客觀性相對于主觀問卷和行為范式而言更高。常用的生理檢測手段包括心電(Electrocardiography,ECG)、腦電((Electroencephalography,EEG)等。心率變異性(Heart Rate Variability,HRV)是反映自主神經(jīng)活性和定量評估心臟交感神經(jīng)和副交感神經(jīng)(迷走神經(jīng))張力及其平衡性的一類心電指標[15]。研究人員對警覺性變化或者腦力疲勞程度變化伴隨的心電指標進行了一些探索。郭瑋等[16]使用腦力疲勞試驗發(fā)現(xiàn)隨著腦力疲勞的程度增加,個體的心率會顯著下降而HRV 會顯著上升;李延軍等[17]通過睡眠剝奪過程中的動態(tài)檢測,發(fā)現(xiàn)HRV 指標可以有效地反映出疲勞度和困倦的增長;隨后郭瑋等[16]發(fā)現(xiàn)HRV 對睡眠剝奪條件下的警覺性注意的敏感程度更高。趙小靜等[18]以睡眠剝奪的方式誘導腦力疲勞,將心電測量和行為結(jié)果結(jié)合起來,發(fā)現(xiàn)晝夜節(jié)律穩(wěn)定的人進入腦力疲勞狀態(tài)后,應激能力會顯著下降,注意力和反應力會下降,副交感神經(jīng)的活性會顯著增強。腦電的頻域指標中,警覺性的下降伴隨著頂葉alpha 能量的增加以及額葉beta 和theta 能量的增加;時域指標中,枕葉P1 和N1 的波幅反映出了選擇性的視覺空間注意能力,隨著警覺性的下降,2 個成分的波幅會發(fā)生降低[19]。枕葉以及額葉的較晚期成分N2、P3 等波幅也會隨著疲勞度的增加而降低[20]。
綜上,腦力疲勞的變化以及應激能力的變化可以通過心電以及腦電指標反映出來。以往的研究更多地在較為極端的睡眠剝奪情況下進行[17-18],而在警覺性變化幅度并不明顯的情形下,生理指標的檢測效果還是不明確的。在實際操作中,開展腦電為主的檢測方法需要較為復雜繁瑣的操作流程以及算法,而心電的數(shù)據(jù)獲取相對于腦電而言更加簡單且可靠。
本文通過開展連續(xù)的、較長時間的警覺性任務,營造警覺性逐漸下降、疲勞度逐漸增長的情境,從而觀察心電指標的變化情況,并嘗試通過機器學習的手段對心電指標的預測效力進行檢驗。
共招募48 名被試,年齡在18~28 歲之間,其中男性21 名,女性27 名。被試均為右利手,且無生理以及心理疾病,實驗開始前2 周內(nèi)不存在明顯的失眠以及生物節(jié)律紊亂的癥狀。本實驗通過南京大學心理系倫理委員會批準;所有被試均為自愿參與實驗,在實驗前了解了實驗的基本情況并簽署了知情同意書。
警覺性任務采用PVT 范式,每個試次的刺激呈現(xiàn)前空屏時長為2~10 s(不定),要求被試將注意力保持在屏幕中央,并且將雙手放置在鍵盤的空格鍵上。隨后刺激(紅點)呈現(xiàn),被試需要盡可能快地按下空格鍵作出反應,受試者作出反應后刺激(紅點)消失,屏幕上顯示受試者的反應時長,1 s 后進入下一試次。標準PVT 任務的測試時長為10 min,共80 個試次。實驗結(jié)束后,計算警覺性相關指標前需要統(tǒng)計被試的有效反應試次數(shù)(總試次數(shù)減去刺激出現(xiàn)前就按下空格鍵的試次數(shù))。警覺性指標包括反應時的平均數(shù)、反應時的中位數(shù)以及反應時倒數(shù)的平均值。
實驗開始后,被試需要連續(xù)完成5 組標準的PVT 測試,共80×5 = 400 個試次。完成連續(xù)5 組PVT 測試的過程中同步采集心電數(shù)據(jù)。
采用BIOPAC 的MP160 多導生理記錄儀對被試的心電數(shù)據(jù)進行采集,采樣率為1000 Hz,使用0.5 Hz 的高通以及35 Hz 的低通進行濾波。使用MP160 多導生理記錄儀自帶的Acq 軟件對頻域指標極低頻(VLF,0.01~0.04 Hz)、低頻(LF,0.04~0.15 Hz)、高頻(HF,0.15~0.40 Hz)進行提取計算。
為了檢驗心率變異性指標對于警覺性變化的預測效果,數(shù)據(jù)處理完成后首先計算出所有PVT測試結(jié)果的反應時平均數(shù)以及標準差,保留平均數(shù)前后3 個標準差的數(shù)據(jù),超出平均數(shù)前后3 個標準差以外的數(shù)據(jù)為異常數(shù)據(jù),予以排除。這部分的數(shù)據(jù)代表著受試者警覺性從高到低的變化趨勢,用于警覺性分級,勢必需要對警覺性從高到底的變化過程進行刻畫。如果警覺性出現(xiàn)下降,行為指標則會向后偏移。隨后,將反應時數(shù)據(jù)從高到低進行排列,若分為5 級,分級起點和終點分別為反應時平均數(shù)加減3 個標準差,每一個級別的跨度為1.2 個標準差。因此,第一級的范圍為平均數(shù)減3 個標準差到平均數(shù)減1.8 個標準差,第二級的范圍為平均數(shù)減1.8 個標準差到平均數(shù)減0.6 個標準差,第三級的范圍為平均數(shù)減0.6 個標準差到平均數(shù)加0.6 個標準差,第四級的范圍為平均數(shù)加0.6 個標準差到平均數(shù)加1.8 個標準差,第五級的范圍為平均數(shù)加1.8 個標準差到平均數(shù)加3 個標準差。
使用多分類支持向量機(Multi-Class Support Vector Machine,MCSVM),選擇生理指標對相應階段的警覺性分級進行預測。輸入的指標為VLF-HRV 和HF-HRV 2 個指標,預測相應時間段內(nèi)由警覺性行為績效指標得出的分級情況。支持向量機算法中所使用的帶懲罰的徑向基函數(shù)(Radial Basis Function,RBF)通過Libsvm 工具箱引用。通過繪制被試工作特征(Receiver Operating Characteristic,ROC)曲線來評估分類的性能。準確率、特異性、敏感性等指標應達到70%以上,說明預測效果比較穩(wěn)定。數(shù)據(jù)分析過程中采取k折交叉驗證的方式:將樣本均勻地分為互斥的k份,保證每一份的樣本個數(shù)相同;一共進行k次訓練,每次訓練選擇其中k-1 份作為訓練集,剩下的1 份作為測試集,最終的指標為k次訓練之后得到的模型在測試集上指標的平均值。本研究取k= 5,采用五折交叉驗證。
在連續(xù)完成5 組標準的PVT 測試,結(jié)果如表1 所示。被試反應時的平均數(shù)以及反應時的中位數(shù)會呈現(xiàn)出明顯的上升趨勢,單因素方差分析結(jié)果表明,個體在連續(xù)完成5 組PVT 任務過程中的反應時平均數(shù)以及反應時中位數(shù)具有顯著差異,F(4,235)= 3.416,P< 0.001,F(4,235)=3.784,P< 0.001。反應時倒數(shù)的平均值呈現(xiàn)出明顯的下降趨勢,單因素方差分析結(jié)果表明,個體在5 組PVT 任務過程中的反應時倒數(shù)的平均值具有顯著差異,F(4,235)= 3.180,P= 0.032。反應時數(shù)據(jù)見表1。
表1 連續(xù)5 組PVT 任務的反應時指標變化情況(±s)Table 1 Reaction Time variation during 5 blocks of PVT task(±s)
指標第一組第二組第三組第四組第五組平均數(shù)336.0±53.6363.3±58.4391.5±71.0414.2±78.0432.8±80.0中位數(shù)330.2±49.3350.6±56.4375.25±64.5392.9±62.8413.6±70.5倒數(shù)平均值3.13±0.32.99±0.42.9±0.42.77±0.32.57±0.4
心率變異性的2 個頻域指標VLF-HRV、 HFHRV 與PVT 測試的結(jié)果表現(xiàn)出良好的相關關系。2 種心率指標在組間的變化趨勢如表2 所示。VLF-HRV 與反應時的平均數(shù)(r= 0.38,P=0.003)以及反應時的中位數(shù)呈現(xiàn)顯著的正相關(r= 0.36,P= 0.002),與反應時倒數(shù)的平均值呈現(xiàn)出顯著的負相關(r= -0.27,P< 0.001)。HF-HRV 也與反應時的平均數(shù)以及反應時的中位數(shù)呈現(xiàn)顯著的正相關(相關系數(shù)分別為0.16 以及0.22,p值均小于0.001),與反應時倒數(shù)的平均值沒有顯著的差異。
表2 心率變異性變化情況Table 2 VLF-HRV and HF-HRV during 5 blocks of PVT task(±s)
表2 心率變異性變化情況Table 2 VLF-HRV and HF-HRV during 5 blocks of PVT task(±s)
指標第一組第二組第三組第四組第五組HF675.2±63.5602.3±67.8617.9±74.0658.1±71.3706.4±82.6 VLF344.6±59.3380.7±46.7465.4±63.1409.3±59.0511.2±71.4
將所有行為反應時數(shù)據(jù)整合,根據(jù)正態(tài)分布(通過Kolmogorov-Smirnov 檢驗,P= 0.145)的性質(zhì),平均值前后3 個標準差的數(shù)據(jù)包含了整個分布中99.7%的數(shù)據(jù),而前后3 個標準差之外的數(shù)據(jù)往往可以視為錯誤的數(shù)據(jù),警覺性分級共納入238 個數(shù)據(jù),占總數(shù)據(jù)量的95.8%。數(shù)據(jù)的具體分布情況見圖1。
圖1 反應時數(shù)據(jù)的分布情況Fig.1 Distribution of reaction time
警覺性檢測技術實驗中積累的大量PVT 任務的行為數(shù)據(jù),將PVT 的反應時進行統(tǒng)計。首先計算得出所有數(shù)據(jù)的平均值為360.25 ms,標準差為74.91 ms;將警覺性分為5 級別,而選取的數(shù)據(jù)包括前后3 個標準差(135.52~584.98 ms)以內(nèi)的數(shù)據(jù)。因此,從平均數(shù)減去3 個標準差,每一個分級需要包含1.2 個標準差的數(shù)據(jù),因此本文將整體的反應時分為下列6 個參考點(單位:ms):157.8,247.7,337.5,383.0,517.1,607.0,初步確立起警覺性的分級標準,見表3。
表3 警覺性分級Table 3 Five levels of vigilance
隨后采用機器學習的MCSVM 手段,利用受試者某一時段的2 種心電指標對該時段的警覺度分級情況進行預測。由于第1 分級以及第5 分級之中所包含的數(shù)據(jù)量較小,本部分的研究圍繞中間3 個分級的數(shù)據(jù)進行開展。輸入值設定為2 種心電指標,輸出值為該時段基于PVT 反應時得出的警覺性分級。
采取五折交叉驗證,通過繪制ROC 曲線(圖2)來分析指標對于警覺度水平的指示效果。結(jié)果表明單獨使用2 種心電指標對警覺度水平進行預測的平均準確率為77.81%(95%置信區(qū)間為:0.7388~0.8172),平均靈敏度為0.763(95%置信區(qū)間為:0.674 ~ 0.862),平均特異度為0.792(95%置信區(qū)間為:0.713~0.877)。曲線下方積分面積(Area Under The Curve,AUC)為0.87 的結(jié)果表明,2 個心電指標可以較為準確地對警覺度分級情況進行預測。
圖2 受試者工作特征曲線圖Fig.2 Receiver operating characteristic curve
連續(xù)完成5 組標準的PVT 測試過程之中,隨著被試的疲勞度增加,警覺性下降,PVT 任務的反應時平均數(shù)以及反應時中位數(shù)呈現(xiàn)出了上升的趨勢;相應地,反應時倒數(shù)的平均值呈現(xiàn)出了下降的趨勢。相對于睡眠剝奪實驗的激發(fā)而言,這種激發(fā)形式產(chǎn)生的疲勞度比較低,PVT 任務的行為指標依舊呈現(xiàn)出了顯著變化的趨勢,進一步肯定了PVT 任務對警覺度變化的信效度。本研究中所使用的是時長為10 min 的標準化PVT 任務,以往的研究表明,10 min 的版本對于警覺性的變化比其他的版本更為敏感[21],本文研究也對該結(jié)論進行了再次的檢驗。
警覺性下降的過程中,VLF-HRV 和 HRV 值與反應時的指標呈現(xiàn)出了相似的增長趨勢。以往研究發(fā)現(xiàn),當副交感神經(jīng)的活性增強時,心率會下降,高頻的HRV 會升高[22]。晝夜節(jié)律調(diào)節(jié)的情況下,人在白天清醒的情況下高頻HRV 相對于夜晚更低[23]。來自睡眠剝奪的研究結(jié)果發(fā)現(xiàn),睡眠剝奪的過程中,被試的副交感神經(jīng)活性增加,高頻HRV 增長,在行為上體現(xiàn)為PVT 任務表現(xiàn)變差,在量表上表現(xiàn)為主觀困意的增長[24-25]。在本文研究中,行為任務的時間增長,被試的疲勞程度增大,困意有一定的累計,與以往的研究結(jié)果一致。
極低頻HRV 的神經(jīng)機制并不如高頻HRV 明確,研究發(fā)現(xiàn),HRV 中0.01~0.08 Hz 這一頻段與PVT 任務指標的關聯(lián)系數(shù)較高,PVT 任務反應越差,則該頻段的活動越強[22];此外這一頻段的HRV 與主觀問卷KSS 的得分呈現(xiàn)出較高的正相關,即困意越高,該頻段的值也越高。另一項睡眠剝奪的研究發(fā)現(xiàn),0.02~0.08 Hz 頻段的HRV 與PVT 任務指標的相關系數(shù)達到0.68[23-24]。不論是0.01~0.08 Hz 還是0.02~0.08 Hz,這些頻段與極低頻HRV 的頻段分布(0.01~0.04 Hz)存在著完全或者大部分的重疊,與低頻HRV 的頻段分布(0.04~0.15 Hz)的重疊較少。因此可以推斷,低頻HRV 并沒有呈現(xiàn)出顯著差異的原因可能在于其對于警覺性波動的敏感程度不如極低頻成分以及高頻成分。低頻成分與警覺性的關聯(lián)在長達24 h 乃至40 h 的睡眠剝奪研究中得到了顯著地體現(xiàn)[24-25],或許可以認為警覺性水平在較大幅度波動的過程中,低頻成分可以發(fā)揮更好的作用。
機器學習的結(jié)果進一步印證了心電測試在警覺性檢測中的前景,得到的準確率等指標較好。在真實的工作場景中,長時間的工作任務中使用便攜化的心電測量可以及時評估個體的警覺性水平。在長期在軌航天任務階段,將PVT 測試與心電測試結(jié)合起來有助于在較短的時間內(nèi)對航天員的警覺性水平進行快速評估,借以評估在軌飛行環(huán)境對于警覺性水平的影響。
本文研究的局限主要在于數(shù)據(jù)量不大,并且對于警覺性水平的操縱力度不夠極端,較難反映出更大幅度的警覺性變化情況。在被試的選取上,本文研究尚未對受試者的性別因素、年齡因素等進行進一步的分類與考量,而實際的應用場景中更需要關注到性別、年齡等差異對于警覺性水平的影響,從而提升監(jiān)測與評估的精確性。準確的常模建立以及嚴格的機器學習算法實施依賴于龐大的數(shù)據(jù)量,本文研究的數(shù)據(jù)有限,可能會降低機器學習方法的泛化推廣能力,并且不便于開展更精準復雜的算法。本文研究中使用的生理參數(shù)HRV,其測量結(jié)果受到了硬件設備、電極佩戴位置的影響,所以大樣本的對比研究有助于更好地選取更有效且精準的測量方法。更重要的是,地基研究的目的是為天基的實際應用進行積累和鋪墊,未來的研究需要與實際的在軌飛行相結(jié)合,以期進一步加深對于在軌飛行期間警覺性水平變化的認識,推動科研人員對更深層次規(guī)律的探索。
1)警覺性的下降伴隨著行為反應時的延長以及心率變異性高頻(HF-HRV)和極低頻(VLFHRV)的升高;反應時指標與心率變異性的高頻以及極低頻指標均呈現(xiàn)出了顯著的統(tǒng)計相關性。
2)通過相關分析和機器學習預測2 個角度的驗證,心率變異性的高頻(HF-HRV)和極低頻(VLF-HRV)能夠較好地監(jiān)測警覺性變化。