郭北苑,孫玉龍
(北京交通大學(xué) a.軌道交通控制與安全國家重點實驗室,b.電子信息工程學(xué)院,北京 100044)
列車ATO控制算法能實現(xiàn)精確的速度以及位置控制,可以有效降低能耗,提高乘客的舒適度[1],已經(jīng)在高速列車駕駛領(lǐng)域中逐步展開應(yīng)用.其中,實現(xiàn)列車精確的對標停車是評價自動駕駛算法控制性能的一個重要指標,需要控制算法在保證乘客舒適性的條件下將列車在停車點處的誤差控制在一個極小的誤差范圍內(nèi).
當前列車ATO控制算法主要有PID控制、參數(shù)自適應(yīng)控制、模糊控制以及智能控制算法等[2].PID控制在實際工程中應(yīng)用較多,具有算法結(jié)構(gòu)簡單等特點,但是其抗干擾能力差、控制切換較頻繁,因此,需要對PID控制算法做出改進和優(yōu)化[3].通過對PID控制算法的輸入部分設(shè)計微分器,引入非線性控制律補償外界干擾等自抗擾控制技術(shù)對PID進行改進[4],可以有效改善傳統(tǒng)列車PID控制算法魯棒性差、穩(wěn)定性不高的缺點.模糊控制可以按照一定的模糊規(guī)則進行模糊推理,對PID參數(shù)進行自適應(yīng)調(diào)整[5].利用強化學(xué)習方法設(shè)計列車控制算法,具有無參學(xué)習、動態(tài)優(yōu)化、自適應(yīng)等突出優(yōu)點[6],但是強化學(xué)習需要學(xué)習大量的駕駛數(shù)據(jù),相關(guān)參數(shù)的調(diào)節(jié)也需要一定的經(jīng)驗積累.
上述控制算法均需要追蹤離線已生成的目標速度曲線,未充分考慮司機的駕駛經(jīng)驗并存在靈活性不足的缺點.認知建模從認知結(jié)構(gòu)的角度對人類的認知過程進行建模仿真,構(gòu)建的模型具有類似人的認知行為特征.
當前有上百種認知建模方法,常用的有MHP、EPIC、Sigma以及ACT-R等,MHP可用于分析人機交互階段中那些階段花費的時間最長或者錯誤最多的方法[7],但是MHP僅僅以時間和錯誤率為評價指標,已遠遠不能滿足構(gòu)建復(fù)雜系統(tǒng)的設(shè)計要求.EPIC對知覺和運動子系統(tǒng)的描述比較詳細,但是對于記憶和學(xué)習的描述作用比較弱[8].Sigma是目前提出的最新的認知結(jié)構(gòu)之一[9],應(yīng)用相對較少.ACT-R認知結(jié)構(gòu)由卡內(nèi)基梅隆大學(xué)John Anderson所提出[10],整合了感覺知覺、記憶學(xué)習、推理判斷以及問題解決等各方面的認知心理學(xué)理論,模型的一些理論假設(shè)有客觀的認知實驗的驗證,能更全面準確地模擬人類的認知過程,是目前認知建模領(lǐng)域最為成熟的認知結(jié)構(gòu)之一.在汽車駕駛、控制、人機交互等領(lǐng)域存在廣泛的應(yīng)用[11].
列車自動駕駛的整個駕駛按照列車在區(qū)間的運行狀態(tài)可劃分為牽引、巡航、惰行以及制動四個階段,其中巡航和惰行階段不需要對列車級位做過多的調(diào)整,牽引階段只需要將列車速度從0提高到巡航速度即可.而制動階段對ATO控制算法的控制績效最為關(guān)鍵,因為高速列車在制動階段初始速度較高、走行距離較長,除了需要滿足良好的乘客舒適性、合理的運行時間等性能指標外,還需要滿足停車精度的要求,故制動階段是決定列車ATO控制算法控制效果良好的關(guān)鍵.
本文作者采用ACT-R認知結(jié)構(gòu)構(gòu)建了高速列車司機在停車對標階段的認知模型,并基于此模型設(shè)計相關(guān)的停車控制算法.研究內(nèi)容主要分為:1)對高速列車司機的停車對標任務(wù)進行分析,通過對司機進行訪談,從認知結(jié)構(gòu)的角度描述列車司機在駕駛過程中的信息感知、思維決策以及輸出控制,構(gòu)建高速列車司機停車對標任務(wù)認知結(jié)構(gòu)模型;2)基于構(gòu)建的模型,設(shè)計高速列車停車控制算法;3)將設(shè)計好的算法與PID控制算法、人類司機進行仿真對比,比較控制算法的駕駛績效.
停車過程的認知主要分為任務(wù)感知、思維決策以及輸出控制三個部分.本文對具有多年駕駛經(jīng)驗的動車組指導(dǎo)司機進行訪談并對訪談結(jié)果分析,得到表1所示的司機停車任務(wù)認知過程.司機從開始停車到最終在停車標處停車包括調(diào)速和站停兩個階段,這兩個階段采取的制動策略有所不同,調(diào)速階段是依據(jù)駕駛經(jīng)驗參照限速調(diào)整列車速度并保證列車速度不超過限制速度;站停階段是到達參照點后,回憶參考速度對應(yīng)的制動距離對列車速度做出最后的調(diào)整,使列車能在停車標處剛好停車.調(diào)速和站停階段司機均需要感知當前列車DMI界面信息,包括當前速度、限速、走行距離,以及車型、天氣狀況等.司機感知到駕駛相關(guān)信息之后,注意到當前速度和當前限速的差異,在調(diào)速階段從大腦中記憶相關(guān)的駕駛經(jīng)驗等,判斷當前速度是否超過限速,并且判斷當前速度、走行距離與經(jīng)驗的差異,做出增加、降低或者保持制動的決策.在站停階段,司機需要依據(jù)經(jīng)驗判斷列車的制動狀態(tài)能否在當前速度條件下在停車標處停車,并根據(jù)判斷結(jié)果對當前狀態(tài)下的級位做出調(diào)整.
表1 高速列車司機停車對標認知過程Tab.1 Cognitive process of high-speed train drivers’ brake control
1.2.1 高速列車認知結(jié)構(gòu)
分析列車司機的駕駛特征,可以發(fā)現(xiàn)司機感知過程只需要感知到關(guān)鍵信息,不涉及到復(fù)雜的視覺搜尋過程,同時由于司機的操作對象是司控器,因此本文在ACT-R認知結(jié)構(gòu)的基礎(chǔ)上,針對高速列車對標停車任務(wù)提出高速列車停車認知結(jié)構(gòu),基本框架如圖1(a)所示,包括感知模塊、目標模塊、陳述性知識模塊、程序性知識模塊以及輸出模塊,感知模塊包括感知緩沖區(qū),可以直接從外界獲取駕駛信息并保存到感知緩沖區(qū),模擬人類獲取外界視覺信息并保存到大腦的過程.輸出模塊用于執(zhí)行級位轉(zhuǎn)換并向外界輸出級位,模擬人類從大腦中接收運動指令并控制手部運動的過程.陳述性知識模塊由組塊(chunk)組成,用于模擬海馬體存儲人類的長期記憶,當模型通過程序性知識模塊向陳述性知識模塊中提出檢索請求時,檢索緩沖區(qū)會提取到與當前情景相關(guān)的經(jīng)驗知識.程序性知識模塊用于實現(xiàn)人類技能方面的一些知識,模擬人腦的基底神經(jīng)節(jié);由產(chǎn)生式規(guī)則構(gòu)成,每個產(chǎn)生式由條件和行為兩種規(guī)則組成.只有滿足產(chǎn)生式的條件規(guī)則,才能觸發(fā)行為規(guī)則.由于高速列車停車認知結(jié)構(gòu)假設(shè)人是目標驅(qū)動性,目標模塊中存儲有人類完成特定任務(wù)的多個目標,每次目標緩區(qū)中保存一個目標,用于模擬額葉前部背外側(cè),通過不同子目標的實現(xiàn)完成最終的任務(wù).
圖1 高速列車停車認知結(jié)構(gòu)Fig.1 Basic cognitive structure framework of high-speed train brake
高速列車停車認知結(jié)構(gòu)的工作過程是通過基于目標緩沖區(qū)中的目標,匹配到程序性知識模塊中的產(chǎn)生式,產(chǎn)生式通過調(diào)用高速列車認知結(jié)構(gòu)的目標模塊、感知模塊、陳述性知識模塊或手控模塊等完成一次認知過程,執(zhí)行過程中修改產(chǎn)生式行為規(guī)則中相應(yīng)模塊的緩沖區(qū)的組塊內(nèi)容,并產(chǎn)生新的目標,當產(chǎn)生式完成以后,將得到的新目標更新到目標模塊中,完成一次循環(huán).完整的認知過程就是循環(huán)執(zhí)行上述的過程直到所有目標完成,沒有新的目標進入目標緩沖區(qū).
1.2.2 高速列車停車任務(wù)認知建模
1)感知過程建模.
感知過程反映了列車司機的信息感知過程.根據(jù)前述認知任務(wù)分析,司機在駕駛過程中最關(guān)注的信息是天氣狀況、速度、限速以及車型.通常來說,控制算法都會面向一種具體的控制對象,因此本文只考慮一種車型.同時,為簡化模型,本文暫不考慮天氣影響.因此感知過程只需要感知當前速度、限制速度以及當前走行距離,構(gòu)建的感知過程如圖1(b)所示.
如果目標是“獲取視覺信息”(圖1(b)-①),則程序性知識模塊控制感知模塊執(zhí)行感知搜索過程(圖1(b)-②),并將感知到的視覺信息保存到感知緩沖區(qū)中,添加完之后通過程序性知識模塊將目標模塊中的目標設(shè)置為下一目標(圖1(b)-③).
2)記憶加工過程建模.
根據(jù)感知過程的信息向陳述性知識模塊中提取駕駛經(jīng)驗的信息加工過程稱之為記憶加工過程,陳述性知識模塊中存儲了高速列車司機以往的成功駕駛經(jīng)驗.調(diào)速和站停階段的記憶加工過程有所區(qū)別,感知過程感知到相關(guān)的駕駛信息之后,由思維決策過程根據(jù)調(diào)速與站停階段的劃分條件判斷列車處于哪個階段,對于調(diào)速階段,記憶加工過程需要從陳述性知識模塊中檢索某一速度、某一限速以及某一目標位置下的制動級位經(jīng)驗,而對于站停階段,則需要從陳述性知識模塊的檢索緩沖區(qū)中檢索某個參照速度下的制動距離.構(gòu)建的記憶加工過程如圖1(c)所示.
當目標為“回憶”(圖1(c)-①),且感知緩沖區(qū)中保存有視覺信息(圖1(c)-②),則根據(jù)視覺信息向陳述性知識模塊中檢索駕駛經(jīng)驗或駕駛階段的劃分知識(圖1(c)-③),并將獲取的知識保存到檢索緩沖區(qū)中(圖1(c)-④),同時將目標模塊的目標設(shè)置為下一目標(圖1(c)-⑤).
3)思維決策過程建模.
思維決策過程反映了列車司機的判斷、注意和決策的信息加工過程.
司機感知到視覺信息后,由于調(diào)速階段和站停階段的判斷策略有所不同,故首先需要判斷列車當前處于哪個階段,之后比較視覺信息和駕駛經(jīng)驗,再結(jié)合當前階段采取不同的檔位調(diào)整策略,從而對駕駛經(jīng)驗中的級位值做出調(diào)整,并調(diào)用手控模塊操縱司控器.構(gòu)建的思維決策過程如圖1(d)所示.
當目標為“判斷”(圖1(d)-①),則比較感知緩沖區(qū)中存儲的視覺信息(圖1(d)-②)和檢索緩沖區(qū)中存儲的經(jīng)驗信息組塊(圖1(d)-③),將判斷結(jié)果信息添加到目標緩沖區(qū)的相應(yīng)組塊中(圖1(d)-④),并將目標模塊中的目標設(shè)置為下一目標(圖1(d)-⑤).
4)輸出過程建模.
輸出過程反映了司機完成級位移動的過程.構(gòu)建的輸出過程如圖1(e)所示.
當目標為“執(zhí)行動作”(圖1(e)-①),且目標緩沖區(qū)中存放有級位信息(圖1(e)-②),則通過程序性知識模塊將級位信息輸入到輸出模塊(圖1(e)-③),輸出模塊完成整個級位設(shè)置的執(zhí)行過程.
基于上述高速列車停車對標任務(wù)認知模型,本節(jié)通過構(gòu)建組塊、產(chǎn)生式等來實現(xiàn)高速列車停車控制算法.
視覺感知過程:視覺感知的目的是獲得當前的關(guān)鍵駕駛信息,沒有復(fù)雜的視覺轉(zhuǎn)移過程,因此,本文在構(gòu)建產(chǎn)生式的過程中將駕駛信息直接注入到映像模塊中,在映像緩沖區(qū)中保存一個駕駛信息組塊,該駕駛信息組塊包含三個槽:①當前速度;②限制速度;③走行距離.每個槽的取值即為司機需要的相關(guān)視覺信息.
記憶加工過程:在調(diào)速階段算法獲得當前視覺信息之后,向陳述性知識模塊的檢索緩沖區(qū)中提取相關(guān)駕駛經(jīng)驗組塊,駕駛經(jīng)驗組塊用于保存駕駛相關(guān)經(jīng)驗,本文的駕駛經(jīng)驗組塊包含4個槽:①制動級位;②速度;③限制速度;④走行距離,取值為司機以往的成功駕駛過程中對應(yīng)的值.從檢索緩沖區(qū)中提取組塊的過程由每個組塊的激活值所決定,算法會選擇激活值最大的組塊.激活值為
(1)
式中:Ai表示每個組塊i的激活值,與基級激活值Bi、關(guān)注權(quán)重Wj和相關(guān)強度Sji有關(guān),j表示組塊的第j個槽值,每個組塊共包含n個槽值.激活值與某個組塊的出現(xiàn)次數(shù)和存在時間成正比,出現(xiàn)次數(shù)越多,使用時間越長,相關(guān)強度越大.這與人類的記憶規(guī)律相符合,也就是一段知識使用的次數(shù)越多,與當前的時間越接近,則越容易被檢索到.
而對于站停階段的記憶加工,由于列車與停車標的距離較短,本文只選取幾組參考速度以及參考速度對應(yīng)的制動距離,不通過陳述性知識模塊保存相關(guān)知識.
思維決策過程:在調(diào)速階段,提取到相關(guān)的駕駛經(jīng)驗組塊后,與映像緩沖區(qū)中的視覺信息進行比較,根據(jù)比較結(jié)果得到級位的決策結(jié)果,判斷策略如表2所示.當視覺信息中的速度比經(jīng)驗組塊中的速度小,視覺信息中的走行距離比經(jīng)驗組塊中的走行距離大,說明速度偏小、走行距離偏大,根據(jù)表2的策略,此時應(yīng)該采取釋放制動的決策.
表2 程序性知識判斷策略Tab.2 Procedural knowledge judgment strategies
在站停階段,算法根據(jù)多個參考速度對應(yīng)的制動距離對檔位進行調(diào)整.如果當前列車與停車標的距離大于參考速度對應(yīng)的制動距離,則釋放制動;如果與停車標的距離等于參考速度對應(yīng)的制動距離,則采用一級制動;如果與停車標的距離小于參考速度對應(yīng)的制動距離,則在上次制動的基礎(chǔ)上增加一級制動;如果當前位置已經(jīng)超過停車標,則直接采用最大制動級位.
根據(jù)上述的結(jié)果對存放在目標緩沖區(qū)中的判斷結(jié)果組塊的相應(yīng)槽值進行修改.判斷結(jié)果組塊包含五個槽:①列車當前所處駕駛階段,該槽共有5種取值可能,其中調(diào)速階段1種,站停階段4種,站停階段的4種取值分別為在上次制動的基礎(chǔ)上增加一級制動、釋放制動、采用一級制動和采用最大制動級位;②限速狀態(tài),根據(jù)列車的當前速度與限速的關(guān)系相應(yīng)的取值分別為超過、低于或遠低于;③速度狀態(tài),根據(jù)列車的當前速度與檢索緩沖區(qū)中的速度經(jīng)驗的關(guān)系相應(yīng)的取值分別為偏大、偏小或等于;④走行距離狀態(tài),根據(jù)列車的當前走行距離與檢索緩沖區(qū)中的走行距離經(jīng)驗的關(guān)系相應(yīng)的取值為偏大、偏小或等于;⑤經(jīng)驗制動級位狀態(tài),根據(jù)檢索緩沖區(qū)中的經(jīng)驗制動級位的狀態(tài)相應(yīng)的取值為制動狀態(tài)或釋放狀態(tài).
輸出過程:通過思維決策過程得到進一步調(diào)整后的制動級位,將制動級位通過程序性知識模塊輸入到手控模塊,手控模塊進而將輸出的級位值傳遞給列車控制網(wǎng)絡(luò)系統(tǒng).
本文設(shè)計的高速列車停車控制算法共有17個產(chǎn)生式:①視覺感知過程需要感知到當前駕駛所需的視覺信息并向檢索緩沖區(qū)中發(fā)出檢索請求,有1個產(chǎn)生式;②記憶加工過程需要獲得調(diào)速階段中與當前駕駛相關(guān)的陳述性知識模塊中的駕駛經(jīng)驗組塊,有1個產(chǎn)生式;③思維決策過程和輸出過程,算法需要依據(jù)映像緩沖區(qū)的視覺信息和檢索緩沖區(qū)的駕駛經(jīng)驗組塊對列車的駕駛狀況進行判斷,并修改目標緩沖區(qū)的判斷結(jié)果組塊,根據(jù)不同的判斷結(jié)果調(diào)整級位,這部分在調(diào)速階段有11個產(chǎn)生式,在站停階段有4個產(chǎn)生式.
表3為本文停車控制算法的認知參數(shù)和一些任務(wù)相關(guān)參數(shù).認知參數(shù)與ACT-R認知結(jié)構(gòu)的子符號系統(tǒng)相關(guān),模擬了人類大腦的神經(jīng)計算過程,這些參數(shù)涉及到感知、記憶等方面,已經(jīng)經(jīng)過了先前研究者的認知實驗的驗證,因此本文的大多數(shù)參數(shù)直接采用默認參數(shù),只對部分參數(shù)做了調(diào)整,由于本文模擬的是高速列車司機,司機由于經(jīng)過了很多訓(xùn)練,對于某一條線路非常熟悉,相應(yīng)的司機面對新的駕駛情景的時候必然會從大腦中檢索的對應(yīng)的知識經(jīng)驗,激活閾值反映了人類記憶中知識的可用度,故將激活閾值設(shè)置為極小值.使得算法一定能夠得到最佳的“駕駛經(jīng)驗”知識,組塊中的瞬時噪聲也設(shè)置為0,使算法在回憶“駕駛經(jīng)驗”知識的時候沒有干擾;關(guān)聯(lián)強度反映了緩沖區(qū)中的當前內(nèi)容對檢索,就是回憶過程的影響設(shè)置值為0.9;衰減參數(shù)模擬了人類的記憶遺忘,反映人類對于某個知識的記憶水平隨著時間會不斷下降,該值采用默認值0.5.
表3 高速列車停車控制算法的部分參數(shù)值Tab.3 Parameters of brake control algorithm for high-speed train
同時本文也涉及到一些任務(wù)相關(guān)參數(shù),任務(wù)相關(guān)參數(shù)與具體的停車控制任務(wù)相關(guān),如調(diào)速與站停階段的劃分點,不同的列車司機可能不同,如速度、地理標志等,結(jié)合對列車司機的訪談以速度作為階段劃分的參考點,當列車速度低于劃分速度時開始執(zhí)行站停階段的控制策略,將劃分速度條件設(shè)置為20 km/h.
算法首先判斷列車當前速度,如果當前速度大于0,說明列車還未停車,則將目標緩沖區(qū)的目標設(shè)置為“開始”,同時將當前速度、當前限速、當前走行距離添加到映像緩沖區(qū)中,然后,開始產(chǎn)生式的匹配過程,程序性知識模塊會檢查所有處于激活狀態(tài)的模塊,并與該模塊中儲存的產(chǎn)生式的條件規(guī)則進行匹配,此時會匹配到目標模塊和映像模塊被激活的相應(yīng)產(chǎn)生式,該產(chǎn)生式觸發(fā)并執(zhí)行其行為規(guī)則,行為規(guī)則會修改該規(guī)則相關(guān)模塊緩沖區(qū)中的組塊內(nèi)容,此時相關(guān)模塊被激活,程序性知識模塊則會根據(jù)這些模塊的激活狀態(tài)匹配符合條件規(guī)則的下一個產(chǎn)生式,觸發(fā)該產(chǎn)生式并執(zhí)行其行為規(guī)則,依此類推,當所有模塊的狀態(tài)均不能匹配產(chǎn)生式的條件規(guī)則時,此時手控模塊獲得了當前駕駛情景下的級位決策并將級位輸出到列車控制網(wǎng)絡(luò),算法完成一次循環(huán).為了簡化算法,當前速度、當前限速、當前走行距離等視覺信息的獲取以及為了得到駕駛階段、限速狀態(tài)等而進行的速度比較、距離比較、級位比較等數(shù)值計算,未采用產(chǎn)生式規(guī)則實現(xiàn),而是采用將相關(guān)信息直接注入到映像緩沖區(qū)或者采用數(shù)值計算程序計算并將結(jié)果添加到目標緩沖區(qū)中的方法實現(xiàn).如下所示為高速列車停車對標控制算法:
算法:高速列車停車對標控制算法
while列車運行速度> 0do:
目標緩沖區(qū)←“開始”
映像緩沖區(qū)←當前速度、當前限速、當前走行距離
while有模塊處于激活狀態(tài) do:
if映像緩沖區(qū)激活 then
計算得到當前駕駛階段狀態(tài)、限速狀態(tài)
判斷結(jié)果組塊對應(yīng)槽←當前駕駛階段狀態(tài)、限速狀態(tài)
end if
if檢索緩沖區(qū)激活 then
計算得到速度狀態(tài)、距離狀態(tài)、經(jīng)驗制動級位狀態(tài)
判斷結(jié)果組塊對應(yīng)槽←速度狀態(tài),距離狀態(tài),經(jīng)驗制動級位狀態(tài)
目標緩沖區(qū)←判斷結(jié)果組塊
end if
匹配產(chǎn)生式的條件規(guī)則,獲得匹配產(chǎn)生式
執(zhí)行該產(chǎn)生式的行為規(guī)則,修改相關(guān)模塊緩沖區(qū)中的組塊內(nèi)容
end while
從手控模塊中獲得級位
end while
在實際駕駛過程中,人類司機的綜合駕駛績效普遍好于ATO自動控制算法,同時考慮到現(xiàn)有的自動駕駛系統(tǒng)大多采用PID控制算法[12].為了驗證本文停車控制算法的有效性,將本文實現(xiàn)的停車控制算法與PID控制算法、人類司機進行仿真對比分析.
仿真分析的初始條件如下,初始速度為270 km/h,初始制動級位為3級制動,停車運行時間為309 s,終點距離為9 155.7 m.該數(shù)據(jù)來源于京滬高速CR400AF型高速列車上海虹橋至北京南站的一次人類進站停車作業(yè)的駕駛記錄.由于駕駛記錄的原始數(shù)據(jù)沒有停車標的千米標,無法得到人類司機的實際停車精度,但考慮到人類司機的綜合駕駛績效普遍好于ATO自動控制算法,故本文假設(shè)人類司機的停車精度為0.CR400AF型高速列車的列車動力學(xué)模型通過實際駕駛數(shù)據(jù)擬合得到,限速曲線采用駕駛記錄中的實際數(shù)據(jù).根據(jù)線路情況和駕駛目標設(shè)置了一條理想優(yōu)化曲線用于PID算法的控制,通過多次試驗得到PID控制算法的控制參數(shù)值KP=25.12,Ki=4.23,Kd=0.1.
圖2所示為人類司機、本文停車控制算法和PID控制算法控制列車的運行速度對比,可知人類司機、本文停車控制算法與PID控制算法趨勢相近,三者均實現(xiàn)了既定的駕駛?cè)蝿?wù)目標.但是也可以看到PID控制效果相對更加光滑,本文停車控制算法其次,人類司機最不光滑,原因是PID控制算法追蹤的是一條理想曲線,具有最佳的制動減速度,故運行速度曲線更加的平滑.而本文算法人類司機都是依據(jù)“駕駛經(jīng)驗”和限速來進行判斷,控制過程中曲線較不平滑.
圖2 運行速度對比Fig.2 Comparison of running speed
圖3所示為3種控制方式的輸出加速度對比,圖4為本文停車控制算法與人類司機的輸出制動級位對比.可以看到,本文算法與人類司機在級位調(diào)節(jié)次數(shù)以及整體趨勢上更加接近,在調(diào)速階段調(diào)節(jié)次數(shù)相對較少,級位保持時間更長,這樣的操作會使得高速列車運行的更加平穩(wěn),而在站停階段調(diào)節(jié)次數(shù)有所增加,這種控制會使得列車有更高的停車精度.而PID為了實現(xiàn)精確的追蹤效果,全程級位調(diào)節(jié)非常頻繁.通過對司機訪談得知,優(yōu)秀列車司機的駕駛特點是:惰行時間長、牽引制動的切換次數(shù)少,這種操縱特點有利于舒適節(jié)能,故控車過程應(yīng)盡量惰行且減少控制次數(shù),本文算法很好地反映了這種趨勢.
圖3 輸出加速度對比Fig.3 Comparison of output accelerations
圖4 本文算法和人類司機輸出制動級位對比Fig.4 Comparison of the proposed algorithm and the output braking level of a human driver
表4所示為人類司機、PID控制算法和本文算法在各指標下的對比結(jié)果.沖擊率的計算公式為
(2)
式中:ai為控制器第i次的輸出加速度;n為總控制次數(shù).可以看到,人類司機、本文算法相比PID控制算法調(diào)整次數(shù)明顯較少,同時沖擊率也更低,顯然舒適度更高.停車精度人類高速列車司機最好,其次為本文算法,PID控制算法最低.人類司機、本文算法和PID控制算法在平均加減速度、運行時間上沒有太大差異,本文算法比規(guī)定運營時間早1.8 s,PID控制算法要晚0.1 s,這種時間誤差是實際運營中能夠接受的.綜合上述指標差異,人類司機在最少的控制次數(shù)下實現(xiàn)了舒適度最高、停車精度最高的駕駛績效,本文算法取得了接近人類司機的駕駛績效,而PID控制算法的控制績效相對較差.
表4 人類司機、本文算法以及PID控制 算法性能指標對比Tab.4 Comparison of performance indicators for human driver, the proposed algorithm, and the PID control algorithm
圖5 不同初始條件下本文算法的運行速度曲線對比Fig.5 Comparison of running speed curves of the proposed algorithm under different initial conditions
為進一步驗證本文算法在不同初始條件下的控制效果,設(shè)置了幾組不同的初始速度、目標距離條件.如圖 5所示為在不同的初始速度與走行距離條件下本文算法控制的列車運行速度曲線,可以看到在不同的初始條件下本文算法均能實現(xiàn)良好的停車控制.由表5也可以看到不同初始條件下調(diào)整次數(shù)、平均加速度以及沖擊率也相對穩(wěn)定,保持在合理的范圍內(nèi).停車精度均滿足規(guī)定的停車誤差范圍,且大多在30 cm范圍內(nèi),少數(shù)部分停車精度超過30 cm,但是沒有超過50 cm的標準,停車精度出現(xiàn)較大變化的原因可能與特定條件下對應(yīng)的陳述性知識模塊中的“駕駛經(jīng)驗”知識不完善有關(guān),由于本文算法控制列車的過程中,對級位的決策首先依賴陳述性知識模塊中的相關(guān)組塊,其次根據(jù)邏輯決策來對級位做出進一步修正,而不同的初始條件可能由于陳述性知識模塊中無法匹配到更好的“駕駛經(jīng)驗”組塊,會導(dǎo)致出現(xiàn)一定偏差.
表5 不同初始條件下本文算法的性能指標Tab.5 Performance indicators of the proposed algorithm under different initial conditions
1)本文算法模擬了人類司機在停車對標這一階段的認知信息處理過程,表現(xiàn)出了人類司機的駕駛特征.
2)本文算法在調(diào)整次數(shù)、舒適度以及停車精度上均優(yōu)于PID控制算法,綜合駕駛績效好于PID控制績效,在不同的初始條件下也能實現(xiàn)良好的控制效果,具有較好的適用性.
需要更進一步的研究司機駕駛作業(yè)的工作機制,采用腦成像等技術(shù)手段從機理層面優(yōu)化高速列車對標停車駕駛認知結(jié)構(gòu).在本文的算法實現(xiàn)中,陳述性知識模塊中的駕駛經(jīng)驗是一直保持不變,只能適用于較少的駕駛場景,后續(xù)需要考慮引入自學(xué)習方法,建立駕駛經(jīng)驗的動態(tài)更新及優(yōu)化機制.針對本研究存在的不足,如輸出的級位存在少數(shù)突變,導(dǎo)致加速度存在一些尖峰,未來研究可繼續(xù)對決策過程進行優(yōu)化,使輸出級位及加速度的變化更加平滑.