国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于積累周期分段編碼的汽車車窗防夾學(xué)習(xí)算法

2022-05-11 10:42:42馮富霞李森貴
關(guān)鍵詞:斜率分段均值

馮富霞,李森貴

(1.安徽工程大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 蕪湖 241000;2.蕪湖莫森泰克汽車科技有限公司 研發(fā)部,安徽 蕪湖 241000)

在金融、醫(yī)學(xué)、監(jiān)控等領(lǐng)域時(shí)間序列數(shù)據(jù)十分常見,精確并實(shí)時(shí)地判斷出序列流中的異常非常必要。異常判斷常用方法有數(shù)學(xué)分布、動(dòng)態(tài)時(shí)間回歸、概率后綴樹、預(yù)測(cè)對(duì)比[1]、強(qiáng)力搜索[2]等,理論依據(jù)主要有概率統(tǒng)計(jì)、鄰近度、判斷模型、回歸模型[3-4]、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。統(tǒng)計(jì)方法必須符合一定的數(shù)學(xué)分布;鄰近度法常使用距離或角度差判斷,編碼選擇的不同、差異對(duì)比技術(shù)選擇的不同對(duì)結(jié)果的影響較大;判斷模型、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)需要大量?jī)?nèi)存和運(yùn)算量;回歸模型參數(shù)復(fù)雜且參數(shù)敏感。

目前計(jì)算設(shè)備的硬件配置飛速提高,加之云技術(shù)的廣泛應(yīng)用,如果異常判斷基于以上的先進(jìn)設(shè)備及技術(shù),則不用考慮計(jì)算量、數(shù)據(jù)量。但在有些場(chǎng)景下硬件配置是受限制的,甚至配置很低,無法使用高復(fù)雜度的算法,如霧計(jì)算在某些場(chǎng)景下甚至只有霧滴孤軍奮戰(zhàn)。實(shí)時(shí)有效地判斷序列流異常的需求不會(huì)因場(chǎng)景不同而降低,例如汽車車窗防夾判斷,硬件配置極大受限,對(duì)防夾算法的運(yùn)算量、存儲(chǔ)量要求非常敏感,同時(shí)準(zhǔn)確度、實(shí)時(shí)性要求卻十分高,這促使工程人員不斷優(yōu)化算法。

目前防夾算法有回歸擬合跟隨法,文獻(xiàn)[5]先利用逆伽馬函數(shù)擬合,再利用殘差的正態(tài)分布檢測(cè)異常,適用于殘差符合正態(tài)分布的場(chǎng)景。文獻(xiàn)[6-7]使用轉(zhuǎn)矩線性擬合得到殘差使用閾值判斷。文獻(xiàn)[8]利用高斯濾波濾除部分噪聲,采用類似積分法對(duì)脈寬曲線進(jìn)行計(jì)算,將積分面積與閾值比較判斷,對(duì)脈沖的始末定位,周期變化敏感。以上都基于模擬系統(tǒng)信號(hào),文獻(xiàn)[5]需要?dú)埐罘险龖B(tài)分布,文獻(xiàn)[6-8]均利用信號(hào)計(jì)算車窗的機(jī)械受力,計(jì)算復(fù)雜量大,且防夾閾值確定只有文獻(xiàn)[7]給出了復(fù)雜推算方法。

利用數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的技術(shù),通過對(duì)大量實(shí)采數(shù)據(jù)的分析,依據(jù)數(shù)據(jù)蘊(yùn)含的規(guī)律設(shè)計(jì)了簡(jiǎn)單、可靠的防夾算法。前期通過對(duì)不同路況和時(shí)速下的25組數(shù)據(jù)進(jìn)行分析,每組3 000~5 000左右數(shù)據(jù)量,提出了跟隨周期均值顯著化序列異常數(shù)據(jù)的學(xué)習(xí)算法,詳見文獻(xiàn)[9],但是后期發(fā)現(xiàn)判斷出的防夾點(diǎn)混雜著少數(shù)因路況極度顛簸出現(xiàn)的誤防夾點(diǎn)。文獻(xiàn)[10-11]利用多種算法的融合實(shí)現(xiàn)序列數(shù)據(jù)的預(yù)測(cè)和異常檢測(cè)等,其中包括了分類算法和其有效性的證實(shí),據(jù)此,本問題的研究引入了分類算法,并且數(shù)據(jù)追加到50組深入研究,提出了改進(jìn)算法?;诜e累周期分段編碼的汽車車窗防夾學(xué)習(xí)算法,實(shí)現(xiàn)了簡(jiǎn)單、有效、實(shí)時(shí)地過濾信號(hào)流中的誤防夾點(diǎn)。

1 關(guān)鍵技術(shù)選擇與技術(shù)局限性問題的解決

時(shí)序序列編碼被廣泛應(yīng)用的主要有離散傅里葉變換(Discrete Fourier Transform,DFT)、奇異值分解(Singular Value Decomposition,SVD)、分段線性估計(jì)(Piecewise Linear,PLA)、符號(hào)編碼。DFT基本思想是把序列看成離散量,將其分解為正弦和余弦函數(shù)的線性融合函數(shù),從時(shí)域變換為頻域空間,對(duì)序列的平穩(wěn)性要求比較高;SVD通過求矩陣的特征矩陣實(shí)現(xiàn)序列的降維編碼,著眼全局?jǐn)?shù)據(jù),空間與時(shí)間復(fù)雜度最高;PLA最簡(jiǎn)單,使用廣泛,通過分段線性表示簡(jiǎn)約總序列,既保持了宏觀趨勢(shì)特征,又適當(dāng)保留了局部細(xì)節(jié),權(quán)衡主要由分段的長(zhǎng)短決定,適用閔可夫斯基距離度量子序列的相似度,文獻(xiàn)[12]證實(shí)PLA的分段聚合近似(Piecewise Aggregate Approximation,PAA)方式比DFT效率高出1~2個(gè)數(shù)量級(jí);符號(hào)法通過離散序列的值域空間實(shí)現(xiàn)序列的簡(jiǎn)約編碼,對(duì)于獲取序列的宏觀趨勢(shì)規(guī)律最合適,但是局部細(xì)節(jié)信息喪失太多,如布爾編碼。由于這里需要準(zhǔn)確、精確、實(shí)時(shí)地對(duì)序列流進(jìn)行區(qū)分,簡(jiǎn)單有效的需求下選取PAA編碼為依據(jù)。

(1)幅平移與幅伸縮問題。序列的慣性決定后續(xù)子序列起始點(diǎn)取值的差異以及形成的幅平移,而閔可夫斯基距離法對(duì)幅平移和幅伸縮敏感。這里采用子序列的均值差值、分段斜率編碼法,只保留與幅值無關(guān)的變化率,成功去掉了幅平移對(duì)結(jié)果的影響。兩組幅平移子序列如圖1所示。由圖1可知,兩組幅平移子序列,它們的形狀完全相同,如果用幅值編碼序列的方式進(jìn)行距離對(duì)比,兩者顯然不同,而用擬合直線的斜率編碼,它們的斜率相同,進(jìn)行距離對(duì)比結(jié)果正好相同。周期分段子序列斜率編碼如圖2所示。由圖2可知,編碼(1.5,0.633,0.52)可去幅平移,編碼與序列的起始點(diǎn)無關(guān),子序列均值差值編碼同理可以去除幅平移對(duì)結(jié)果的影響。幅伸縮正好是這里比較的依據(jù),需要保留。

圖1 兩組幅平移子序列 圖2 周期分段子序列斜率編碼

此時(shí)距離計(jì)算與時(shí)間維度無關(guān),即為閔可夫斯基距離公式。

2 汽車車窗序列數(shù)據(jù)特征分析與跟隨周期分段編碼

2.1 汽車車窗序列數(shù)據(jù)特征分析

這里的汽車車窗防夾序列數(shù)據(jù)包含霍爾信號(hào)和電壓信號(hào),先將兩類數(shù)據(jù)融合成一組數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)平滑處理。序列數(shù)據(jù)正常情況下沿某一均值上下震蕩,會(huì)出現(xiàn)均值上下浮動(dòng)現(xiàn)象,震蕩周期不均勻;防夾子序列數(shù)據(jù)幅值明顯高于正常數(shù)據(jù),屬于連續(xù)小幅波動(dòng)爬升過程;防夾點(diǎn)出現(xiàn)的判斷是障礙物受力超出100 N,因此,實(shí)際中防夾子序列只能取到初始爬升區(qū)域,不允許放任到最高值的出現(xiàn)。對(duì)比周期子序列的數(shù)據(jù)變化趨勢(shì)特征發(fā)現(xiàn),信號(hào)序列存在3類變化趨勢(shì)模式:緩爬升震蕩式、遞增爬升式、大幅爬升震蕩式,3種模式恰好代表正常情況、防夾情況、劇烈顛簸情況,具體如圖3所示。防夾子序列如果不加干預(yù)采集出的后續(xù)序列會(huì)繼續(xù)增大幅度爬升。因此防夾檢測(cè)即為分類問題,關(guān)鍵是找到分類依據(jù)和分類劃分標(biāo)準(zhǔn),同時(shí)在全局序列中抓取正常情況、防夾情況、劇烈顛簸情況的子序列。

圖3 序列的3種分類

通過以上分析可知,序列數(shù)據(jù)具有慣性,相似序列幅度變化因素使防夾點(diǎn)的閾值無法固定,所以去除慣性因素是算法的關(guān)鍵,劃分顯著是算法高準(zhǔn)確度的保障。前期根據(jù)跟隨周期均值差值算法有效去除慣性因素,依據(jù)幅度增長(zhǎng)積累可有效地劃分出正常序列,但是防夾序列與劇烈顛簸序列間存在重疊無法區(qū)分,需要利用新分類依據(jù)和劃分標(biāo)準(zhǔn)進(jìn)一步完善算法,通過以上特征分析決定利用幅度增長(zhǎng)率為分類依據(jù)探索再次分類特征。

2.2 利用幅度增長(zhǎng)率實(shí)現(xiàn)異常序列的分段編碼

要在前期算法的基礎(chǔ)上,實(shí)現(xiàn)劇烈顛簸和防夾情況的有效區(qū)分。由于原始子序列對(duì)應(yīng)的向量維數(shù)眾多(大約40~60維),維數(shù)與最佳跟隨周期的取值有關(guān),數(shù)據(jù)取值范圍大約在3 000~7 000,為了減小子序列距離計(jì)算的復(fù)雜度,需要進(jìn)行重新壓縮編碼,恰當(dāng)?shù)姆指铋L(zhǎng)度下,斜率編碼即可反應(yīng)序列的宏觀形態(tài),同時(shí)又保證子序列間的局部差異特征。

為了提取帶檢測(cè)子序列的幅度變化特征,斜率編碼的斜率計(jì)算需要對(duì)跟隨周期T進(jìn)行再次合理劃分。在波浪式變化下,3維斜率向量恰好可以反應(yīng)其形態(tài)特征。為了保障算法和跟隨周期起始點(diǎn)的選取不敏感,向后追加了1維同等份斜率,這要求跟隨周期寬度取值要合理,以免出現(xiàn)防夾子序列超出防夾力閾值的限制,前面防夾子序列的特征給出理由,這時(shí)即使判斷出防夾,也屬無效,或適當(dāng)減少追加的數(shù)據(jù)量。命名此序列編碼方式為4維編碼S(k1,k2,k3,k4)。

斜率計(jì)算的改進(jìn)。線性變化率可以用經(jīng)典的最小二乘法計(jì)算,如式(1)所示:

(1)

式中,α即為k,累計(jì)求和,累計(jì)次數(shù)范圍為1~T。斜率編碼的目的是刻畫變化趨勢(shì)特征,不要求百分百的精確,這里把跟隨周期T數(shù)據(jù)進(jìn)行3等分分段后,每分段數(shù)據(jù)元組對(duì)數(shù)量較少,每分段可再二等分分段,每小段求均值,利用二分段的中點(diǎn)計(jì)算斜率改進(jìn)式(1)。

設(shè)S((x1,y1),(x2,y2),…,(xT,yT)),則每分段的斜率

(2)

對(duì)比前面公式,運(yùn)算量以及存儲(chǔ)量明顯降低,在這里效果等同。隨機(jī)取一組T/3數(shù)據(jù)如表1所示。最小二乘法計(jì)算k為5.3,改進(jìn)公式計(jì)算為5.5,例如,隨機(jī)取T長(zhǎng)度子序列編碼為(1.5,0.63,0.5),如圖4所示。

表1 隨機(jī)取一組T/3數(shù)據(jù)

圖4 T/3數(shù)據(jù)每段的二分中點(diǎn)計(jì)算斜率形成的斜率編碼

3 正常序列、防夾編碼序列和劇烈顛簸編碼序列分類模型學(xué)習(xí)算法

3.1 利用跟隨周期子序列均值差值編碼分類正常和異常序列

利用跟隨周期均值顯著化序列異常數(shù)據(jù)的學(xué)習(xí)算法獲取最佳的子序列劃分長(zhǎng)度T,同時(shí)得到區(qū)分異常和正常子序列的跟隨周期均值差值的閾值α,T要達(dá)到符合防夾力閾值的要求。學(xué)習(xí)算法的主要思想:

(1)把訓(xùn)練數(shù)據(jù)集的每組整體信號(hào)序列按照周期T均勻劃分。

(2)計(jì)算每組分子序列的均值,得到每組整體序列的均值編碼

(3)T=T+Δt,重復(fù)(1)、(2)直到防夾子序列的漲幅積累最佳,同時(shí)正常子序列的漲幅積累要盡量與下降量抵消,α不再增加。驗(yàn)證等詳見參考文獻(xiàn)[9]。

分類正常和異常子序列。按照學(xué)習(xí)到的周期T劃分整個(gè)待測(cè)序列,計(jì)算每一子序列的均值得到編碼序列

3.2 防夾、劇烈顛簸序列分類特征閾值的訓(xùn)練算法與分析

4維編碼S(k1,k2,k3,k4)為一個(gè)向量,在[-90°,90°]斜率變化幅度內(nèi)以0°為中心,隨角度變化斜率急劇變化是距離可分的,且距離成中心擴(kuò)散分布狀態(tài)。閔可夫斯基距離可選其不同形式,以計(jì)算簡(jiǎn)單為目的這里選歐式距離和曼哈頓距離,通過實(shí)驗(yàn)對(duì)比可知,曼哈頓距離優(yōu)于歐氏距離。距離衡量需要有參照點(diǎn)和分類閾值,因此,需要事先通過歷史數(shù)據(jù)學(xué)習(xí)找到合理的參照點(diǎn)c和距離分類的閾值供車窗防夾判斷算法使用。

(1)利用跟隨周期法分理出防夾和劇烈顛簸序列集,每個(gè)子序列帶有分類標(biāo)簽l,0為劇烈顛簸分類,1為防夾分類。S異={s1{y1,y2,y3,…,y4T/3,l1},…,sn{y1,y2,y3,…,y4T/3,ln}};

選取部分?jǐn)?shù)據(jù)如表2所示,進(jìn)行實(shí)驗(yàn)驗(yàn)證。根據(jù)防夾序列距中心距離越收斂,劇烈顛簸序列距中心越發(fā)散,分類效果越好的原則,表中第2、第8初始點(diǎn)可為候選中心點(diǎn),但是防夾和劇烈顛簸序列距離的最大、最小值差值分別為8.1和-5.1,若2為中心點(diǎn)則兩類數(shù)據(jù)區(qū)分空間鮮明,而8為中心點(diǎn)則兩類數(shù)據(jù)有交叉重合區(qū)域,最終選2為中心點(diǎn)。同時(shí)對(duì)比閔可夫斯基歐式距離和曼哈頓距離兩種距離均值,曼哈頓距離使兩類分類分離性更好,準(zhǔn)確度更高,如圖5所示。ROC圖如圖6所示。經(jīng)過中心點(diǎn)選取算法和ROC分析可以獲得分類模型的中心點(diǎn)C和分類距離閾值r。

圖5 4編碼防夾序列、劇烈顛簸序列距8個(gè)參照中心的閔可夫斯基歐式和曼哈頓兩種距離均值

圖6 4編碼夫斯基歐式距離和曼哈頓距離 圖7 部分防夾序列、劇烈顛簸序列分類 分類的ROC圖 距分類中心C的距離分布

表2 防夾序列、劇烈顛簸序列距相應(yīng)初始點(diǎn)為參照中心的平均距離

3.3 防夾、劇烈顛簸序列的分類特征閾值的驗(yàn)證

在測(cè)試集里驗(yàn)證2.1中學(xué)習(xí)到的閾值和分類中心的效果,分別計(jì)算測(cè)試數(shù)據(jù)編碼序列與選定中心點(diǎn)C的距離如表3所示。距離分布如圖7所示??招狞c(diǎn)為劇烈顛簸序列與中心點(diǎn)距離,非空心點(diǎn)為防夾序列與中心點(diǎn)的距離,由圖7可見,兩類點(diǎn)有明顯的分類特征,且防夾序列距離中心的距離全部落在閾值之內(nèi)。分類距離不同閾值測(cè)試結(jié)果的評(píng)價(jià)指標(biāo)如表4所示。

表3 部分測(cè)試數(shù)據(jù)編碼序列與選定中心點(diǎn)C的距離

表4 分類距離不同閾值測(cè)試結(jié)果評(píng)價(jià)指標(biāo)

3.4 車窗行進(jìn)時(shí)霍爾信號(hào)序列流子序列的分類樹模型

圖8 霍爾信號(hào)序列流分類決策CART樹 圖9 車窗行進(jìn)時(shí)序列流的防夾判斷原理圖

4 車窗行進(jìn)時(shí)序列流的防夾判斷算法設(shè)計(jì)

4.1 算法工作原理

算法首先需要讀取并緩存待測(cè)序列流,進(jìn)行異常檢測(cè),如有異常,由異常分類特征分離出防夾或劇烈顛簸,防夾情況則進(jìn)行防夾處理,所有其他情況通知緩管道模塊讀取并更新相應(yīng)數(shù)據(jù),工作原理圖如圖9所示。

4.2 具體算法步驟

算法的必要數(shù)據(jù)設(shè)計(jì)需要緩存待測(cè)序列數(shù)據(jù)流,緩存數(shù)據(jù)的個(gè)數(shù)為2T,且為整數(shù),T為跟隨周期,設(shè)為s1(y1,y2,y3,…,yT)和s2(y1,y2,y3,…,yT);緩存序列編碼后的一個(gè)子序列,設(shè)為s′(k1,k2,k3,k4),包含4個(gè)實(shí)數(shù);參照中心序列(與s′相同編碼的序列且有初始值),設(shè)為c(k1,k2,k3,k4);異常判斷閾值為1個(gè)整數(shù),設(shè)為α;分類判斷距離閾值為1個(gè)整數(shù),設(shè)為r。防夾算法的具體步驟:

(1)讀取2T個(gè)待測(cè)序列信號(hào)預(yù)處理后,分別存入s1、s2;

(2)計(jì)算s1、s2的均值之差,如果大于閾值α,則出現(xiàn)異常,跳到步驟(5);

(4)進(jìn)行防夾處理,跳到步驟(1);

(5)s1=s2,重新讀取待測(cè)序列信號(hào)預(yù)處理后存入s2,返回步驟(2)。

由于參數(shù)T、α、c、r為離線訓(xùn)練得到,真正防夾算法的時(shí)間、空間復(fù)雜度小于o(3T),實(shí)驗(yàn)得出T為均小于80的整數(shù)。

5 結(jié)語

基于積累周期分段編碼的汽車車窗防夾判斷算法,利用數(shù)據(jù)本身蘊(yùn)含的規(guī)律有效地提高了實(shí)時(shí)防夾檢測(cè)的準(zhǔn)確率,同時(shí)對(duì)外界干擾抵抗力良好,算法時(shí)間空間復(fù)雜度低,防夾定位穩(wěn)定,對(duì)序列幅度數(shù)據(jù)的統(tǒng)計(jì)分布無要求;對(duì)于軟件設(shè)計(jì)人員無需清楚硬件原理和復(fù)雜的車窗受力推導(dǎo)計(jì)算,只需關(guān)注信號(hào)的數(shù)據(jù)規(guī)律和軟件設(shè)計(jì)。其簡(jiǎn)單高效、魯棒的特點(diǎn),尤為適宜實(shí)時(shí)監(jiān)測(cè)硬件受限的應(yīng)用場(chǎng)景,但是序列的時(shí)序維度要滿足均勻分布的要求,例如點(diǎn)擊事件序列流數(shù)據(jù)不適用。

猜你喜歡
斜率分段均值
一類連續(xù)和不連續(xù)分段線性系統(tǒng)的周期解研究
物理圖像斜率的變化探討
物理之友(2020年12期)2020-07-16 05:39:16
分段計(jì)算時(shí)間
求斜率型分式的取值范圍
基于子孔徑斜率離散采樣的波前重構(gòu)
3米2分段大力士“大”在哪兒?
太空探索(2016年9期)2016-07-12 10:00:04
均值不等式失效時(shí)的解決方法
MMC-MTDC輸電系統(tǒng)新型直流電壓斜率控制策略
均值與方差在生活中的應(yīng)用
關(guān)于均值有界變差函數(shù)的重要不等式
洪雅县| 翁牛特旗| 美姑县| 化州市| 泗阳县| 土默特右旗| 荣昌县| 建昌县| 巴南区| 萍乡市| 白朗县| 新泰市| 建水县| 专栏| 新津县| 阿坝| 峨边| 双江| 科技| 开原市| 牡丹江市| 上饶市| 乐平市| 桐庐县| 嘉善县| 中宁县| 惠水县| 明光市| 米泉市| 闽侯县| 若羌县| 南靖县| 成安县| 通许县| 伊吾县| 家居| 长乐市| 乐陵市| 江安县| 出国| 玉龙|