張海敏
(安徽工程大學 藝術(shù)學院,安徽 蕪湖 241000)
在對符號時間約束問題進行分析時,其難點在于應(yīng)當通過何種方式從流數(shù)據(jù)中有效的提取其中的嵌入信息,要求運用最佳的原始流數(shù)據(jù)分割方法[1-2].結(jié)合當前的研究成果能夠發(fā)現(xiàn),在當前已有的時間約束分析方法中,應(yīng)用最為普遍的為離散付式變換(DFT)[3-4]、分段聚合近似(PAA)[5]、自適應(yīng)分段常數(shù)近似(APCA)[6]等.在眾多符號表示方法中,都存在著其特有優(yōu)勢與不足.RLA實現(xiàn)了對此類問題的有效解決,對于上述問題中存在的缺陷進行了有效的完善,算法性能得到了提高,因此社會各界對該方法表示了極大的關(guān)注[7].但是這種方法也存在不足之處,僅能夠用于分析方差較小,這就難以實現(xiàn)對流數(shù)據(jù)細微特征的有效反映,甚至得到的結(jié)果可能為錯誤結(jié)果.
本文提出了基于時間約束層流特征矢量美術(shù)圖形符號化TCLC算法,將其應(yīng)用到流數(shù)據(jù)美術(shù)圖形符號過程中.通過流數(shù)據(jù)時間約束層流特征的均值與方差水平,實現(xiàn)對其”平均值”與”發(fā)散程度”的衡量指標,將時間約束符號視為矢量,得到與之相對的符號矢量.此時分析其“平均值”特征時,通過時間約束子段均值作為指標,方差水平則用以刻畫其發(fā)散程度.兩個分量的矢量和,則表示了該時間約束符號具有的總體特征.通過仿真實驗?zāi)軌虻贸?,與RLA算法相比,本文的TCLC算法表現(xiàn)出了更好的相似搜索效果.
在RLA算法中容易丟失重要的極值信息,為了改進這一不足,提出了TCLC算法,該方法的主要實現(xiàn)思路為;首先以各字符對應(yīng)時間約束子段的極大極小值視為新的字符表示,由此,原來的由一個RLA字符所表示的時間約束子段,此時變?yōu)橛?個字符進行表示.本文對此方案進行了驗證分析(見表1),結(jié)果發(fā)現(xiàn)該方法的效果也相對有限,主要是人為因素所導致的信息失真,同時給予符號數(shù)也擴大了,那么計算代價也會大大增加.故此,本文綜合相關(guān)的理論研究以及實踐結(jié)論,通過對其他方面進行改善以實現(xiàn)對RLA算法中信息丟失問題的有效解決.
表1 TCLC與RLA運行時間比較
基于對于大部分流數(shù)據(jù)而言,都可將其視為隨機序列,因此,時間約束分析可視為是對于觀測得到的時間約束的統(tǒng)計分析.并且可利用統(tǒng)計分析的均值和方差水平進行確認和分析.本文所提出的TCLC算法主要實現(xiàn)思路為:通過時間約束層流特征的均值與方差水平的分析,來對其平均值以及其具有的發(fā)散程度進行分析,此時,可將時間約束符號視為是一個矢量.由此,流數(shù)據(jù)美術(shù)圖形符號化的實現(xiàn)過程中,就相當于使得將時間約束子段進行轉(zhuǎn)化,得到對應(yīng)的符號矢量,其中含有兩個分量.兩個分量組成了矢量和,通過這種方式能夠從不同的角度對時間約束符號具有的特征進行分析.故此,能夠?qū)崿F(xiàn)對其特征的全面描述.本文的TCLC方法與RLA方法相比,能夠?qū)崿F(xiàn)更加詳細的描述,此時與之相對應(yīng)的數(shù)學描述為
(1)
(2)
上式中,Cj-1,Cj依次表示了第i個字符劃分區(qū)具有的下、上限.
則此時可將式(1)、式(2)落入不同的劃分區(qū)間的Xi,Si值進行轉(zhuǎn)化,得到與之相對的符號分量.此時,Xi表示第i個時間約束子段的均值,Si屬于相應(yīng)時間約束子段方差s:
(3)
本文考慮美術(shù)圖形符號化的具體實現(xiàn)過程,首先通過PAA方法實現(xiàn)降維,隨后求取方差,由此實現(xiàn)了預處理過程,此時可通過下式表述兩個原始時間約束A,B的歐氏距離
(4)
式中的d代表數(shù)據(jù)的維數(shù),相應(yīng)的預處理時間約束A′,B′的距離則為
(5)
能夠得出,預處理時間約束A′,B′的距離與A,B的歐式距離,兩者間是存在如下關(guān)系:
D(A,B)≥DR(A′,B′)
(6)
(7)
考慮到本文其中的符號包含兩個分量,可得出下面的式子:
(8)
在此基礎(chǔ)上,能夠得到與之相對的原始時間約束的具有的最小距離為
(9)
而且還可論證,在預處理時間約束和符號時間約束距離,兩者間是存在如下關(guān)系:
(10)
綜合考慮式(10)及式(6)可得
(11)
說明通過SFVS方法得到的符號距離,為與之對應(yīng)的歐式距離的下限.
本文通過實驗對本文算法進行有效的驗證,對于TCLC與兩RLA種方法的運行時間代價對比.經(jīng)過20次實驗之后得到表2中的均值結(jié)果,結(jié)果表明TCLC的計算代價要更大一些,具體表現(xiàn)為RLA方法的3倍左右.
經(jīng)過相似查詢實驗之后,對于RLA、TCLC兩種方法的分析,可以從其他角度對于兩種方法,各自的特征進行分析.用Brute_Force算法,能夠在流數(shù)據(jù)集T中或者說一定的范圍、或者閾值內(nèi),即可得到和給定長度標準子串Ti相匹配的子序列Tj.如圖1所示,屬于一個十分典型的案例.
如圖1(a)所示,代表了通過RLA方法時,得到了通過RLA方法進行相似性查詢時,得到的結(jié)果片段.在左圖中,屬于查詢串;右圖進行相似查詢時,能夠得到異常結(jié)果.圖1(b)表示的是對于同一數(shù)據(jù)集,進行近似查詢時,通過TCLC方法能夠確定.綜合上述分析能夠得出,其中有效避免了RLA方法中存在的不足.
(a)The RLA symbol is used for similar queries
(b)The TCLC symbol is used for similar queries
表2所示的為對表1中數(shù)據(jù)集進行異常檢測時,20次實驗的平均結(jié)果,為了簡化過程同時增強其可比性,在表2的3~6列表示的是在異常檢測實驗中,所得到的異常檢測漏檢率,以及進行相似查詢時得到的誤檢率.在7,8列則是對兩種方法具有的運行時間進行了記錄、分析.
表2 TCLC與RLA應(yīng)用比較
經(jīng)過本文實驗?zāi)軌虻贸觯疚牡腡CLC算法和RLA相比具有的整體性能更優(yōu),不管是在進行相似查詢亦或者是進行異常檢測,所得到的結(jié)果都是更優(yōu)的,結(jié)合表2中的3、4兩列能夠發(fā)現(xiàn),在異常檢測中,TCLC方法的漏檢率水平更低,要低于RLA方法,主要原因在于,當采用RLA方法來進行檢測時,本質(zhì)上是需要對兩個符號相對應(yīng)的時間約束子段平均值距離來進行檢測,假如該距離與閾值相比較小時,則此時能夠判定被檢測時間約束子段屬于正常的,而在TCLC方法中,盡管兩個符號對應(yīng)的均值分量都是小于閾值的,但是最后兩個符號的矢量距離可能大于閾值,此時的檢測結(jié)果出現(xiàn)異常.在表5、6兩列表示了進行相似查詢的實驗對比結(jié)果.最終顯示,TCLC的誤檢率更低,最起碼不會超過RLA方法.在表2中7,8列表示的是兩種算法具有的平均實驗運行時間.結(jié)果顯示,TCLC方法所增加的計算代價遠遠低于RLA方法.故此,基于計算代價以及算法精度兩個角度進行分析,能夠得出從綜合角度分析,TCLC算法比RLA算法要具有更好的性能,優(yōu)勢更加突出.
為了改進RLA方法在進行符號時間約束中存在諸多不足,本文提出了TCLC算法.在TCLC算法中,主要是加入了兩個時間約束層流特征分量使得RLA標量能夠經(jīng)過符號化處理轉(zhuǎn)化得到矢量符號.基于TCLC方法中,得到的描述信息更多.因此,在處理時間約束分析方面具有更好的優(yōu)勢,而且通過實驗對比,也驗證了該方法的有效性.
[1] KARAOULIS M,REVIL A,MINSLEY B,et al.Time-lapse gravity inversion with an active time constraint[J].Geophysical Journal International,2014,196(2):748-759.
[2] EISENBEISS M,WILKEN R,SKIERA B,et al.The interplay of discount and time constraint with product type[J].International Journal of Research in Marketing,2015,32(4):387-397.
[3] AN Y J,KIM Y D,CHOI S W.Minimizing makespan in a two-machine flowshop with a limited waiting time constraint and sequence-dependent setup times[J].Computers & Operations Research,2016,71:127-136.
[4] ROACH V,KRYKLYWY J,MITCHELL D,et al.Knowing Your Limits:How a Time Constraint May Impact Spatial Reasoning[J].The FASEB Journal,2015,29(1):689-695.
[5] BELLING P K,SUSS J,WARD P.The effect of time constraint on anticipation,decision making,and option generation in complex and dynamic environments[J].Cognition,Technology & Work,2015,17(3):355-366.
[6] BAGLOEE S A,ASADI M.Prioritizing road extension projects with interdependent benefits under time constraint[J].Transportation Research Part A:Policy and Practice,2015,75:196-216.
[7] PARK S,O’LEARY D P.A polynomial time constraint-reduced algorithm for semidefinite optimization problems[J].Journal of Optimization Theory and Applications,2015,166(2):558-571.