萬子健,李連營,楊 敏,周校東
1. 武漢大學資源與環(huán)境科學學院,湖北 武漢 430072; 2. 地理信息工程國家重點實驗室,陜西 西安 710054
軌跡數據由定位設備實時記錄并上傳產生,描述移動對象的時空位置信息。隨著網絡及定位技術的普及,多種途徑匯集形成的眾源軌跡數據成為地理大數據的重要部分。這種眾源軌跡數據具有來源廣泛、時效性強、隱含特征豐富等特點,對交通流量分析[1]、出行模式挖掘[2]、智能位置推薦[3]等具有重要價值。在地理數據更新領域,大量的車輛軌跡數據背后蘊含了道路分布、交通條件(如車流量、通行限制)、設施興趣點(如加油站、停車場)等最新信息,提取上述隱含信息并實施數據建庫與一致性更新,對于解決當前基礎測繪數據更新維護面臨的技術手段單一、效率低、成本高等問題有積極意義。
利用車輛軌跡數據提取道路分布信息是當前的研究熱點,存在兩種不同的解決思路。第1種是采用柵格化思想[4-7],對軌跡點分布空間進行剖分形成密度圖,利用核密度估計等方法提取道路分布的平面區(qū)域,然后通過形態(tài)分析操作(如骨架化)獲得道路結構線。該類方法優(yōu)點在于可以充分利用圖像處理領域積累的成熟技術。然而,受柵格單元大小、軌跡點分布密度不均衡等因素影響,局部區(qū)域提取的道路線容易出現連接破碎,需要后期進行一致性維護補救。第2種是矢量化處理策略,以軌跡點(或軌跡線段)為基本單元,通過統(tǒng)計聚類方法探測道路分布特征。例如,文獻[8—11]利用k-means方法結合距離、航向指標對軌跡點進行聚類,在此基礎上通過不同的聚類簇處理策略生成道路弧段。文獻[12]采用Douglas-Peucker算法[13]探測關鍵軌跡點,然后采用DBSCAN方法對關鍵軌跡點進行迭代式聚類提取道路交叉口。文獻[14—15]設計了力學模型剔除異常軌跡點,然后利用局部G統(tǒng)計熱點分析方法提取道路網結構。文獻[16]考慮角度變化、時長間隔提取轉向點對,在空間聚類方法支持下獲得轉向點對簇,繼而獲得道路網交叉口結構信息。文獻[17]引入約束Delaunay三角網探測軌跡點空間集聚性,通過軌跡點的空間剖分面積以及相鄰軌跡點距離實現道路邊界的精確提取。為提高道路生成過程效率,相關學者還提出增量式的處理策略。例如,文獻[18]通過建立軌跡數據與參考路網間的位置、語義關系漸進式地生成道路信息。文獻[19]將空間認知規(guī)律引入到軌跡線提取路網過程中,基于Delaunay三角網構建軌跡線融合處理模型,通過不斷修正細化獲得完整的道路網信息。與第1種思路相比較,上述方法不僅利用車輛軌跡的空間分布特征,而且能夠獲得移動方向、速度等隱含的動力學特征支持。
從圖論角度看,道路網由道路交叉口和連接交叉口的道路弧段構成。其中,交叉口的識別與提取是道路網生成的關鍵步驟。車輛移動過程中,道路交叉口區(qū)域產生的軌跡路徑在形態(tài)結構、轉向幅度、速度變化、停留時長方面與其他區(qū)域存在顯著差異。然而,已有方法大多將軌跡點作為基本分析單元,對局部軌跡路徑體現的形態(tài)及動力特征變化的缺乏有效考慮,同時如何集成不同類型參量進行綜合決策也是面臨的難題?;谏鲜鲇^察以及研究現狀分析,本文提出了一種利用車輛軌跡提取道路交叉口特征的方法。首先,分析交叉口的變道軌跡片段與常規(guī)非變道軌跡片段間的差異,并定義曲直比、轉向角度、行駛速度三個描述參量;然后,利用決策樹方法構建多因子決策的軌跡片段分類模型,并結合移動開窗式的軌跡線剖分模型建立交叉口區(qū)域變道軌跡片段提取方法;最后,基于相似性原則對交叉口區(qū)域軌跡片段實施聚類,并提取軌跡片段簇中心線獲得交叉口結構信息。利用多個城市的車輛軌跡數據作為試驗測試數據,通過對比式評估驗證本文方法的有效性,并對方法的不足之處進行了深入分析。
為了準確描述本文所提出的方法,首先給出以下定義:
定義1 軌跡線(T):由一系列按時間次序排列的點集構成,即T={p1,p2,…,pn}(n≥2)。其中,pi=(xi,yi,ti),xi和yi為軌跡點pi的空間坐標,ti表示pi產生的時間信息。
定義2 軌跡片段(TS):由軌跡線T上部分連續(xù)軌跡點構成,如TS(pl,pm)={pl,pl+1,…,pm}(1≤l 定義3 軌跡直線段(e):由相鄰軌跡點組成的直線段,例如ei表示軌跡點由pi和pi+1連接而成的直線段。 特別地,根據軌跡點和直線段的關系,上文中軌跡線T和軌跡片段TS也可對應表示為{e1,e2,…,en-1}和{el,el+1,…,em-1}(1≤l 道路交叉口是兩條或兩條以上道路實體交匯銜接處,如圖1(b)—(e)列出的幾種典型道路交叉口結構。道路交叉口在整個交通運輸過程扮演重要角色,是車輛實現匯集、疏散、行駛道路變更轉換的關鍵區(qū)域。在道路實體建模與表達中,交叉口對應道路網絡中連接不同道路弧段的結點。本研究將車輛在交叉口區(qū)域變道過程產生的軌跡片段稱為變道軌跡片段。如圖1(a)所示,車輛從pi點開始進入交叉路口至pj點駛出,完成了從道路R1至R2的變道轉換,pi、pj兩點間的軌跡片段即稱為變道軌跡片段(記為LC_TS(pi,pj))。受道路物理結構和車輛交匯影響,道路交叉口發(fā)生的變道行為使得車輛運行狀態(tài)產生變化。這種變化直接反映在變道軌跡片段的幾何形態(tài)、隱含動力學特征上。具體地,本文定義以下幾個參量描述變道軌跡片段與非變道軌跡片段間的差異性。 圖1 道路交叉口與變道軌跡片段(紅色)示例Fig.1 Samples of road intersection and lane-changing trajectory segment 1.1.1 直曲比 與同一道路上行駛產生的軌跡片段相比較,變道軌跡片段最直觀的差異表現在幾何形態(tài)上,即車輛通過交叉口時行駛軌跡彎曲程度明顯增大。這種彎曲程度可通過直曲比進行描述。軌跡片段TS(pl,pm)的直曲比定義如下 (1) 式中,Len(pi,pj)表示軌跡點pi和pj間的直線段長度。以圖2(a)所示某車輛產生的軌跡線為例,從p1開始分析移動窗口內軌跡片段的直曲比(圖2(b)),可以發(fā)現同一路段行駛時軌跡片段直曲比接近1,而在道路交叉口變道階段的軌跡片段直曲比出現異常波動。除少數特殊結構道路和交通狀況外(如車輛非正常轉向),軌跡片段直曲比越小,所在區(qū)域為道路交叉口的可能性越大。 圖2 軌跡片段直曲比分析Fig.2 Curvature analysis of trajectory segments 1.1.2 轉向角度 車輛在道路交叉口完成變道行為時伴隨行駛方向的顯著變化。這種變化可以通過軌跡片段起點與終點間的轉向角度進行度量。如圖3(a)所示,軌跡片段TS(pl,pm)在起始點pl處的航向角度為θl,終止點pm處用其前一個點pm-1的航向角度近似代替,即θm-1,則TS(pl,pm)的轉向角度計算如下 Δθ=|θm-1-θl| (0°≤Δθ≤180°) (2) 式中,pi處航向角度定義為正北方向與車輛行駛方向間沿順時針的夾角。圖3(b)展示了圖3(a)所示移動窗口包含軌跡片段的轉向角度。可以發(fā)現,同一道路上行駛時軌跡片段轉向角度較小(≤30°),而在交叉口區(qū)域軌跡片段轉向角度較大(≥60°)。 1.1.3 行駛速度 道路交叉口銜接路段呈顯著彎曲結構,車輛需要降低行駛速度,同時,不同方向車輛需要交互完成變道行為,導致車輛低速甚至短暫停止移動。因此,軌跡片段隱含的速度特征可以作為區(qū)分變道軌跡片段與非變道軌跡片段的又一有效指標。假設相鄰軌跡點間車輛運動速度均勻,軌跡片段TS(pl,pm)隱含的速度計算如下 (3) 式中,v(pi)表示車輛經過pi時的速度,可由pi與pi+1間的距離和時間間隔計算得到。如圖4(a)所示,車輛經過W2和W5區(qū)域時均發(fā)生大幅度轉向變化,僅通過直曲比、轉向角度難以區(qū)分變道轉向和非變道轉向。從圖4(b)所示的速度變化看,W2處行駛速度較大,而道路交叉口的W5處行駛速度出現谷值。 圖3 軌跡片段轉向角度分析Fig.3 Turning angle analysis of trajectory segment 圖4 行駛速度分析Fig.4 Speed analysis of trajectory segments 變道軌跡片段識別面臨兩個難點問題。一方面,單一指標難以準確區(qū)分變道軌跡片段與非變道軌跡片段,需要集成幾何形態(tài)、轉向幅度、速度變化進行綜合判斷。例如,受交通堵塞等因素影響,非道路交叉口區(qū)域車輛也可能以較低速度行駛;局部道路呈現彎曲形態(tài)分布,導致軌跡片段轉向角度較大。另一方面,作為完整軌跡線的一部分,變道軌跡片段準確識別需要專門的軌跡線剖分模型進行支撐。針對上述問題,本研究設計了一種移動開窗策略與決策樹學習分類相結合的變道軌跡片段識別模型。 1.2.1 基于移動開窗的軌跡線剖分模型 以軌跡線起始點為錨點,創(chuàng)建大小為s的窗口w,以步長μ移動窗口,直至完整遍歷該軌跡線。其中,s定義為窗口包含的軌跡直線段數量,μ定義為窗口移動前與移動后錨點間的軌跡直線段數量。在窗口移動過程中,記錄每一位置狀態(tài)下窗口包含的軌跡片段,作為后續(xù)變道軌跡片段識別的基本單元。圖5中軌跡線T={e1,e2,…,e12},設置大小s為3、移動步長μ為1的移動窗口,則產生軌跡片段TS1={e1,e2,e3}、TS2={e2,e3,e4}、…、TS10={e10,e11,e12}。窗口尺寸設置需考慮道路交叉口區(qū)域大小及通行條件。假設軌跡點采樣間隔為1 s,常規(guī)條件下交叉口車輛完成變道過程耗時約為5 s,則窗口尺寸可設置為5。窗口移動步長越小,則變道軌跡片段位置識別的準確性越高。 圖5 基于移動開窗策略的軌跡線剖分處理Fig.5 Trajectory subdivision using a sliding window method 1.2.2 基于決策樹學習的軌跡片段分類模型 如前文所述,區(qū)分變道軌跡片段與非變道軌跡片段需要綜合考慮多重特征,可采用機器學習方法構建分類模型。決策樹學習是機器學習領域應用最為廣泛的分類學習方法之一[20],其本質是通過歸納推理構建樹狀結構的分類規(guī)則組合。樹結構從根節(jié)點到葉節(jié)點的每一條路徑代表一條分類規(guī)則,路徑內部結點對應某個特征的測試,葉節(jié)點對應規(guī)則的分類結果。與神經網絡等其他監(jiān)督學習方法構建的分類器相比較,決策樹具有分類速度快、效率高、無須對輸入數據進行標準化處理的優(yōu)點。同時,決策樹表達的分類規(guī)則視覺直觀、解譯性強易于移植(如轉換為If-Then形式)。在地理信息領域,決策樹方法已廣泛應用于道路網結構識別[21]、地圖數據變化探測與更新[22]、空間數據匹配融合[23]等問題。決策樹構建可采用算法包括ID3、C4.5、CART,其中CART算法具有準確率高、計算量小、操作簡單靈活,能夠從復雜樣本數據抽象出清晰易解譯的分類規(guī)則。CART決策樹模型構建包括生成和剪枝兩個步驟:①根據訓練數據廣延地生長決策樹;②基于最小復雜性代價準則[24]對已生成的決策樹實施剪枝,并使用測試數據驗證,選擇最優(yōu)子樹。 本文采用決策樹CART算法構建道路交叉口變道軌跡片段和非變道軌跡片段的分類模型。CART決策樹屬于監(jiān)督分類方法,需要提供訓練樣本進行模型構建與評價。針對軌跡線T包含的某一軌跡片段TS(i),按1.1節(jié)定義的參量(即直曲比、轉向角度、行駛速度)構建如下數組 L(TS(i))=(Cur(TS(i)),Cur(TS(i-1)), Cur(TS(i+1)),Δθ(TS(i)),Δθ(TS(i-1)),Δθ(TS(i+1)),v(TS(i)),v(TS(i))- v(TS(i-1)),v(TS(i))-v(TS(i+1)),R) 式中,TS(i-1)和TS(i+1)分別表示與TS(i)相鄰的前、后軌跡片段;R為標簽向量,表示軌跡片段類別(標識為“Y”(屬于變道軌跡片段)或者“N”(屬于非變道軌跡片段))。表1所示為歸一化后的樣本數據組織格式。 表1 樣本數據組織格式 1.2.3 變道軌跡片段提取過程 基于移動開窗剖分模型和樣本數據訓練得到的決策樹分類器,從完整軌跡線提取變道軌跡片段的過程設計如下: (1) 針對移動窗口產生的每一條軌跡片段,計算當前軌跡片段以及其前、后窗口內軌跡片段的直曲比、轉向角度、行駛速度參量值(若為起/止軌跡片段,則將其前/后窗口內軌跡片段參量值置空),輸入分類器進行類型識別。進一步將分類結果作為屬性標注到該軌跡片段包含的每一條軌跡直線段上。如圖6(b)所示,軌跡直線段e1、e2、e3構成的軌跡片段判定為“N”(即非變道軌跡片段),則e1、e2、e3各自增加一個“N”的類型標識。 (2) 依次遍歷軌跡線包含的所有軌跡直線段,對于每條軌跡直線段統(tǒng)計其記錄的所有類型標識。若“Y”數量大于等于“N”數量,則將該軌跡直線段最終標識為“Y”;否則,該軌跡直線段最終標識為“N”。如圖6(c)中e4的屬性標識為(“Y”,“N”,“N”),則最終標識為“N”;e5的屬性標識為(“Y”,“Y”,“N”),則最終標識為“Y”。 (3) 將相鄰且標識為“Y”的軌跡直線段進行連接組織,最終輸出變道軌跡片段。如圖6(d)所示一個變道軌跡片段LC_TS={e5,e6,…,e9}。 圖6 變道軌跡片段提取過程Fig.6 The process of lane-changing trajectory segment extraction 進一步,對交叉口區(qū)域的軌跡片段實施相似性聚類形成軌跡片段簇,并提取同一組軌跡片段的中心線作為道路結構線。軌跡片段間相似性由包含軌跡點間的位置關系決定。Hausdorff距離是描述兩組點集相似程度的一種度量指標,但集合中的元素是無序的,忽略了軌跡點在時間維上的有序性。文獻[25]提出了改進Hausdorff距離,一方面利用平移常量消除了軌跡片段間的公共偏差;另一方面依據時間順序進行軌跡點間的比較,符合軌跡的時序特征。如圖7(a)所示,軌跡片段TS(A)和TS(B)間Hausdorff距離計算如下 (4) 式中,H表示Hausdorff距離;⊕是一個集合運算符號(A⊕g={a+g|a∈A});函數Len計算軌跡點間的距離;平移常量g定義為兩條軌跡片段間時間同步軌跡點距離的平均值。當兩條軌跡片段間Hausdorff距離小于設定閾值,則判定兩者屬于同一軌跡片段簇。 提取完整的道路交叉口結構,需要得到兩個不同層面的軌跡片段聚類結果。一是與道路線相對應的軌跡片段簇,包括變道軌跡片段簇和未發(fā)生變道行為的直行軌跡片段簇;二是屬于不同交叉口區(qū)域的軌跡片段簇的集合。依據變道軌跡片段識別結果,獲得上述兩個層面聚類結果步驟如下: (1) 基于Hausdorff距離h對變道軌跡片段進行聚類,得到變道軌跡片段簇。聚類結果如圖7(b)所示,同一種顏色表示的軌跡片段屬同一簇。 (2) 針對每一變道軌跡片段簇,取所有軌跡片段兩側端點坐標的平均值作為定位點;然后,依據歐氏距離閾值h′對定位點進行聚類分組,獲得屬于同一交叉口的變道軌跡片段簇。 (3) 對于每一個道路交叉口,取所有軌跡片段簇定位點的中心位置作為交叉口的中心點O,按交叉口范圍取大不取小原則[16],選取定位點與O距離最大值作為交叉口范圍半徑R(如圖7(c)所示);利用交叉口范圍圓裁切經過該區(qū)域的非變道軌跡片段,依據Hausdorff距離h聚類成簇(如圖7(d)所示),最終得到該交叉口區(qū)域所有的變道軌跡片段簇和非變道軌跡片段簇。 圖7 道路交叉口區(qū)域軌跡片段聚類Fig.7 Clustering of trajectory segments in an area of road intersection 針對每一組軌跡片段簇,通過一種迭代式策略提取中心線作為道路弧段[26],從而獲得交叉口道路結構特征。假設軌跡片段簇C={TS1,TS2,…,TSm}(m>1),中心線提取方法如下: (1) 隨機選擇軌跡片段簇C中一條軌跡片段作為初步的中心線CL。如圖8(a)所示,C={TS1,TS2,TS3},CL=TS={p1,p2,p3,p4}。 (2) 以CL包含軌跡點為分組種子點,其他軌跡片段的軌跡點按照距離最近原則分別匹配到不同種子點,形成軌跡點分組并按種子點時間次序排列。如圖8(b)所示,按次序形成軌跡點分組G1、G2、G3、G4。 圖8 軌跡片段簇中心線提取方法Fig.8 Extracting center line of a cluster of trajectory segments (3) 計算每一分組軌跡點的中心位置點(圖8(c)),按次序連接成線后更新原來中心線CL。如圖8(d),更新后CL={cp1,cp2,cp3,cp4}。 (4) 重復步驟(2)和(3),直至CL更新前后不再發(fā)生變化。最后,輸出CL作為軌跡片段簇的中心線。 如圖9所示,試驗數據包括德國科隆市城區(qū)車輛移動軌跡數據集[27]、芝加哥校園巴士軌跡數據集和武漢市部分出租車的軌跡數據集。原始軌跡數據實施如下預處理:①按車輛組織軌跡點,依據時間次序連接形成軌跡線;②當相鄰軌跡點時間間隔大于30 s時(如在高層建筑、隧道等區(qū)域),對軌跡線實施打斷處理;③過濾速度異常(大于200 km/h)的軌跡點。表2描述了上述預處理工作后的車輛軌跡數據情況。相比較而言,來自科隆和芝加哥的軌跡數據定位誤差小,道路上軌跡點分布密度高、車輛行駛速度相對均勻;武漢市出租車軌跡數據定位誤差較大,且存在大量低速行駛點以及停留點。考慮到不同數據集間車輛行駛速度、軌跡點采樣頻率存在差異,變道軌跡片段提取時對軌跡線進行線性加密[28],加密間距dl=10 m。 建立ArcGIS與Matlab相結合的試驗軟件平臺。其中,ArcGIS平臺負責軌跡數據預處理、軌跡片段參量計算、軌跡簇生成及中心線提取等工作,利用Matlab提供的決策樹學習模塊建立變道軌跡片段識別模型。試驗參數設置如下:①綜合考慮車輛行駛速度、道路交叉口范圍大小、相鄰軌跡點時間間隔等,經過多次試驗反饋,設置移動窗口大小s=9,窗口移動步長μ=1;②設置軌跡片段聚類的Hausdorff距離閾值h=10 m,軌跡片段簇定位點聚類的歐氏距離h′=80 m。 圖9 試驗軌跡數據集Fig.9 Experimental trajectory datasets 表2 試驗軌跡數據描述 在構建軌跡片段決策樹分類模型時,以人工標注方式疊加OpenStreetMap道路數據構建樣本數據。綜合考慮3種不同軌跡數據集的數據規(guī)模、采樣精度,以及分類模型交叉驗證的需要,從科隆數據集提取數量為1500的樣本數據。其中,變道軌跡片段與非變道軌跡片段數量比例約1∶3,涵蓋各種典型的道路交叉口以及非交叉路口區(qū)域。對樣本數據進行歸一化處理后,按照80%和20%的比例劃分為訓練數據集和測試數據集。圖10是基于訓練數據學習得到的軌跡片段決策樹分類模型,包括6個層級,19個葉節(jié)點。利用測試數據進行驗證,該模型對軌跡片段分類的準確率達到96.1%。 圖11展示了不同軌跡數據集通過分類器提取的變道軌跡片段及道路交叉口結果。圖中綠色圈形表示變道軌跡片段識別較為完備的交叉口區(qū)域(TruePositive)、黃色矩形表示非道路交叉口但存在識別為變道軌跡片段的區(qū)域(FalsePositive)、紅色三角形表示變道軌跡片段識別與實際不符的交叉口區(qū)域(FalseNegative)。圖11右側分別為3個軌跡數據集識別得到的變道軌跡片段和交叉口結構示例。定義精確率(precision)和召回率(recall)對交叉口識別提取結果進行量化分析,precision和recall計算公式如下 (5) (6) 式中,Num_TruePositive、Num_FalseNegative和Num_FalsePositive分別表示識別結果為TruePositive、FalseNegative和FalsePositive的數量。將本文方法與轉向點對法[16]和局部G統(tǒng)計法[14]進行對比評價。其中,轉向點對法轉向角閾值取45°,完成一次轉向最大時間間隔設為20 s,轉向點對相似度聚類閾值取0.75,局部點連通性聚類鄰域半徑取35 m;局部G統(tǒng)計法中交叉口候選軌跡點G*閾值取1.95。表3統(tǒng)計了3種方法應用到不同軌跡數據集的交叉口識別結果。從中可以發(fā)現: (1) 本文建立的交叉口提取模型對科隆和芝加哥數據集識別結果較好,精確率和召回率接近(或超過)90%,而應用到武漢數據集的交叉口識別精確率和召回率分別為62.7%和70.6%。分析原因:一方面武漢數據的定位精度較低,車輛變道產生的軌跡路徑與實際位置偏移較大,導致出現大量軌跡點在一定范圍內“抖動”的情況,對變道軌跡片段識別及道路線提取產生干擾;另一方面,決策樹學習的樣本數據來自科隆數據,構建的分類模型對于科隆數據以及質量特征(如軌跡點定位精度、采樣頻率)相似的芝加哥數據效果較好,而武漢數據由于樣本學習不足導致分類器識別效果不佳。 圖10 構建的軌跡片段分類決策樹模型Fig.10 Decision tree model constructed for trajectory segment classification (2) 面對采樣頻率高、定位精度較好、同時軌跡點分布密集的軌跡數據(如科隆和芝加哥數據集),3種方法均能取得較高的精確率和召回率;而應用到采樣頻率較低、定位精度不佳,有效軌跡點分布相對稀疏的情形(如武漢數據集),本文方法相比較轉向點對法和局部G統(tǒng)計法有較大提升。局部G統(tǒng)計法通過挖掘軌跡點轉向角的局部相關性,找到大轉向角軌跡點分布密集的熱點范圍作為交叉口候選區(qū)域,對軌跡分布密集的交叉口有較好的識別效果,但易漏識別軌跡分布稀疏的交叉口。轉向點對法通過提取車輛變道過程產生的完整轉向特征進行分析,面對低精度軌跡數據時具有一定的抗干擾性,從而提升交叉口識別效果。本文方法除考慮轉向特征外,進一步增加幾何形態(tài)和速度變化指標,并且利用移動開窗策略對軌跡剖分片段進行連續(xù)式分析,對局部軌跡點存在的誤差起到平滑過濾效果,從而能夠更加準確地探測道路交叉口變道軌跡特征,得到相對較高的交叉口識別精確率與召回率。 表3 試驗結果統(tǒng)計 本文方法產生的錯誤實例,主要包括兩種不同的情形。 圖11 變道軌跡片段識別與交叉口結果提取Fig.11 Lane-changing segments recognition and intersection structure extraction (1) 漏識別,即交叉口結構整體或部分丟失。該類問題常見于Y型交叉口(圖12(a))和大型立交橋區(qū)域。該類區(qū)域車輛行駛產生的轉向及速度變化不顯著,難以準確提取變道軌跡片段。此外,部分交叉口區(qū)域軌跡數據分布稀疏(圖12(b)),雖能從中獲得少量變道軌跡片段,但其數量不足以形成有效的變道軌跡片段簇,從而導致交叉口特征未被完整識別。 (2) 結構不準確,即交叉口識別結果與實際分布狀態(tài)間存在不一致。如圖12(c)所示,對于交叉口分布密集且間距較小情況,當移動窗口尺寸設置偏大時,本文方法難以準確提取個體交叉口結構。此外,圖12(d)所示區(qū)域軌跡點定位誤差較大時,導致軌跡片段直曲比、轉向角和行駛速度計算結果失真,從而引起變道軌跡片段的錯判以及對后續(xù)交叉口結構提取產生負面影響。 圖12 交叉口識別錯誤示例Fig.12 Samples of incorrect extracted road intersections 總結錯誤識別案例發(fā)生的緣由,包括兩個方面:一是與軌跡數據本身質量相關,如局部軌跡線分布稀疏、軌跡點定位誤差大等;二是與方法本身相關,如軌跡線剖分模型中移動窗口的大小對交叉口提取結果有重要影響。窗口太小,導致大型交叉口結構提取不完整;窗口太大,容易丟失小型道路交叉口。以科隆市Merheimer Heide公園旁的大型交叉口為例,圖13對比了3種不同大小窗口下的變道軌跡片段的識別結果。當窗口尺寸參數s=9時(圖13(a)),僅獲得局部少量變道軌跡片段;增大窗口尺寸至s=39時(圖13(c)),則可以有效提高變道軌跡片段識別完整性。因此,合理的窗口大小設置十分關鍵。當軌跡線加密間距為10 m時,圖14統(tǒng)計了科隆數據集在窗口尺寸參數s不同取值下的交叉口識別結果??梢园l(fā)現,當s=9(窗口內軌跡片段長度約90 m)時交叉口提取結果的精確率和召回率綜合表現最好。另一方面,統(tǒng)計該區(qū)域所有交叉口的范圍大小,發(fā)現80%以上范圍圓直徑處于60~130 m之間。因此,窗口大小設置可參考區(qū)域多數交叉口范圍圓的直徑分布區(qū)間。 圖13 不同大小窗口下變道軌跡片段識別結果Fig.13 Results of extracted lane-changing segments under different sizes of opening windows 圖14 不同窗口尺寸下的識別結果分析Fig.14 Analysis of results with different window sizes 利用車輛軌跡數據提取道路交叉口特征,已有方法主要采用基于軌跡點的統(tǒng)計聚類策略。本文方法將軌跡片段作為基本分析單元,綜合幾何形態(tài)、轉向幅度、速度變化指標識別道路交叉口的變道軌跡片段,然后通過軌跡片段的相似性聚類與中心線提取方法獲得道路交叉口結構特征。圍繞上述思路,設計了移動開窗式的軌跡線分段剖分模型,并引入機器學習領域的決策樹學習方法建立軌跡片段分類模型。試驗結果表明,本文方法相比傳統(tǒng)方法在交叉口特征提取的準確率與召回率上具有優(yōu)勢,特別對采集頻率低、分布相對稀疏的軌跡數據提取道路交叉口效果有較大提升。 本文方法還有不足之處有待改進提升。首先,需要建立更加完備的變道軌跡片段樣本數據。試驗中的樣本數據來自科隆數據集,將訓練學習得到的分類器應用到武漢數據集,交叉口識別準確率與召回率明顯低于科隆數據集識別結果。主要原因是兩種軌跡數據采樣間隔、定位精度,以及背后的道路格局、交通擁堵狀況存在差異,導致變道軌跡片段表現出不同的幾何形態(tài)與動力學特征。因此,變道軌跡片段樣本數據需要結合區(qū)域交通特點、軌跡數據質量狀況進行補充完善。其次,需要發(fā)展窗口大小自適應調整機制,滿足不同尺寸變道軌跡片段識別需求,從而實現對不同大小等級交叉口特征的準確提取。1.1 道路交叉口車輛變道軌跡片段分析
1.2 基于CART決策樹的變道軌跡片段識別模型
2 交叉口區(qū)域軌跡片段聚類與道路結構線生成
2.1 軌跡片段聚類
2.2 道路結構線生成
3 試驗分析與評價
3.1 試驗數據與環(huán)境設置
3.2 結果分析
4 結 論