胡堯*
(貴州大學理學院,貴州貴陽550025)
近年來城市道路交通因其解決的現(xiàn)實緊迫性和困難性,構(gòu)成了對理論及應用實踐研究的巨大挑戰(zhàn)。目前,隨著計算機信息應用技術(shù)的不斷提升及ITS(Intelligent Transportation System)在處理城市道路交通問題中發(fā)揮作用越來越明顯,各類城市道路交通問題中采集的數(shù)據(jù)也越來越具體卻又復雜。具體是因為幾乎研究問題所需數(shù)據(jù)均能收集到,復雜則是因為各類數(shù)據(jù)之間交錯反映的信息難于揭開其內(nèi)在聯(lián)系,數(shù)據(jù)挖掘與統(tǒng)計分析方法在該領域的應用研究有待進一步深入。城市居民生活水平質(zhì)量的不斷提高,汽車進入家庭“與日巨增”的發(fā)展趨勢不可動搖,城市道路交通供需矛盾日益突出,北上廣貴陽等城市限購限行搖號緩解交通擁堵權(quán)宜之計措施相繼出臺,隨機數(shù)的產(chǎn)生及公平公正系統(tǒng)設計在其領域的應用也運用而生。然而道路通行能力雖在城市道路設計或擴建時固有存在,其相關(guān)理論也較為完善,但交通其本質(zhì)的復雜不僅僅是車型不同、車速的瞬息變化,還因不同地區(qū)不同駕駛員的駕馭行為不同,故通行能力在應用中不得不重新定義測算,其測算方法也有待進一步研究。
本文根據(jù)上述問題分為三部分:利用隨機因子回歸模型,基于2007 年7 月至2010 年12 月貴陽市車輛數(shù)據(jù)擬合增長與預測模型[1-2],在此基礎上對貴陽市2011 年各月的車輛數(shù)據(jù)進行了科學預測;通過分析研究GT/B 10111 -2008[3]線性乘同余法(LMCM:Linear Multiplicative Congruential Method)模數(shù)、增長因子與素因子之間的關(guān)系,同時考慮隨機種子數(shù)、隨機序列及其均勻性與獨立性,結(jié)合實際需求設計出貴陽市專段號牌搖號編號分配與搖號系統(tǒng);針對難于測算的城市道路網(wǎng)絡交通實際通行能力[4],借助生存函數(shù)非參數(shù)P - L(Product Limit)估計方法[5-6],基于交通工程基本理論,建立了路口實際通行能力測算模型。
依據(jù)我國公安部車輛管理系統(tǒng),貴陽市交警支隊車輛管理所提供的機動車報表數(shù)據(jù)(2007.07 ~2012.06),部分數(shù)據(jù)統(tǒng)計報表格式如表1。
本文利用概率統(tǒng)計方法分析貴陽市各類車輛增長短期預測發(fā)展趨勢,根據(jù)增長數(shù)據(jù)的給力特性,數(shù)據(jù)分析主要針對三類(小型載客汽車、合計汽車與總計機動車)數(shù)據(jù)中的四項(累計、個人、進口與新注冊)增長類型數(shù)據(jù)進行分析。根據(jù)月報表整理的三類數(shù)據(jù)見表2。
為了擬合數(shù)據(jù)模型,對表1 中的各項數(shù)據(jù)按數(shù)量級分別描述其各自的散點圖(圖1、2),通過散點圖形狀,后面嘗試分別對2010.12 前數(shù)據(jù)尋找非線性與線性回歸擬合曲線進行增長模型預測研究,介于篇幅以下僅以累計小型載客汽車為例。從散點圖擬合小型載客汽車累計與個人項的非線性擬合模型[1]。
表1 機動車報表格式
表2 2007.7 ~2012.6 小型載客汽車、合計汽車與總計機動車月報表數(shù)據(jù) 輛
圖1 三類增長數(shù)據(jù)中累計與個人項散點圖
圖2 三類增長數(shù)據(jù)中進口與新注冊項散點圖
與小型載客汽車新注冊項車輛數(shù)的線性擬合模型,通過計算得新注冊項的線性判定系數(shù)為0.8430,殘差分析剔除異常值可提高至0.9057,其擬合方程y = 116x +1680 ,利用文獻[2]取置信區(qū)間半徑
置信水平取為95%,則擬合模型如圖3 ~5 所示(注:圖5 內(nèi)為異常值點)。
圖3 小型汽車累計與個人項擬合
圖4 小型載客汽車進口項擬合
圖5 小型載客每月新注冊項擬合
由此可預測小型載客汽車累計與個人及新注冊數(shù)據(jù)2011 年1 月至12 月數(shù)據(jù),其預測值分別如下(其他各項非線性預測同理也可得到):
利用2007.7 ~2010.12 車輛月報表數(shù)據(jù),基于回歸增長與預測模型得知:小型載客汽車累計與個人項2011 年12 月兩項分別達到38 萬(387330/359307)與34 萬(344610/309774),截至2011 年底每月新注冊小型載客汽車也將穩(wěn)定在0.8 萬(7944/4057)左右。
隨機數(shù)序列X1,…,Xn,由某遞推模型唯一確定且獨立具有均勻性,模型初值即為通常意義的種子數(shù)X0。依據(jù)GB/T 10111 -2008 選擇LMCM 模型[3]:
式中M 為模數(shù),a、c 分別為數(shù)乘與增量因子,初值X0俗稱種子數(shù),Rn是產(chǎn)生的隨機數(shù),取模運算mod 為aXn-1+C 除以M 的余數(shù),Xn、a、c 與M均為非負整數(shù)。
隨機抽取X1,X2,…,Xn的模型參數(shù)選擇原理如下:分解模數(shù)M 即求解M 的素因子M =,其中p0= 2 ,p1,…,pr均為素數(shù),α0為非負整數(shù),α1,…,αr為正整數(shù);選擇數(shù)乘因子a,使其滿足對M 的所有素因子p0,p1,…,pr,有a ≡1mod pi,且若M 是4 的倍數(shù)時a ≡1mod 4 ;增量c的選擇原則是與M 互為素數(shù)。
從申請參與搖號的有效編碼M 中按上述理論確定LMCM 的模型數(shù)乘因子與增量,在某隨機種子數(shù)的迭代下產(chǎn)生序列X1,X2,…,XM,其滿足編號的不重復與無漏號性。從而在保證搖號編號的隨機性與獨立性條件下,避免報名先后與搖號編號的無相關(guān)性且可重現(xiàn),實現(xiàn)了搖號編號分配的需求,算法已成功應用于貴陽市小客車專段號牌系統(tǒng)(見圖6)。
而搖號系統(tǒng)(圖7)即中簽系統(tǒng)則是通過模型隨機抽取X1,X2,…,XM中的k 個編號即為中簽編號,其克服了的技術(shù)有:中簽編號的均勻性與隨機性、中簽編號的不可重復性、中簽編號具有重現(xiàn)性、無“特權(quán)號”與“不幸號”、每個有效編號被等概率抽中,每個種子數(shù)后的組合被等組合概率中簽等等。由于篇幅所限,其另見詳細的算法程序設計。
通行能力是研究城市道路交通問題的重要基礎,實際通行能力的估計是制定緩解交通措施的理論前提,隨機化概念[4]為實際通行能力的估計開辟了新的途徑。以下基于交通中斷理論,利用生存函數(shù)非參數(shù)估計方法估計城市信號交叉口的實際通行能力。
圖6 搖號編號分配系統(tǒng)設計界面
圖7 搖號系統(tǒng)中簽編號設計界面
隨機變量XC為實際通行能力,其分布函數(shù)為
其中xq(0 <xq<∞)為流量q 的某取值,當流量達到或超過道路所能承載的實際通行能力XC時,交通中斷可能發(fā)生(注:中斷類似生存分析中的壽終或失效),勢必影響正常的交通狀況。為此,定義其生存函數(shù)SC(xq)的乘積極限估計
式中第j 個流量取值區(qū)間Ij= (aj-1,aj],j = 1,2,…,n -1 內(nèi)發(fā)生交通中斷次為n,同時記在i 個流量區(qū)間且當流量xq≤xqi時δi= 0 ,否則δi= 1 ?;谥袛嗔髁康膶嶋H通行能力非參數(shù)估計步驟如下:
Step 1 劃分k +1 個流量取值區(qū)間,記Ij= (bj-1,bj],且b0= a0+ min{qi,i = 1,…,N};
Step 2 記Nj=#{[bj-1,+ ∞)中斷發(fā)生| xq≥bj-1},dj=#{(bj-1,bj]中斷發(fā)生}且
pj= P{xq∈(b0,bj]中斷不發(fā)生| xq∈(b0,bj-1]中斷不發(fā)生}
q(j)= P{xq∈(bj-1,bj]中斷發(fā)生| xq∈(b0,bj-1]中斷不發(fā)生}
P(j)= P{xq∈(b0,bj]中斷不發(fā)生| xq≤bj},于是有結(jié)論:
Step 3 估計實際通行能力生存函數(shù)SC(xq)的估計值。
由概率統(tǒng)計知識[5-6],交通中斷序列數(shù)d1,…,dk的似然函數(shù):
且Nj= N - d1- … - dj-1,通過建立似然方程組,求解得極大似然估計MLE 值^pj= 1 - ^q(j),^q(j)= dj/Nj,且:
為了簡化估計程序,表3 提供了實際通行能力的“壽命”分析表,從而根據(jù)不同流量區(qū)間內(nèi)交通中斷數(shù)估計其對應的生存函數(shù)估計值。
表3 實際通行能力的“壽命”表
在交通基礎設施一定的正常交通狀況下,給定可接受的交通中斷概率α(0 <α <1),如果在第j區(qū)間內(nèi),有概率(j)≤1 -α <(j -1)及其對應流量值bj-1<q ≤bj,則實際通行能力XC在其區(qū)間內(nèi)的估計值為:
該估計值在區(qū)間內(nèi)取其估計,其較好地反應了實際通行能力的真實情況,如為了提高估計在整個取值范圍內(nèi)的估計精度,可應用統(tǒng)計意義上的均值作為實際通行能力的估計值,后面的實例說明兩者估計得到的值相差較小。
結(jié)合我國城市道路交通狀況,依據(jù)城市道路交通評價體系,在此定義交通中斷:當平均車速大于或等于19 km/h、小于或等于22 km/h,或大于22 km/h,由于某些因素的影響,其平均速度突然降至擁堵速度16 km/h 及以下,且持續(xù)時間超過5 min。通過課題組分析2011 年9 月19 日至10 月17 日貴陽市中心城區(qū)大十字路口20 條進口車道線圈流量與占有率數(shù)據(jù),分析統(tǒng)計出4695 次交通中斷,中斷及中斷之后的平均車速分別為8.1206 km/h 與8.2802 km/h,而中斷前的平均車速為27.5368 km/h,通過上述非參數(shù)生存函數(shù)估計方法得該路口的實際通行能力為7248(7236)當量小客車/小時,該數(shù)據(jù)是多年來本課題組首次得到,較真實的反映了該路口的真實交通狀況,應是路口實際通行能力的較好估計。由于篇幅所限,另有詳細算法分析。
實際通行能力生存函數(shù)非參數(shù)估計方法,將各類復雜交通現(xiàn)象造成的交通中斷定義為隨機變量,類似于產(chǎn)品的壽終或失效,能較好地揭示實際通行能力的估計規(guī)律,本課題組正在將其用于路段實際通行能力的估計,進而擬將推廣至區(qū)域或城市道路交通網(wǎng)絡通行能力的估計算中,力爭為日趨更加嚴重的交通擁堵貢獻一定的理論基礎。
車輛數(shù)據(jù)增長及保有量預測,政策波動、緩限擁堵措施等隨機因素影響其預測精度,一定置信水平下的精準度有待進一步提高,同時跟蹤數(shù)據(jù)變化修正模型服務于地方經(jīng)濟是研究小組的進一步研究。結(jié)合城市道路交通工程理論,借助生存函數(shù)非參數(shù)估計方法建立的實際應用通行能力測算模型基礎上,擬將進一步研究其路段通行能力,進而深入研究區(qū)域路網(wǎng)或城市道路交通網(wǎng)絡實際通行能力,為其相關(guān)研究領域與政策決策提供一定的理論依據(jù)。
[1]陳家鼎,孫山澤,李東風. 數(shù)理統(tǒng)計講義[M]. 北京:高等教育出版社,1993:160 -174.
[2]茆詩松,程依明,濮曉龍. 概率論與數(shù)理統(tǒng)計教程[M]. 北京:高等教育出版社,2009:407 -411.
[3]GB/T 10111 -2008,隨機數(shù)的產(chǎn)生及隨機抽樣檢驗方法[EB/OL].http://www.bzxz.net.
[4]美國交通研究委員會.道路通行能力手冊[M]. 任福田,劉小明,榮建,譯.北京:人民交通出版社,2000.
[5]J.F.Lawless..壽命數(shù)據(jù)中的統(tǒng)計模型與方法[M]. 茆詩松,濮曉龍,譯.北京:中國統(tǒng)計出版社.2001.
[6]陳家鼎. 生存分析與可靠性[M]. 北京:北京大學出版社,2005.