□ 文/孫同心 王世鯤
大數(shù)據(jù)背景下的高速公路流量預(yù)測(cè)實(shí)現(xiàn)
□文/孫同心王世鯤
21世紀(jì)是高速公路的時(shí)代,高速公路已經(jīng)成為衡量一個(gè)國(guó)家經(jīng)濟(jì)發(fā)展水平的尺度之一,近十幾年來(lái)隨著我國(guó)高速公路聯(lián)網(wǎng)運(yùn)營(yíng)里程的不斷增加,運(yùn)營(yíng)管理覆蓋范圍的不斷擴(kuò)大,人們對(duì)交通科技提出了更高的期望,希望交通能夠步入智能化交通的時(shí)代,在掌握高速公路流量的基礎(chǔ)上對(duì)高速公路未來(lái)的車流量作出正確的預(yù)測(cè),是我國(guó)進(jìn)行交通建設(shè)、步入智能化交通領(lǐng)域的重要條件。
對(duì)于交通流量的預(yù)測(cè)現(xiàn)已成為智能交通領(lǐng)域的一個(gè)研究熱點(diǎn),準(zhǔn)確地預(yù)測(cè)結(jié)果不僅能夠?yàn)榻煌ü芾聿块T進(jìn)行交通管制提供決策和支持,同時(shí)也能夠?yàn)槌鲂姓咛峁┯行У穆窂秸T導(dǎo)服務(wù),因此如何選用合適的預(yù)測(cè)方法從而提高流量預(yù)測(cè)的精度,具有十分重大的意義。
交通流量預(yù)測(cè)一直是智能交通領(lǐng)域的一個(gè)研究熱點(diǎn),從上世紀(jì)中葉開(kāi)始,國(guó)外就已經(jīng)有學(xué)者利用其它領(lǐng)域的一些預(yù)測(cè)方法對(duì)交通流量進(jìn)行預(yù)測(cè),大約在上個(gè)世紀(jì)八十年代,我國(guó)一些學(xué)者也相繼開(kāi)始在交通流量領(lǐng)域進(jìn)行深入研究,迄今為止,國(guó)內(nèi)外已經(jīng)出現(xiàn)了許多較為成熟的交通流量預(yù)測(cè)算法。
1984年,Iwao Okutani[1]等提出了一種基于卡爾曼濾波理論的短時(shí)交通流量預(yù)測(cè)模型,通過(guò)最近幾次預(yù)測(cè)的誤差對(duì)模型參數(shù)進(jìn)行動(dòng)態(tài)調(diào)整,并以名古屋某路段的實(shí)測(cè)交通流量數(shù)據(jù)對(duì)該預(yù)測(cè)模型進(jìn)行了實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該預(yù)測(cè)模型的平均絕對(duì)百分誤差小于9%,且最大絕對(duì)百分誤差小于30%。
1994年,A.G.Hobeika[2]等基于回歸分析建立了短時(shí)交通流量預(yù)測(cè)模型,該預(yù)測(cè)模型同時(shí)考慮了目標(biāo)斷面當(dāng)前時(shí)刻、目標(biāo)斷面歷史時(shí)刻以及目標(biāo)斷面上游當(dāng)前時(shí)刻的流量數(shù)據(jù),并采用了啟發(fā)式自適應(yīng)權(quán)重的方法進(jìn)行了權(quán)重分配,最后以紐約市長(zhǎng)島高速公路1993年6月中22天工作日的實(shí)測(cè)流量數(shù)據(jù)(采樣周期為15min)對(duì)該預(yù)測(cè)模型進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果表明該預(yù)測(cè)模型在進(jìn)行高峰時(shí)期的交通流量預(yù)測(cè)時(shí)效果較好,且平均絕對(duì)百分誤差約為6%。
2003年,Billy M.Williams[3]等在分析了以往短時(shí)交通流量預(yù)測(cè)存在的不足的基礎(chǔ)上,提出了基于周期性的ARIMA預(yù)測(cè)模型。并分別以英國(guó)倫敦市M25環(huán)城高速公路和美國(guó)亞特蘭大市I-75高速公路的實(shí)測(cè)流量數(shù)據(jù)(采樣周期為15min)對(duì)預(yù)測(cè)模型進(jìn)行了實(shí)驗(yàn)驗(yàn)證,并利用平均絕對(duì)誤差(MAPE)對(duì)預(yù)測(cè)結(jié)果進(jìn)行了評(píng)價(jià),實(shí)驗(yàn)結(jié)果表明該預(yù)測(cè)模型能夠有效提高短時(shí)交通流量的預(yù)測(cè)精度,其MAPE僅為8.6%。
2004年,徐今強(qiáng)[4]等采用時(shí)間序列模型對(duì)短時(shí)交通流量進(jìn)行了預(yù)測(cè)。首先通過(guò)對(duì)實(shí)測(cè)的交通流非平穩(wěn)時(shí)間序列進(jìn)行差分變換及標(biāo)準(zhǔn)化處理,從而將其轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)的平穩(wěn)時(shí)間序列,然后分別采用極大似然估計(jì)法和AIC準(zhǔn)則進(jìn)行了模型參數(shù)的估計(jì)和模型定階。最后對(duì)2003年3月21日珠海市某主干道的實(shí)測(cè)交通流量數(shù)據(jù)(采樣周期為5min)進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果表明該ARMA模型能夠較好地?cái)M合交通流時(shí)間序列,并可獲得較好的中短期預(yù)測(cè)精度。
2008年,王彥杰[5]等針對(duì)傳統(tǒng)的K近鄰非參數(shù)回歸預(yù)測(cè)方法在進(jìn)行交通狀態(tài)預(yù)測(cè)時(shí)的不足,在進(jìn)行狀態(tài)向量選取時(shí)采用主成分分析方法,并結(jié)合基于斜率表示的相似性度量方法,提出了改進(jìn)的非參數(shù)回歸預(yù)測(cè)方法,最后以2006年10月31日至12月28日廈門市仙岳隧道處的線圈檢測(cè)器所采集到的實(shí)測(cè)交通流量數(shù)據(jù)(采樣時(shí)間間隔15min)對(duì)該方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果表明改進(jìn)后的非參數(shù)預(yù)測(cè)方法的平均相對(duì)誤差為33.2%,比改進(jìn)前的方法提高了17.7%。
本文介紹的高速公路短時(shí)流量預(yù)測(cè)實(shí)現(xiàn)方法基于實(shí)時(shí)和歷史的收費(fèi)站出入口流量數(shù)據(jù),在大數(shù)據(jù)分析手段的基礎(chǔ)之上通過(guò)系統(tǒng)級(jí)的預(yù)測(cè)算法模型進(jìn)行短時(shí)高速公路流量預(yù)測(cè),并基于后續(xù)的實(shí)時(shí)流量數(shù)據(jù)對(duì)算法模型進(jìn)行持續(xù)的訓(xùn)練與優(yōu)化。
數(shù)據(jù)源介紹
系統(tǒng)實(shí)現(xiàn)的數(shù)據(jù)基礎(chǔ)來(lái)源于江蘇省全省約390個(gè)收費(fèi)站的實(shí)時(shí)數(shù)據(jù),數(shù)據(jù)類型主要包含了MTC出入口流量,ETC出入口流量數(shù)據(jù)。數(shù)據(jù)傳輸方式主要通過(guò)各收費(fèi)站的收費(fèi)系統(tǒng)準(zhǔn)實(shí)時(shí)上傳收費(fèi)數(shù)據(jù),途徑收費(fèi)站的每輛車均為一條獨(dú)立的流水?dāng)?shù)據(jù),數(shù)據(jù)中包含了車輛入口收費(fèi)站、車輛出口收費(fèi)站、車道類型、車輛類型、車牌等相關(guān)信息。各收費(fèi)站的數(shù)據(jù)統(tǒng)一上傳至上級(jí)行政單位江蘇省高速公路聯(lián)網(wǎng)營(yíng)運(yùn)管理中心,目前全省的一天車輛通行數(shù)據(jù)條數(shù)約為150萬(wàn)條(不考慮特殊情況諸如節(jié)假日大流量等),而大數(shù)據(jù)分析源數(shù)據(jù)庫(kù)(非靜態(tài)備份中心)大約存儲(chǔ)了3年*365天*150萬(wàn)≈16.4億條車輛通行數(shù)據(jù),數(shù)據(jù)流轉(zhuǎn)示意圖如下圖所示:
▲數(shù)據(jù)流轉(zhuǎn)示意圖
在大數(shù)據(jù)分析數(shù)據(jù)庫(kù)中,原始數(shù)據(jù)存儲(chǔ)解決解決方案主要采用分表技術(shù),該技術(shù)包含了以下幾個(gè)關(guān)鍵實(shí)現(xiàn)邏輯:
1、垂直分割:把主碼和一些列放在一個(gè)表,然后把主碼和另外的列放在另外一個(gè)表中。如果一個(gè)表中的某些列常用,而另外一些列不常用,則可以采用垂直分割,另外垂直分割可以使得數(shù)據(jù)行變小,一個(gè)數(shù)據(jù)頁(yè)就能存放更多的數(shù)據(jù),在查詢時(shí)就會(huì)減少I/O次數(shù)。其缺點(diǎn)是需要管理冗余列,查詢所有數(shù)據(jù)需要進(jìn)行join操作。
2、水平分割:聯(lián)網(wǎng)中心大數(shù)據(jù)分析數(shù)據(jù)庫(kù)(以下簡(jiǎn)稱中心數(shù)據(jù)庫(kù))中的水平分割主要采用了以下幾種方式:
①Range Partitioning分區(qū):即數(shù)據(jù)基于指定COLUMN的值范圍進(jìn)行分區(qū),在上述垂直分割的主碼表的基礎(chǔ)上基于流水?dāng)?shù)據(jù)的時(shí)間進(jìn)行分區(qū),對(duì)時(shí)間進(jìn)行切片,將分屬不同時(shí)間片的數(shù)據(jù)存儲(chǔ)在不同的時(shí)間分區(qū)表中。
②Hash Partitioning分區(qū):即數(shù)據(jù)基于指定COLUMN的Hash算法的值進(jìn)行分區(qū),給每一個(gè)分區(qū)近似相同的大小,要保證數(shù)據(jù)能平均分配,分區(qū)數(shù)一般是2N。
③List Partitioning分區(qū):即指定固定多少行屬于同一個(gè)分區(qū)。
中心數(shù)據(jù)庫(kù)綜合采用以上幾種分區(qū)技術(shù),對(duì)主碼表數(shù)據(jù)采用了基于時(shí)間字段的Range Partitioning分區(qū),對(duì)副表采用了Hash Partitioning分區(qū),而對(duì)部分流水?dāng)?shù)據(jù)涉及到的一些基礎(chǔ)數(shù)據(jù),非實(shí)時(shí)數(shù)據(jù)等采用了List Partitioning分區(qū)技術(shù),綜合采用各種分區(qū)技術(shù)的作用在于能夠最大程度的提升中心數(shù)據(jù)庫(kù)的存儲(chǔ)及吞吐能力。
算法模型邏輯
①基礎(chǔ)離散數(shù)據(jù)
在統(tǒng)計(jì)學(xué)中,數(shù)據(jù)按照變量值是否連續(xù)可分為連續(xù)數(shù)據(jù)和離散數(shù)據(jù)。
性質(zhì):符號(hào)x如果能夠表示對(duì)象集合S中的任意元素,就是變量。如果變量的域(即對(duì)象的集合S)是離散的,該變量就是離散變量;如果它的域是連續(xù)的,它就是連續(xù)變量。
交通學(xué)中的單次車輛流量即可視為一個(gè)離散點(diǎn),而同一個(gè)時(shí)間段內(nèi)(實(shí)際采樣周期為5min)全網(wǎng)的車輛流量可視作相互獨(dú)立的數(shù)據(jù)離散點(diǎn),而同時(shí)我們也可將該時(shí)間段內(nèi)的流量數(shù)據(jù)視作有區(qū)間的數(shù)據(jù)集合。
根據(jù)多個(gè)全網(wǎng)的流水?dāng)?shù)據(jù)集合點(diǎn)我們即可以得出全網(wǎng)(或單收費(fèi)站)的實(shí)時(shí)、歷史流量走勢(shì)圖。
而我們的流量預(yù)測(cè)的根基也正是建立在這樣的實(shí)時(shí)和歷史車流量的數(shù)據(jù)之上。
②加權(quán)平均數(shù)(權(quán)數(shù))
即將各數(shù)值乘以相應(yīng)的權(quán)數(shù),然后加總求和得到總體值,再除以總的單位數(shù)。
平均數(shù)的大小不僅取決于總體中各單位的標(biāo)志值(變量值)的大小,而且取決于各標(biāo)志值出現(xiàn)的次數(shù)(頻數(shù)),由于各標(biāo)志值出現(xiàn)的次數(shù)對(duì)其在平均數(shù)中的影響起著權(quán)衡輕重的作用,因此叫做權(quán)數(shù)。
交通學(xué)中的流量預(yù)測(cè)模型通常并不是單獨(dú)建立在某個(gè)點(diǎn)上的預(yù)測(cè),通常某個(gè)點(diǎn)的預(yù)測(cè)會(huì)涉及到目標(biāo)斷面(即本預(yù)測(cè)模型中的當(dāng)前收費(fèi)站)的當(dāng)前流量數(shù)據(jù),目標(biāo)斷面的歷史流量數(shù)據(jù),目標(biāo)斷面的上游斷面(即本預(yù)測(cè)模型中當(dāng)前收費(fèi)的上游收費(fèi)站)的當(dāng)前流量數(shù)據(jù)。
目前中心的流量預(yù)測(cè)模型也一定程度上建立在當(dāng)前收費(fèi)站的歷史、實(shí)時(shí)流量,當(dāng)前收費(fèi)站的上游收費(fèi)站的實(shí)時(shí)流量基礎(chǔ)之上,對(duì)不同的數(shù)據(jù)加之以不同的數(shù)據(jù)權(quán)重值進(jìn)行分析預(yù)測(cè)。
③數(shù)據(jù)標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差(Standard Deviation)描述各數(shù)據(jù)偏離平均數(shù)的距離(離均差)的平均數(shù),它是離差平方和平均后的方根,用σ表示。標(biāo)準(zhǔn)差是方差的算術(shù)平方根。標(biāo)準(zhǔn)差能反映一個(gè)數(shù)據(jù)集的離散程度,標(biāo)準(zhǔn)偏差越小,這些值偏離平均值就越少,反之亦然。標(biāo)準(zhǔn)偏差的大小可通過(guò)標(biāo)準(zhǔn)偏差與平均值的倍率關(guān)系來(lái)衡量。平均數(shù)相同的兩個(gè)數(shù)據(jù)集,標(biāo)準(zhǔn)差未必相同。
樣本標(biāo)準(zhǔn)偏差的計(jì)算步驟是:
步驟一、(每個(gè)樣本數(shù)據(jù) 減去樣本全部數(shù)據(jù)的平均值)。
步驟二、把步驟一所得的各個(gè)數(shù)值的平方相加。
步驟三、把步驟二的結(jié)果除以 (n - 1)(“n”指樣本數(shù)目)。
步驟四、從步驟三所得的數(shù)值之平方根就是抽樣的標(biāo)準(zhǔn)偏差。
在中心的交通流量預(yù)測(cè)模型中主要利用以往歷史數(shù)據(jù)的標(biāo)準(zhǔn)差來(lái)計(jì)算出不同年份的數(shù)據(jù)增長(zhǎng)的離散度,根據(jù)此樣本標(biāo)準(zhǔn)偏差可作為數(shù)據(jù)增長(zhǎng)率的權(quán)重值來(lái)得出不同的預(yù)測(cè)值。
④增長(zhǎng)率的導(dǎo)數(shù)
導(dǎo)數(shù)定義為:當(dāng)自變量的增量趨于零時(shí),因變量的增量與自變量的增量之商的極限。在一個(gè)函數(shù)存在導(dǎo)數(shù)時(shí),稱這個(gè)函數(shù)可導(dǎo)或者可微分。
在中心的交通流量預(yù)測(cè)模型中,基于往年歷史數(shù)據(jù)的基礎(chǔ)之上計(jì)算出同一個(gè)收費(fèi)站的歷史相同時(shí)間點(diǎn)的流量數(shù)據(jù)的增長(zhǎng)率,再對(duì)增長(zhǎng)率進(jìn)行求導(dǎo),計(jì)算出增長(zhǎng)率的增長(zhǎng)幅度,在此基礎(chǔ)上計(jì)算出未來(lái)流程的增長(zhǎng)率。
⑤尖峰降噪
借鑒信號(hào)學(xué)中時(shí)域、頻譜轉(zhuǎn)換濾波處理對(duì)預(yù)測(cè)后的數(shù)據(jù)進(jìn)行波形降噪平滑處理;實(shí)際交通學(xué)中的流量是不會(huì)陡增或者陡降的,所以我們可以采用此種方法對(duì)部分流量波形中的突變流量進(jìn)行平滑處理。
算法模型結(jié)合數(shù)據(jù)落地過(guò)程
以預(yù)測(cè)江陰南收費(fèi)站2016年7月25日10點(diǎn)整的流量數(shù)據(jù)為例:
實(shí)際數(shù)據(jù)傳輸過(guò)程中的采樣周期為5m i n,即2016/07/25 10∶00∶00節(jié)點(diǎn)的車流量數(shù)據(jù)實(shí)際為2016/07/25 09∶55∶00~2016/07/25 10∶00∶00期間的總通行數(shù)據(jù),該節(jié)點(diǎn)的通行數(shù)據(jù)內(nèi)容包含以下內(nèi)容:收費(fèi)站ID、該周期結(jié)束時(shí)間點(diǎn)、MTC出口流量、MTC入口流量、ETC出口流量、ETC入口流量。
上述關(guān)鍵的6列數(shù)據(jù)利用上面“數(shù)據(jù)源章節(jié)”所介紹的垂直分割技術(shù)存儲(chǔ)在主數(shù)據(jù)表中,而主數(shù)據(jù)表又利用了水平分割技術(shù)中的“Range Partitioning分區(qū)”即基于時(shí)間字段對(duì)表進(jìn)行分區(qū),在利用存儲(chǔ)過(guò)程、大數(shù)據(jù)分析公式等手段對(duì)數(shù)據(jù)分析時(shí)上述各種手段的利用能夠極大的提升數(shù)據(jù)的檢索速度;而其它的諸如客戶車出入流量、OBU流量等非關(guān)鍵數(shù)據(jù)存儲(chǔ)在附表中,附表中的數(shù)據(jù)和主表中的數(shù)據(jù)通過(guò)時(shí)間字段、收費(fèi)站站點(diǎn)ID關(guān)聯(lián)匹配,附表中的數(shù)據(jù)主要采用了“List Partitioning分區(qū)”方法進(jìn)行數(shù)據(jù)存儲(chǔ);而對(duì)于一些基礎(chǔ)數(shù)據(jù)我們主要采用了“Hash Partitioning分區(qū)”方法進(jìn)行數(shù)據(jù)存儲(chǔ)。
江陰南收費(fèi)站在2016/07/25 09∶55∶00的MTC出口流量值為36,ETC出口流量值為26即總出口流量為62;同理我們查詢出不同年份江陰南收費(fèi)站的下一周期時(shí)間點(diǎn)的流量如下所示:
2015/07/25 10∶00∶00的MTC出口流量值為34,ETC出口流量值為23即總出口流量為57;
2014/07/25 10∶00∶00的MTC出口流量值為33,ETC出口流量值為23即總出口流量為56;
2013/07/25 10∶00∶00的MTC出口流量值為30,ETC出口流量值為21即總出口流量為51。
根據(jù)不同年份對(duì)應(yīng)不同的權(quán)重(本文中的實(shí)例以10分制為參考),年份越久遠(yuǎn)權(quán)重越小,初步可以得出的基礎(chǔ)計(jì)算結(jié)果如下所示:
與此同時(shí)我們計(jì)算該樣本的標(biāo)準(zhǔn)差,計(jì)算方法如下
在實(shí)際應(yīng)用過(guò)程中,上述類似計(jì)算過(guò)程中得到的單收費(fèi)站的流量標(biāo)準(zhǔn)差我們可以將其作為多重?cái)?shù)據(jù)校驗(yàn)的手段,首先不同年份相同時(shí)間點(diǎn)維度的數(shù)據(jù)(即上述計(jì)算結(jié)果)我們可以利用其作為檢驗(yàn)單收費(fèi)站流程增長(zhǎng)幅度的依據(jù),當(dāng)后續(xù)章節(jié)計(jì)算出的流量增長(zhǎng)率與該方差值不能較好的匹配,我們即可認(rèn)為該收費(fèi)站某個(gè)年份點(diǎn)的數(shù)據(jù)較為不可信,在這種情況下我們就需要根據(jù)其相鄰收費(fèi)站(主要是上游斷面收費(fèi)站)的歷史入口流量數(shù)據(jù)來(lái)重新推算出該收費(fèi)站的歷史車流量的數(shù)值范圍,然后以此數(shù)值范圍來(lái)定位該收費(fèi)站往年的車流量數(shù)據(jù)的錯(cuò)誤;其次相同年份相鄰時(shí)間點(diǎn)維度的數(shù)據(jù),例:江陰南收費(fèi)站09∶55∶00的總出口流量為62,09∶50∶00的總出口流量為1,09∶45∶00的總出口流量為59,09∶45∶00的總出口流量為56,通過(guò)計(jì)算相鄰點(diǎn)的知該點(diǎn)的標(biāo)準(zhǔn)差與正常的的標(biāo)準(zhǔn)差相比較為異常,然后我們?cè)诟鶕?jù)不同時(shí)間點(diǎn)的值與平均值相比再結(jié)合各種組合三個(gè)點(diǎn)的平均數(shù),我們可以發(fā)現(xiàn)該收費(fèi)站在09∶50∶00的數(shù)據(jù)流量較為異常;在發(fā)現(xiàn)異常之后我們以多種數(shù)據(jù)的平均值代替該時(shí)間點(diǎn)的車流量,上述所述的手段即能夠達(dá)到“關(guān)鍵概念及技術(shù)點(diǎn)介紹”章節(jié)所描述的尖峰降噪的效果。實(shí)際應(yīng)用過(guò)程中對(duì)比效果圖如下:
▲優(yōu)化前效果圖
▲優(yōu)化后效果圖
在計(jì)算流量的增長(zhǎng)率時(shí)我們依然以江陰南收費(fèi)站的數(shù)據(jù)為例,其2015/07/25 10∶00∶00的總出口流量為57,2014/07/25 10∶00∶00總出口流量為56,2013/07/25 10∶00∶00總出口流量為51;通過(guò)計(jì)算我們可以得知2014年的車流量增長(zhǎng)率為9.804%,2015年的車流量增長(zhǎng)率為1.785%,通過(guò)上述數(shù)據(jù)我們可以看出不同年份的車流量數(shù)是在不斷增長(zhǎng),但實(shí)際的車流量的增長(zhǎng)率卻是在放緩,而在數(shù)據(jù)公式中關(guān)于求導(dǎo)的概念(即“關(guān)鍵概念及技術(shù)點(diǎn)介紹”章節(jié)描述的增長(zhǎng)率的導(dǎo)數(shù))明確提出“可導(dǎo)的函數(shù)一定連續(xù),但連續(xù)的函數(shù)不一定可導(dǎo)”,而實(shí)際交通學(xué)中的車流量是由一個(gè)個(gè)離散的流量點(diǎn)組成,車流量本身的函數(shù)是不可導(dǎo)的,但是在增長(zhǎng)率的概念中我們引入了導(dǎo)數(shù)的概念,我們計(jì)算增長(zhǎng)率的增長(zhǎng)率的得出結(jié)果為-81.7%,然后我們推算出2016年的增長(zhǎng)率大致應(yīng)為0.327%,依此增長(zhǎng)率我們從本維度推算出的江陰南收費(fèi)站在2016/07/25 10∶00∶00的總出口流量大致為57~58的范圍。
在根據(jù)多個(gè)上游斷面收費(fèi)站2016/07/25 09∶55∶00計(jì)算出另外一種維度的流量結(jié)果,計(jì)算公式 大寫的S表示最終的流量結(jié)果,n表示上游斷面收費(fèi)站的個(gè)數(shù),小寫的s表示某個(gè)上游斷面收費(fèi)站的當(dāng)前時(shí)刻的車流量,p表示該上游斷面收費(fèi)站車流量的權(quán)重值(此處需要注意所有上游斷面的權(quán)重值p最后相加的結(jié)果因?yàn)?否則計(jì)算結(jié)果會(huì)有問(wèn)題),根據(jù)上述計(jì)算出來(lái)的結(jié)果約為60。
根據(jù)上述計(jì)算過(guò)程中得出的權(quán)重計(jì)算結(jié)果59的車流量、增長(zhǎng)率維度計(jì)算出58的車流量以及多個(gè)上游斷面收費(fèi)站維度得出60的車流量;多重維度數(shù)據(jù)結(jié)合我們可以預(yù)測(cè)出江陰南收費(fèi)站在2016/07/25 10∶00∶00的車流量應(yīng)為59。而后期我們對(duì)此計(jì)算結(jié)果進(jìn)行驗(yàn)證,也能夠發(fā)現(xiàn)此結(jié)果較單維度預(yù)測(cè)的結(jié)果較為準(zhǔn)確。
作者單位:上海電科智能系統(tǒng)股份有限公司