摘 要:文章首先對ReliefF特征選擇算法相關(guān)理論做了解析,分析了影響城市出租車保有量的相關(guān)因素;然后利用ReliefF算法對重慶、廣東相關(guān)數(shù)據(jù)進行了處理,提取其中特征權(quán)重較大的特征;最后,基于降維后的特征進行多元回歸分析,得到表征重慶、廣東出租車保有量的多元回歸方程。
關(guān)鍵詞:出租車保有量;特征選擇;ReliefF算法;多元回歸分析
引言
出租車保有量問題已經(jīng)成為出租車市場管理的重要依據(jù),對城市出租車保有量的預(yù)測也成為了城市交通中的重要研究課題。文獻[1]針對深圳市特區(qū)外的出租車保有量問題進行了研究,建立了類比分析模型。文獻[2]通過對北京市出租車保有量問題的研究,提出了基于出行廣義成本預(yù)測模型。文獻[3]利用Bruce Schaller需求估計模型,對北京市出租車保有量進行合理預(yù)測。
本文提出基于ReliefF特征選擇算法[4]的多元回歸分析方法對出租車保有量問題進行研究。首先,利用ReliefF算法對眾多影響因素進行權(quán)重排序,然后,利用多元回歸分析方法對具體城市數(shù)據(jù)進行預(yù)分析。
1 ReliefF特征選擇算法
ReliefF特征選擇算法主要用于解決樣本的多分類問題。算法基本思想:從訓(xùn)練集中隨機選取一個樣本R,然后從與樣本R同類和不同類的樣本集中均選出k個最近鄰樣本,最后,更新每個特征的權(quán)重。
2 出租車保有量問題實例
選取廣東、重慶相關(guān)數(shù)據(jù)進行研究,數(shù)據(jù)來源于中國統(tǒng)計年鑒[5]。
考查影響出租車保有量的影響因素:X1:地區(qū)生產(chǎn)總值(億元);X2:地區(qū)總?cè)丝冢ㄈf人);X3:城鎮(zhèn)居民家庭人均交通、通信消費支出(元);X4:公共交通車輛運營數(shù)(輛);X5:公共交通運營線路總長度(公里);X6:公共交通客運總量(萬人次);X7:城鎮(zhèn)居民家庭平均每百戶家用汽車擁有量(輛);Y:現(xiàn)有出租車保有量(輛)。標(biāo)準(zhǔn)化處理后的數(shù)據(jù)見表1。
3 結(jié)束語
文章基于ReliefF算法對影響出租車保有量的因素進行了降維處理,對重慶、廣東2008-2012年相關(guān)數(shù)據(jù)進行多元回歸分析,分別得到二者的多元回歸方程,對后續(xù)的研究工作有一定的指導(dǎo)作用。
參考文獻
[1]孫喜梅,李猛,韓彪.基于類比分析的深圳市特區(qū)外出租車需求量預(yù)測[J].交通信息與安全,2009(5):19-23.
[2]柳麗娜,陳艷艷,張文閣.北京市出租車乘客需求預(yù)測模型研究[J].交通標(biāo)準(zhǔn)化, 2010(13):89-92.
[3]范合君,杜博.特大城市出租車合理數(shù)量估計及實現(xiàn)路徑-以北京市為例[J].經(jīng)濟與管理研究,2015,36(8):91-95.
[4]Kononenko I. Estimating Attributes: Analysis and Extentions of RELIEF [C] // Machine Learning: ECML-94.Springer Berlin Heidelberg,1994:171-182.
[5]http://www.stats.gov.cn/tjsj/ndsj/中國統(tǒng)計年鑒.
作者簡介:王巖(1979-),男,吉林省吉林市人,工作單位:吉林化工學(xué)院,職務(wù):教師,研究方向:模式識別、機器視覺。