国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于潛變量SVM的出行方式預(yù)測模型

2016-12-15 01:53:35陳月霞查奇芬謝君平熊曉夏
關(guān)鍵詞:樣本量精度變量

陳月霞 陳 龍 查奇芬 景 鵬 謝君平 熊曉夏

(1江蘇大學(xué)汽車與交通工程學(xué)院, 鎮(zhèn)江 212013)(2江蘇大學(xué)財經(jīng)學(xué)院, 鎮(zhèn)江 212013)

?

基于潛變量SVM的出行方式預(yù)測模型

陳月霞1陳 龍1查奇芬2景 鵬1謝君平1熊曉夏1

(1江蘇大學(xué)汽車與交通工程學(xué)院, 鎮(zhèn)江 212013)(2江蘇大學(xué)財經(jīng)學(xué)院, 鎮(zhèn)江 212013)

為提高小樣本下的出行方式選擇模型的預(yù)測精度,提出了考慮低碳出行心理變量的支持向量機(SVM)算法.首先基于計劃行為理論,考慮低碳出行心理因素,建立多原因多指標潛變量模型.然后將預(yù)測后的潛變量帶入SVM分類器,構(gòu)建了帶潛變量的SVM選擇模型.最后,利用交叉驗證優(yōu)化所建模型參數(shù),并以長三角地區(qū)城市居民為研究對象實證檢驗了模型性能.實證結(jié)果表明,所建帶潛變量的SVM選擇模型具有較好的預(yù)測效果,比不帶潛變量的SVM選擇模型的精度提高了4.54%,比傳統(tǒng)的帶潛變量的混合選擇模型提高了2.56%,同時驗證了小樣本下模型仍然具有很高的精度.本研究為出行方式選擇模型和低碳出行方式選擇研究提供了一定的理論參考.

混合選擇模型;支持向量機;多原因多指標;計劃行為理論;交叉驗證算法

出行方式選擇行為模型不斷利用其他學(xué)科領(lǐng)域的理論進行完善和更新[1].一些學(xué)者將多原因多指標模型(MIMIC)或者結(jié)構(gòu)方程模型(SEM)與傳統(tǒng)離散模型Logit相結(jié)合,建立了潛變量與顯變量共同作用的混合模型[2-3].

雖然預(yù)測精度得到一定的提高,但是模型估計過程復(fù)雜而繁瑣.同時,隨著研究的不斷深入,變量增加,模型日趨復(fù)雜,就需要更多的樣本數(shù)據(jù)來滿足傳統(tǒng)統(tǒng)計模型建立的需求,但實際上往往不能得到足夠多的數(shù)據(jù),導(dǎo)致模型無法建立.而支持向量機(SVM)模型是建立在小樣本下的分類算法[4-5],同時模型的建立比較簡單、智能,只需選擇恰當?shù)目刂茀?shù),就能實現(xiàn)較好的擬合效果,避免了上述傳統(tǒng)統(tǒng)計方法的缺陷.

目前國外學(xué)者在交通領(lǐng)域主要運用SVM模型預(yù)測短期出行時間、客流和費用[6-7]等因素對出行選擇的影響,國內(nèi)不少學(xué)者已經(jīng)嘗試將SVM理論運用于中國城市居民出行模式識別和預(yù)測研究[8-9]中,但單純的SVM模型的精度還有待提高.為了降低建模難度同時兼顧模型的預(yù)測精度,本文結(jié)合傳統(tǒng)混合模型和SVM的優(yōu)勢,提出一種新的MIMIC-SVM選擇模型來研究出行方式選擇行為,并將此方法用于低碳出行研究領(lǐng)域.

本文以計劃行為理論(TPB)為低碳出行心理研究框架,針對出行方式建立MIMIC模型.首先,將心理潛變量的擬合值作為解釋自變量加入到支持向量機中,形成帶潛變量的SVM選擇模型.然后,采用實證數(shù)據(jù)對傳統(tǒng)離散選擇模型和不帶潛變量的SVM選擇模型的擬合精度進行對比驗證.最后,對小樣本下的模型性能進行檢驗.

1 實證數(shù)據(jù)來源與檢驗

1.1 出行方式分類

出行行為研究通常根據(jù)交通工具種類對出行方式進行分類,也有學(xué)者[10]在研究低碳出行時將出行方式分為低碳出行和非低碳出行兩大類等,但是這些分類方式或過于精細或過于粗獷,不能滿足本文研究要求.本文根據(jù)各類交通工具的個人碳排放強度[11]將出行方式重新劃分為3個等級:① 碳排放強度0~10為低碳出行方式,包含步行、自行車和電動車;② 10~100為中碳出行方式,包含摩托車和公交車;③ 100以上為高碳出行方式,包含出租車和私家車.

1.2 數(shù)據(jù)來源

本文采用的數(shù)據(jù)來源于2015年長三角地區(qū)交通低碳出行行為問卷調(diào)查.問卷分為出行者信息調(diào)查、出行信息調(diào)查和出行態(tài)度調(diào)查3個部分.出行態(tài)度調(diào)查量表主要用于測量計劃行為理論框架下通勤者低碳出行的心理變量.參考國內(nèi)外有關(guān)出行方式TPB各變量的問題項[12],采用Likert五級量表構(gòu)造TPB中4個基本變量Attitude, SN, PBC,Intension,其中1代表非常不符合,2代表不符合,3代表一般,4代表符合,5代表非常符合.根據(jù)文獻[10,13]關(guān)于中國城市居民低碳出行行為影響因素研究結(jié)果,結(jié)合本文研究內(nèi)容,得出5個特定變量(見表1),其他常用個人屬性變量還有kid(有無小孩);bike(有無自行車);elecar(有無電動車);car(有無私家車)以及male(性別).

表1 數(shù)據(jù)庫變量

本次問卷共發(fā)出3 200份,實際回收2 941份,回收率為91.91%,刪除其中有明顯矛盾、填寫不完全的21個樣本,最后得到2 660個完整樣本數(shù)據(jù).Stevens[14]建議一個變量大概需要15個樣本支持,本文中每個MIMIC模型有12個變量,因此樣本量均要求在180以上,而3個模型樣本總量分別為1 389,726,545,滿足模型建立的樣本量要求.

1.3 數(shù)據(jù)檢驗

對于潛變量數(shù)據(jù),本文從信度和效度2個角度進行檢驗.采用Cronbachα信度系數(shù)檢驗信度,平均方差提取值(AVE)檢驗收斂效度,主成分因子分析檢驗結(jié)構(gòu)效度.檢驗結(jié)果如表2所示.

表2 數(shù)據(jù)檢驗結(jié)果

由表2可知,在探索性因子分析中,所有潛變量特征值大于1的主成分因子均唯一,其方差貢獻率都在60%以上,且所有變量問題項的因子載荷都高于0.5.而在一階驗證性因子分析中,相應(yīng)的變量與問題項之間均關(guān)系顯著,且標準化路徑系數(shù)都大于0.5,z值也都遠大于2,證明該量表具有良好的結(jié)構(gòu)效度.各變量的α系數(shù)只有SN為0.64,其他變量都在0.7之上,根據(jù)Nunnally等[15]的評判標準,均在可接受范圍內(nèi),表明各變量的內(nèi)在一致性較高.每個變量的AVE值均大于0.5,在0.52~0.7 之間,表明該量表收斂效度較好.

2 帶潛變量的SVM選擇模型

本文考慮到模型的復(fù)雜性以及樣本量不足的可能性,將SVM模型運用到混合模型中,替代傳統(tǒng)的離散選擇模型.所建模型包含潛變量模型MIMIC和SVM模型,結(jié)構(gòu)如圖1所示.

圖1 帶潛變量的SVM選擇模型

2.1 潛變量模型

定義反映潛變量關(guān)系的結(jié)構(gòu)方程:

η=Λx+ζ

(1)

式中,η為n×1維低碳心理潛變量,本文中n=4,具體為Attitude, SN, PBC,和Intension;x為k×1維外生可觀測變量向量,k=8,包括male, age, edu, income, kid, bike, elecar和car;Λ為n×k維未知待估計參數(shù)矩陣;ζ為測量誤差.

測量方程為

y=Γη+υ

(2)

式中,y為q×1維潛變量η的可觀測指標向量;Γ為q×n維未知的待估計參數(shù)矩陣;υ為誤差項.對于誤差項ζ和υ需滿足

E(ζζT)=Ψ,E(υυT)=Θ,E(υζT)=0

(3)

2.2 SVM模型

記n個樣本點集為{(xi,yi),i=1,2,…,n},其中xi={xi,ηi},xi為可觀測變量,ηi為潛變量,考慮非線性SVM,引入松弛變量來修正優(yōu)化目標和約束項,即

(4)

式中,C為懲罰因子.得到最終的最優(yōu)分類函數(shù)如下:

(5)

式中,核函數(shù)選用徑向基核函數(shù)(RBF).

3 實證研究

3.1 MIMIC模型

利用統(tǒng)計軟件Stata14建立3類出行方式的MIMIC模型,擬合優(yōu)度如表3所示.由表可知,3類出行方式選擇模型的卡方自由度比值均在可接受范圍1~3之間,并且近似均方根誤差(RMSEA)、相對擬合指數(shù)(CFI)、塔克-劉易斯指數(shù)(TLI)和標準化殘差均方根(SRMR)都在模型擬合度可接受范圍內(nèi).

表3 模型擬合指標

通勤者社會經(jīng)濟屬性與潛變量之間的關(guān)系非常復(fù)雜,在這里僅給出低碳出行方式中兩者的關(guān)系情況,見表4.由表可知,在采用低碳出行方式出行的MIMIC模型中,每個個體屬性變量都對一種或者幾種潛變量產(chǎn)生顯著影響.社會經(jīng)濟屬性對低碳出行“行為態(tài)度”影響最大,受教育程度、月收入、是否有自行車和是否有電動車都對出行者采用低碳方式出行的態(tài)度有顯著性影響,其中月收入為負影響,即收入越高越不支持低碳出行,這可能是因為隨著收入的提高,出行者對出行方式的要求越高,傾向于舒適、快速的出行方式;相反,受教育程度越高,越認同低碳出行,且有低碳出行條件優(yōu)勢的通勤者比如擁有自行車、電動車等也支持低碳出行.此外,社會經(jīng)濟屬性對低碳出行“行為意向”的直接顯著影響最小,只有是否有電動車和否是有私家車分別對其有正、負顯著影響,即有電動車的通勤者更愿意低碳出行,而有私家車的更傾向于開車出行,這可能是由于自身交通工具的限制造成的.社會經(jīng)濟屬性對于其他2個潛變量的影響程度介于“行為態(tài)度”和“行為意向”之間.

表4 社會經(jīng)濟屬性對潛變量的影響

3.2 SVM模型

考慮到輸入變量之間差異較大,參照文獻[8]將數(shù)據(jù)都規(guī)整到[-3,3]之間.本文的輸出類別可轉(zhuǎn)換成3個二類劃分問題解決,每個分類對應(yīng)的決策函數(shù)為

(6)

若fj(x)=1,則x屬于第j類;若fj(x)=-1,則x不屬于第j類.由此得到多分類問題的總判別函數(shù):

(7)

式中,arg為選取指標函數(shù).則本文中的低碳、中碳和高碳出行方式可分別表示如下:

(8)

為了避免盲目湊試,本文利用交叉驗證來尋找SVM模型的最佳參數(shù),再利用最佳參數(shù)訓(xùn)練模型進行預(yù)測.將分類精度作為評判模型性能的重要指標,計算公式如下:

(9)

式中,Q為模型分類精度;R為預(yù)測正確樣本個數(shù);N為預(yù)測樣本總量.

利用Matlab 2014進行編程,將個人社會經(jīng)濟變量和第1階段的MIMIC模型中的心理潛變量作為樣本點帶入建模,樣本總量為2 660,前1 800個作為訓(xùn)練樣本,其余860個作為測試樣本.綜合考慮計算時間和分類精度,將SVM參數(shù)設(shè)置如下:交叉驗證系數(shù)H=5,懲罰因子-10≤C≤10,核函數(shù)參數(shù)-10≤σ≤10.程序執(zhí)行結(jié)果顯示最佳懲罰系數(shù)C為0.87,最佳核參數(shù)σ為0.21.此模型的訓(xùn)練樣本分類精度為1 577/1 800=87.61%,測試樣本的分類精度為723/860=84.07%.

4 模型性能測試

為檢驗本文所建帶潛變量的SVM選擇模型的可靠性和實用性,將其與帶潛變量的傳統(tǒng)Logit混合選擇模型和不帶潛變量的SVM選擇模型進行比較,預(yù)測結(jié)果見表5.

表5 模型預(yù)測性能比較

可看出,帶潛變量的SVM選擇模型的預(yù)測正確率最高,帶潛變量的傳統(tǒng)Logit混合選擇模型次之,不帶潛變量的SVM選擇模型的預(yù)測正確率最低.所建模型比不帶潛變量的SVM選擇模型的精度提高了4.54%,比帶潛變量的傳統(tǒng)Logit混合選擇模型提高了2.56%.

表6中數(shù)據(jù)是以月收入敏感性分析為例,分析低碳出行方式比例變化規(guī)律.第1列為原有比例,后面3列分別為帶潛變量SVM選擇模型、帶潛變量Logit混合選擇模型以及不帶潛變量SVM選擇模型進行預(yù)測后的低碳出行在總樣本中的占比,其中比例變化是指收入由低到高時低碳出行方式占比的減少量.由表可知,隨著月收入提高,低碳出行方式的占比不斷減少,在3個模型中,帶潛變量SVM選擇模型的減少幅度最大,與原有比例更接近,帶潛變量的Logit混合選擇模型次之,而不帶潛變量SVM選擇模型減少幅度最小.

表6 低碳出行方式占比與月收入間關(guān)系 %

由此可知,在大樣本量下,帶心理潛變量的選擇模型的精確度要高于不帶心理潛變量的選擇模型,說明低碳心理潛變量的補充能進一步提高出行選擇模型預(yù)測能力;而帶心理潛變量的模型中,SVM選擇模型的預(yù)測效果要優(yōu)于傳統(tǒng)的離散選擇模型,且這種精度的提高有利于后續(xù)變量的敏感性分析研究.

以上對于模型精度的驗證都是建立在樣本量充足的情況下,在樣本量大幅減少時,傳統(tǒng)離散選擇模型由于樣本量要求可能無法完成建模和預(yù)測,而帶潛變量的SVM選擇模型仍然能夠保持較高精確度.本文選擇280個樣本進行驗證,其中200個樣本用于訓(xùn)練,80個用于預(yù)測,結(jié)果見圖2.

圖2 小樣本下的模型測試

由圖2可知,在280個樣本量的情況下,帶潛變量的SVM選擇模型仍然保持較高的訓(xùn)練精度和預(yù)測精度,分別達到86.0%和82.5%,與大樣本下的模型性能相差不大.

5 結(jié)論

1) 本文基于計劃行為理論,考慮低碳出行心理因素,建立了多原因多指標潛變量模型,然后將潛變量模型預(yù)測出的潛變量帶入支持向量機分類器,構(gòu)建了帶潛變量的SVM選擇模型,并利用交叉驗證算法優(yōu)化支持向量機模型參數(shù).

2) 以長三角地區(qū)2 660個居民通勤調(diào)查樣本為研究對象實證檢驗?zāi)P托阅?實證結(jié)果表明本文所建模型具有較好的預(yù)測效果,比不帶潛變量的SVM選擇模型的精度提高了4.54%,比傳統(tǒng)的帶潛變量的Logit混合選擇模型提高了2.56%,同時,進行了小樣本下的性能測試,結(jié)果顯示分類正確率仍然較高,所建模型能夠為出行方式選擇模型和低碳出行方式選擇研究的提供一定的理論參考.

3) 本文所建模型在兼顧精度情況下,相對于傳統(tǒng)預(yù)測模型,大大降低了樣本量的要求,因此,實際建模時難度降低,同時在進行后續(xù)變量敏感性分析時,精度的提高使得分析更加準確,模型結(jié)果能比較直觀地反映變化情況,有利于低碳出行相關(guān)政策的制定.

References)

[1]Ben-Akiva M, Mcfadden D, Train K, et al. Hybrid choice models: Progress and challenges[J].MarketingLetters, 2002, 13(3): 163-175.

[2]景鵬,雋志才,查奇芬.考慮心理潛變量的出行方式選擇行為模型[J].中國公路學(xué)報,2014,27(11):84-92. Jing Peng, Juan Zhicai, Zha Qifen. Psychological latent variables into travel incorporating choice model[J].ChinaJournalofHighwayandTransport, 2014, 27(11): 84-92. (in Chinese)

[3]Jing Peng, Juan Zhicai, Gao Linjie. Application of the expanded theory of planned behavior in intercity travel behavior[J].DiscreteDynamicsinNatureandSociety, 2014, 2014: 1-10. DOI:10.1155/2014/308674.

[4]劉廣東.基于支持向量機的地面驅(qū)動螺桿泵井工況診斷技術(shù)[J].排灌機械工程學(xué)報,2014,32(2):125-129. Liu Guangdong. Working conditions diagnosis of surface-driving progressive cavity pump wells based on support vector machine[J].JournalofDrainageandIrrigationMachineryEngineering, 2014, 32(2): 125-129. (in Chinese)

[5]朱周,路小波,衛(wèi)朋,等.基于超像素和支持向量機的車輛陰影檢測算法[J].東南大學(xué)學(xué)報(自然科學(xué)版),2015,45(3):443-447. DOI:10.3969/j.issn.1001-0505.2015.03.006. Zhu Zhou, Lu Xiaobo, Wei Peng, et al. Vehicle shadow detection algorithm based on superpixel and SVM[J].JournalofSoutheastUniversity(NaturalScienceEdition), 2015, 45(3): 443-447. DOI:10.3969/j.issn.1001-0505.2015.03.006.(in Chinese)

[6]Tsapakis I, Schneider W H. Use of support vector machines to assign short-term counts to seasonal adjustment factor groups[J].TransportationResearchRecord, 2015, 2527: 8-17. DOI: 10.3141/2527-02.

[7]Jiang X S, Zhang L, Chen X Q (Michael). Short-term forecasting of high-speed rail demand: A hybrid approach combining ensemble empirical mode decomposition and gray support vector machine with real-world applications in China[J].TransportationResearchPartC:EmergingTechnologies, 2014, 44: 110-127. DOI:10.1016/j.trc.2014.03.016.

[8]許鐵,高林杰,景鵬,等.基于PSO-SVM的居民出行方式預(yù)測模型[J].交通運輸系統(tǒng)工程與信息,2011,11(5):155-161. DOI:10.3969/j.issn.1009-6744.2011.05.023. Xu Tie, Gao Linjie, Jing Peng, et al. Prediction model of residents’ trip mode based on PSO-SVM[J].JournalofTransportationSystemsEngineeringandInformationTechnology, 2011, 11(5): 155-161. DOI:10.3969/j.issn.1009-6744.2011.05.023.(in Chinese)

[9]楊敏,丁劍,王煒.基于ARIMA-SVM模型的快速公交停站時間組合預(yù)測方法[J].東南大學(xué)學(xué)報(自然科學(xué)版),2016,46(3):651-656. Yang Min, Ding Jian, Wang Wei. Hybrid dwell time prediction method for bus rapid transit based on ARIMA-SVM model[J].JournalofSoutheastUniversity(NaturalScienceEdition), 2016, 46(3): 651-656. (in Chinese)

[10]金楠.大城市居民低碳出行方式選擇影響因素研究[D].重慶:重慶交通大學(xué)交通運輸學(xué)院,2013.

[11]陳月霞,陳龍,查奇芬.鎮(zhèn)江城市交通微觀主體碳排放測度[J].江蘇大學(xué)學(xué)報:自然科學(xué)版,2015,36(6):645-649. Chen Yuexia, Chen Long, Zha Qifen. Carbon emissions measurement of urban traffic individual in Zhenjiang[J].JournalofJiangsuUniversity:NaturalScienceEditions, 2015, 36(6): 645-649. (in Chinese)

[12]Ajzen I. The theory of planned behaviour: Reactions and reflections[J].Psychology&Health, 2011, 26(9): 1113-11127. DOI:10.1080/08870446.2011.613995.

[13]劉蔚.城市居民低碳出行的影響因素及引導(dǎo)策略研究[D].北京:北京理工大學(xué)管理與經(jīng)濟學(xué)院,2014.

[14]Stevens J. Applied multivariate statistics for the social sciences[J].JournalofEducationalStatistics, 2015, 57(100): 68-69.

[15]Nunnally J C, Bernstein I H.Psychometrictheory[M]. New York: McGraw-Hill, 1967: 248-292.

Forecasting model of travel mode based on latent variable SVM

Chen Yuexia1Chen Long1Zha Qifen2Jing Peng1Xie Junping1Xiong Xiaoxia1

(1School of Automobile and Traffic Engineering, Jiangsu University, Zhenjiang 212013, China)(2School of Finance & Economics, Jiangsu University, Zhenjiang 212013, China)

In order to improve the prediction accuracy of the travel mode choice model under small samples, a support vector machine (SVM) algorithm considering the low carbon travel psychological variables is proposed. Based on the theory of planned behavior (TPB), considering low carbon travel psychological factors, latent variable models with multiple causes and indicators are established. Substituting the forecasted latent variables into the SVM classifier, a SVM selection model with latent variables is then proposed. The mixed selection parameters are obtained using cross validation optimization, and the model performance is validated based on urban residents’ data in Yangtze River Delta region. Empirical results show that the established SVM selection model with latent variables has a better prediction accuracy, improved by 4.54% compared with the SVM without latent variables, and 2.56% by the traditional model with latent variables. Results prove that the model still has a high precision with small samples. This study provides a theoretical reference for the travel choice model and low carbon travel choice research.

mixed selection model; support vector machine(SVM); multiple indicators and multiple causes; theory of planned behavior; cross validation algorithm

10.3969/j.issn.1001-0505.2016.06.034

2016-05-08. 作者簡介: 陳月霞(1982—),女,博士生;陳龍(聯(lián)系人),男,博士,教授,博士生導(dǎo)師,chenlong@ujs.edu.cn.

國家自然科學(xué)基金資助項目(71373105, 61573171, 51208232)、江蘇省“六大人才高峰”資助項目(2015-JY-025)、江蘇省高??蒲袆?chuàng)新計劃資助項目(CXZZ12_0663).

陳月霞,陳龍,查奇芬,等.基于潛變量SVM的出行方式預(yù)測模型[J].東南大學(xué)學(xué)報(自然科學(xué)版),2016,46(6):1313-1317.

10.3969/j.issn.1001-0505.2016.06.034.

U491.1

A

1001-0505(2016)06-1313-05

猜你喜歡
樣本量精度變量
醫(yī)學(xué)研究中樣本量的選擇
抓住不變量解題
也談分離變量
航空裝備測試性試驗樣本量確定方法
基于DSPIC33F微處理器的采集精度的提高
電子制作(2018年11期)2018-08-04 03:25:38
Sample Size Calculations for Comparing Groups with Binary Outcomes
GPS/GLONASS/BDS組合PPP精度分析
SL(3,3n)和SU(3,3n)的第一Cartan不變量
改進的Goldschmidt雙精度浮點除法器
分離變量法:常見的通性通法
信阳市| 卢湾区| 拜城县| 体育| 图木舒克市| 周至县| 唐河县| 沙河市| 沅陵县| 恭城| 深泽县| 铁力市| 花垣县| 六枝特区| 垣曲县| 西丰县| 阿巴嘎旗| 阳新县| 百色市| 化州市| 新蔡县| 横峰县| 梧州市| 林州市| 三江| 南澳县| 长子县| 安岳县| 莱芜市| 金秀| 南汇区| 乌鲁木齐市| 曲靖市| 五大连池市| 同心县| 五常市| 奉节县| 高陵县| 揭阳市| 望城县| 普格县|