国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多元統(tǒng)計(jì)分析的出租車資源配置模型研究

2017-07-21 15:33孫麗男張璇張靜劉德華
關(guān)鍵詞:多元線性回歸聚類分析主成分分析

孫麗男++張璇++張靜++劉德華

【摘要】利用打車軟件智能出行平臺(tái)獲取相關(guān)數(shù)據(jù),采用統(tǒng)計(jì)學(xué)方法分析不同時(shí)空出租車資源的“供需匹配”程度,為城市的出租車資源配置提供決策依據(jù).首先,選取國(guó)內(nèi)具有代表性的20個(gè)城市,利用聚類分析將其分為三類;其次,利用MATLAB對(duì)“出租車分布”和“出租車需求量分布”進(jìn)行了可視化,直觀分析了三類城市出租車資源“供需匹配”程度;最后,選取適當(dāng)指標(biāo),利用SPSS對(duì)數(shù)據(jù)進(jìn)行主成分分析及多元線性回歸,建立了模型,量化了出租車資源“供需匹配”程度與相關(guān)指標(biāo)的關(guān)系,從而可以通過(guò)控制各個(gè)指標(biāo)來(lái)優(yōu)化出租車資源配置.

【關(guān)鍵詞】供需匹配程度;主成分分析;聚類分析;多元線性回歸

【基金項(xiàng)目】2014年12月黑龍江省教育科學(xué)規(guī)劃辦重點(diǎn)課題,基于大數(shù)據(jù)技術(shù)的應(yīng)用型本科院校統(tǒng)計(jì)學(xué)專業(yè)人才培養(yǎng)模式研究與實(shí)踐(編號(hào):GJB1214026).

隨著人們生活水平的日益提高,城市交通網(wǎng)越來(lái)越發(fā)達(dá),城市交通工具趨于多樣性,私家車擁有量逐年飆升,盡管如此,受各種政策和客觀條件的影響,出租車仍然是我國(guó)城鎮(zhèn)市民出行重要的交通工具.由于出租車市場(chǎng)監(jiān)管不夠嚴(yán)格,城鄉(xiāng)接合部面積擴(kuò)張迅速等原因,一些城市出現(xiàn)了“打車難”現(xiàn)象,特別是流動(dòng)人口多的旅游城市這種現(xiàn)象更加突出[1].為了緩解這一現(xiàn)象,打車軟件應(yīng)運(yùn)而生并推出了許多優(yōu)惠和補(bǔ)貼政策,一時(shí)間受到了廣大司機(jī)和消費(fèi)者的青睞.與此同時(shí),打車軟件智能出行平臺(tái)內(nèi)承載的海量數(shù)據(jù)也隨著大數(shù)據(jù)時(shí)代的到來(lái)日漸凸顯其重要的價(jià)值[2],通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行挖掘和分析必將對(duì)有效監(jiān)管出租車市場(chǎng)的發(fā)展、合理配置出租車資源提供決策支持.針對(duì)我們要解決的實(shí)際問(wèn)題,我們需要做以下模型假設(shè):(1)假設(shè)打車軟件系統(tǒng)無(wú)漏洞;(2)假設(shè)每個(gè)出租車公司出行政策相同;(3)假設(shè)每個(gè)地區(qū)軟件平均使用率相同;(4)假設(shè)每個(gè)出租車行駛里程單價(jià)相同;(5)假設(shè)出租需求與供給不受天氣影響;(6)假設(shè)道路交通里程數(shù)不變;(7)假設(shè)各個(gè)城市人口總數(shù)不變,出租車數(shù)量總數(shù)不變;

一、城市聚類分析

本小節(jié)選取聚類分析方法中系統(tǒng)聚類法[3]將一些重要城市聚類,為接下來(lái)的模型建立奠定基礎(chǔ).我們選取人口數(shù)、出租車擁有量等指標(biāo),利用系統(tǒng)聚類的分類方法將上海、北京、廣州等20個(gè)主要城市進(jìn)行聚類,將其分為三類,即一線交通發(fā)展城市、二線交通發(fā)展城市和三線交通發(fā)展城市.根據(jù)收集的統(tǒng)計(jì)數(shù)據(jù),利用上述聚類方法,我們得到20個(gè)城市聚類后的樹狀圖,從而我們可以得到聚類分析結(jié)果,見圖1.

進(jìn)一步,根據(jù)樹狀圖和指標(biāo)分布情況采用最長(zhǎng)距離法進(jìn)行分類.其中,最長(zhǎng)距離法所使用的公式為

它等于Gp與Gq中最遠(yuǎn)的兩個(gè)樣品的距離.

根據(jù)最長(zhǎng)距離法的定義及其公式,經(jīng)過(guò)三次分類,最終將北京、廣州聚為一類,定義為一線交通發(fā)展城市;沈陽(yáng)、武漢、哈爾濱、濟(jì)南、寧波、杭州、廈門和深圳聚為一類,定義為二線交通發(fā)展城市;剩余城市聚為一類,定義為相對(duì)發(fā)展較弱的三線交通發(fā)展城市.進(jìn)行分類后,我們即可選取北京、沈陽(yáng)和南京分別作為各類城市中的代表.

我們對(duì)北京、沈陽(yáng)和南京三個(gè)城市的打車需求量與出租車分布利用MATLAB進(jìn)行三維模擬,并進(jìn)行兩個(gè)指標(biāo)間的比較.

由圖2、圖3可知,北京出租車分布情況的密集程度與需求量的分布程度部分地區(qū)基本一致,但總體差異性比較大,即北京的供求匹配不合理,需要重新合理分配出租車分布.南京出租車分布情況的密集程度與需求量的分布程度類似,但需求量很少,由此造成出租車空載率増大,資源浪費(fèi),因此,需要重新分配出租車分布以達(dá)到供需匹配平衡.沈陽(yáng)分布出現(xiàn)的問(wèn)題與南京相同,因此,需要調(diào)整出租車分布.

二、主成分分析[4]和多元線性回歸模型

(一)模型建立

下面,我們將各城市出租車分布設(shè)為因變量y,難易度x1、需求量x2、搶單時(shí)間x3設(shè)為自變量,利用主成分分析對(duì)上述變量建立多元回歸模型,具體步驟如下:

第一步,針對(duì)三個(gè)自變量做因子分析,計(jì)算出各指標(biāo)的方差累積貢獻(xiàn)率,得出x2與x3的累積貢獻(xiàn)率大于85%,貢獻(xiàn)率較高,x1的貢獻(xiàn)率不高;

第二步,根據(jù)上述分析結(jié)果選取需求量x2、搶單時(shí)間x3作為因子,利用SPSS求得主成分prin1、prin2,見表2.

第三步,用y對(duì)兩個(gè)主成分prin1和prin2做普通最小二乘,獲得主成分系數(shù),得到主成分回歸方程為

(二)模型檢驗(yàn)與分析

根據(jù)系數(shù)表,我們可知各個(gè)參數(shù)對(duì)應(yīng)顯著性檢驗(yàn)的p值均小于顯著性水平0.05,因此,上述模型通過(guò)檢驗(yàn).根據(jù)上述模型可知乘客對(duì)出租車的需求量與出租車的分布情況呈負(fù)相關(guān),因此,出租車的分布與出租車的需求之間矛盾,造成出租車空載率增大,分布不合理,應(yīng)有效改善出租車分布情況,提高利用率,盡可能地平衡分布與需求的關(guān)系.

(三)模型應(yīng)用

下面我們通過(guò)對(duì)模型簡(jiǎn)單應(yīng)用,進(jìn)一步比較觀測(cè)值和預(yù)測(cè)值,從而更直觀地感受模型的回歸效果及應(yīng)用價(jià)值.

北京的模型應(yīng)用:當(dāng)難易度為9 452、需求量為707 154、搶單時(shí)間為604 100.55時(shí),代入y=0.284x1-0.055x2+0479x3+56.181,得出租車分布為692 302,該數(shù)值與觀測(cè)值相差不大,本模型預(yù)測(cè)效果較佳.

沈陽(yáng)的模型應(yīng)用:當(dāng)難易度為2 857、需求量為294 228、搶單時(shí)間為20 594.38時(shí),代入y=0.536x1-1.559x2+0049x3+41.806,得出租車分布為291 371,該數(shù)值與觀測(cè)值相差不大,本模型預(yù)測(cè)效果較佳.

南京的模型應(yīng)用:當(dāng)難易度為4676、需求量為572 990、搶單時(shí)間為31 140.13時(shí),代入y=-2.036x1-0.103x2+046x3+84.46,得出租車分布為568 314,該數(shù)值與觀測(cè)值相差不大,本模型預(yù)測(cè)效果較佳.

除了上述模型的預(yù)測(cè)應(yīng)用外,其還可以進(jìn)行控制應(yīng)用,即政府部門或相關(guān)企業(yè)要想控制某區(qū)域內(nèi)的出租車分布,可以出臺(tái)相應(yīng)政策和措施調(diào)控難易度x1、需求量x2、搶單時(shí)間x3,進(jìn)而達(dá)到調(diào)控出租車配置的目的.

【參考文獻(xiàn)】

[1]潘玉奇,周勁,楊秀麗,袁寧.基于模糊聚類分析的數(shù)據(jù)檢索的應(yīng)用[J].微電子學(xué)與計(jì)算機(jī),2005(06):167-169,172.

[2]林玉川.移動(dòng)打車軟件用戶行為研究[D].廈門:廈門大學(xué),2014.

[3]何曉群.多元統(tǒng)計(jì)分析[M].北京:人民大學(xué)出版社,2015.

[4]韓冰.主成分分析和神經(jīng)網(wǎng)絡(luò)在工業(yè)經(jīng)濟(jì)數(shù)據(jù)中的應(yīng)用[D].長(zhǎng)春:吉林大學(xué),2014.

猜你喜歡
多元線性回歸聚類分析主成分分析
基于組合模型的卷煙市場(chǎng)需求預(yù)測(cè)研究
基于多元線性回歸分析的冬季鳥類生境選擇研究
我國(guó)上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實(shí)證研究
主成分分析法在大學(xué)英語(yǔ)寫作評(píng)價(jià)中的應(yīng)用
農(nóng)村居民家庭人均生活消費(fèi)支出分析
江蘇省客源市場(chǎng)影響因素研究
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
“縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
平乐县| 元朗区| 甘南县| 杂多县| 拉孜县| 潮安县| 星子县| 晋中市| 卓尼县| 新龙县| 屏南县| 姚安县| 永清县| 仙游县| 永登县| 安达市| 延寿县| 孟州市| 余江县| 巴林右旗| 山西省| 子洲县| 津市市| 靖西县| 华安县| 科技| 儋州市| 清流县| 乌恰县| 同仁县| 芜湖县| 马尔康县| 崇明县| 盐源县| 襄垣县| 苏尼特右旗| 阿图什市| 临朐县| 扬州市| 博客| 千阳县|