国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Logistic回歸模型的高鐵客運(yùn)市場(chǎng)細(xì)分

2018-03-30 00:44:56李彥瑾羅霞劉悅朱海
關(guān)鍵詞:細(xì)分客運(yùn)旅客

李彥瑾,羅霞,劉悅,朱海

(西南交通大學(xué),交通運(yùn)輸與物流學(xué)院,成都 610031)

0 引 言

市場(chǎng)細(xì)分有助于運(yùn)輸企業(yè)快速高效地確定目標(biāo)市場(chǎng),對(duì)改善客運(yùn)產(chǎn)品、提高運(yùn)營效益具有積極意義。自市場(chǎng)細(xì)分概念提出以來,國內(nèi)外學(xué)者對(duì)其進(jìn)行了大量研究。國外研究方面,Tony指出目前市場(chǎng)細(xì)分的研究主要分為兩個(gè)方向:消費(fèi)者導(dǎo)向型與產(chǎn)品導(dǎo)向型[1]。Tsai則提出以消費(fèi)者的最近一次消費(fèi)時(shí)間、消費(fèi)頻率、消費(fèi)金額3個(gè)變量進(jìn)行細(xì)分并識(shí)別最有價(jià)值的客戶[2]。國內(nèi)鐵路市場(chǎng)研究方面,趙娟等基于市場(chǎng)細(xì)分理論,運(yùn)用因子和聚類分析方法對(duì)京滬高鐵旅客調(diào)研數(shù)據(jù)進(jìn)行研究[3]。錢丙益等結(jié)合武廣客運(yùn)專線旅客問卷調(diào)查數(shù)據(jù),采用混合回歸模型,將市場(chǎng)細(xì)分為效率型、經(jīng)濟(jì)型、休閑型、體驗(yàn)型4個(gè)細(xì)分市場(chǎng)[4]。

從現(xiàn)有研究來看,目前國內(nèi)對(duì)鐵路市場(chǎng)細(xì)分的研究以產(chǎn)品為導(dǎo)向的細(xì)分方法為主,變量一般包括安全、速度、準(zhǔn)點(diǎn)和價(jià)格等,而從復(fù)雜的旅客出行特征角度出發(fā),利用概率分類法進(jìn)行市場(chǎng)細(xì)分的精確研究仍然較少。

在渝利鐵路開通運(yùn)營之后,為使其具備優(yōu)良的客運(yùn)管理水平以及競(jìng)爭(zhēng)實(shí)力,需要研究出一套科學(xué)的、可操作性強(qiáng)的客運(yùn)市場(chǎng)細(xì)分方法,準(zhǔn)確應(yīng)對(duì)市場(chǎng)需求,設(shè)計(jì)合理的渝利鐵路運(yùn)輸產(chǎn)品。因此,本文以渝利鐵路客運(yùn)市場(chǎng)為實(shí)際案例,根據(jù)旅客出行行為特征,選取Logistic智能分類算法對(duì)渝利鐵路客運(yùn)市場(chǎng)進(jìn)行細(xì)分,并對(duì)各細(xì)分市場(chǎng)的旅客特征進(jìn)行歸納總結(jié),具有一定的應(yīng)用意義。

1 調(diào)查概述

本次旅客出行調(diào)查分為預(yù)調(diào)查和正式調(diào)查兩個(gè)階段。預(yù)調(diào)查于2015年9月5日在重慶北站候車大廳進(jìn)行,受訪者為高鐵乘客和動(dòng)車組乘客,設(shè)計(jì)并采用了RP/SP組合的調(diào)查問卷。正式調(diào)查于2015年9月12日在重慶北站候車大廳和重慶—利川涼霧站方向的渝利高鐵列車上進(jìn)行,并針對(duì)預(yù)調(diào)查存在的問題對(duì)問卷進(jìn)行了改進(jìn)。

本次調(diào)研包含2個(gè)工作日和1個(gè)休息日,涉及重慶北站、復(fù)盛站、長壽北站、涪陵北站、豐都站、沙子站和涼霧站7個(gè)車站。其中預(yù)調(diào)查在1個(gè)工作日內(nèi)進(jìn)行,正式調(diào)查分為1個(gè)工作日與1個(gè)休息日兩個(gè)階段進(jìn)行。

選擇1個(gè)工作日(星期三)進(jìn)行前期預(yù)調(diào)查,回收與處理問卷1 492份。各車站回收問卷數(shù)量如圖1所示。由圖1可以看出,各個(gè)車站的受訪者數(shù)量分布并不均勻,利川站的受訪比重過多。這將影響我們對(duì)調(diào)查結(jié)果的分析處理,因此本文通過優(yōu)化問卷結(jié)構(gòu)、簡(jiǎn)化問題設(shè)置并選擇另一個(gè)工作日(星期二)開始進(jìn)行正式調(diào)查。

圖1 工作日內(nèi)預(yù)調(diào)查各站點(diǎn)回收問卷數(shù)量Fig.1 Number of questionnaires collected at each station during weekdays

正式調(diào)查采用改進(jìn)后的調(diào)查問卷,回收與處理問卷1 298份。由圖2可得,雖然各車站回收問卷數(shù)量較改進(jìn)前更均勻,但利川站的回收份數(shù)依然是最高的。這表明可能有其他因素影響調(diào)查結(jié)果。因此,選擇1個(gè)休息日(星期六)再次進(jìn)行正式調(diào)查,以此來判斷調(diào)查時(shí)間因素是否會(huì)對(duì)調(diào)查結(jié)果產(chǎn)生重要影響。

圖2 工作日內(nèi)正式調(diào)查各站點(diǎn)回收問卷數(shù)量Fig.2 Number of valid questionnaires during weekdays

在1個(gè)休息日進(jìn)行正式調(diào)查,回收與處理問卷1 374份,各車站回收的問卷數(shù)量如圖3所示。由圖3可得,在休息日內(nèi)各站點(diǎn)回收數(shù)量基本均勻,表明調(diào)查時(shí)間確實(shí)為影響調(diào)查結(jié)果的主要因素。

圖3 休息日內(nèi)正式調(diào)查各站點(diǎn)回收問卷數(shù)量Fig.3 Number of valid questionnaires during weekend

因此,本文采用分層抽樣的方法,分車次隨機(jī)選取旅客進(jìn)行面對(duì)面問卷調(diào)查,內(nèi)容包括年齡、職業(yè)、月收入、出行目的等旅客出行特征共計(jì)6個(gè)屬性。然后,分別選擇兩個(gè)數(shù)據(jù)集統(tǒng)計(jì)、處理來自工作日(星期二)與休息日(星期六)的調(diào)查數(shù)據(jù)。正式調(diào)查共回收4 890份調(diào)查問卷,篩選除去信息殘缺的調(diào)查問卷,得到4 164份有效問卷。

2 建模與算法

Logistic回歸分類作為概率分類法的常見類型,其分類標(biāo)準(zhǔn)為使后驗(yàn)概率達(dá)到最大。通過這樣的分類方法,可以在樣本數(shù)據(jù)可信度較低的時(shí)候不進(jìn)行強(qiáng)制分類,排除樣本中的“噪聲”干擾,從而避免分類錯(cuò)誤。另外,這種基于概率的模式分類算法還能夠?qū)Χ喾N屬性的樣本分類問題得到一個(gè)較顯著的分類結(jié)果[5]。因此,本文選用Logistic回歸分類進(jìn)行市場(chǎng)細(xì)分。

2.1 基本原理

假設(shè)渝利鐵路旅客市場(chǎng)上存在N個(gè)旅客,第n(n=1,2,3,…,4 164)個(gè)旅客對(duì)樣本中第i個(gè)屬性xi(i=1,2,3,…,6)的評(píng)價(jià)為xni,對(duì)產(chǎn)品的總體評(píng)價(jià)為yn。假設(shè)存在c個(gè)細(xì)分市場(chǎng),每個(gè)細(xì)分市場(chǎng)在整個(gè)客運(yùn)市場(chǎng)的占比分別為θ1,θ2,…,θc,滿足(即滿足概率總和為1的約束條件)。

根據(jù)Logistic回歸,使用線性對(duì)數(shù)函數(shù)對(duì)分類后驗(yàn)概率q(yj|xi)進(jìn)行模型化:

式中,q(yj|xi;θ)為第i(i=1,2,3,…,6)個(gè)屬性xi影響第j(j=1,2,3,…,n)個(gè)總體評(píng)價(jià)樣本yj的概率,θ為待優(yōu)化參數(shù),表示分類后的各個(gè)子市場(chǎng)比例;φj(x)為第j個(gè)樣本中各個(gè)屬性x的具體取值。

2.2 模型求解

利用對(duì)數(shù)最大似然函數(shù)法求解Logistic回歸分類模型。其中,似然函數(shù)是將當(dāng)前樣本,i=1,2,…,6由式(1)分類的概率看作是一個(gè)關(guān)于參數(shù)θ的函數(shù),而對(duì)數(shù)似然函數(shù)是指其對(duì)數(shù)。于是,作如下變換:似然→對(duì)數(shù)似然

因此,可將該分類問題等價(jià)為下式的最優(yōu)化問題來定義:

上述目標(biāo)效用函數(shù)Q對(duì)于參數(shù)θ是可以微分的,故可利用概率梯度法來求解最大似然估計(jì)問題的解,具體算法如下:

①給定θ以適當(dāng)?shù)爻踔担疚娜?.25(假定初始有4個(gè)子市場(chǎng),所占市場(chǎng)份額均等為0.25),收斂精度η=0.01;

② 將隨機(jī)抽樣的有效樣本導(dǎo)入(xi,yj),i=1,2,3,…,6,j=1,2,3,…,4164;

③ 對(duì)于選定的訓(xùn)練樣本,以梯度上升的方向?qū)?shù)θ=(θ(1)T,…,θ(c)T)T,c=1,2,3,4按下式進(jìn)行更新:

此處,ε為表示梯度上升幅度的正常數(shù),取0.001。?yJj(θ)是指順序?yàn)閖的訓(xùn)練樣本所對(duì)應(yīng)的對(duì)數(shù)似然函數(shù)Jj(θ)=logq(yj|xi;θ)關(guān)于θ(y)的梯度上升方向。

2.3 求解結(jié)果

本文將隨機(jī)抽樣獲取的4 164份有效調(diào)查問卷,通過將問卷中各個(gè)問題選項(xiàng)進(jìn)行數(shù)據(jù)預(yù)處理并導(dǎo)入matlab中,采取Logistic回歸法進(jìn)行市場(chǎng)細(xì)分,再利用概率梯度算法進(jìn)行求解,得出算法收斂圖與市場(chǎng)細(xì)分圖如圖4、圖5所示。

圖4 模型求解算法收斂圖Fig.4 Model convergence

圖5 按旅客出行目的屬性維度方向投影的市場(chǎng)細(xì)分圖Fig.5 Market segments by trip purpose

由圖4可以看出:算法初始階段在各個(gè)方向搜索最優(yōu)梯度,當(dāng)?shù)?2次時(shí)獲得可行的梯度方向并朝著效用函數(shù)值增大的方向收斂;當(dāng)運(yùn)行至第37次時(shí)開始平穩(wěn),并在迭代第46次時(shí)獲得平穩(wěn)解,此時(shí)效用函數(shù)值為0.988。最后該平穩(wěn)解滿足收斂精度要求,從而終止算法將效用值歸0。

由圖5可以看出:Logistic回歸分類法最終將容量為4 164的調(diào)查數(shù)據(jù)樣本分為了3類,且絕大部分樣本細(xì)分后的效用函數(shù)值在0.932以上并在0.988左右到達(dá)穩(wěn)定極值點(diǎn),反映出客運(yùn)市場(chǎng)細(xì)分效果較好。

3 子市場(chǎng)描述

將分類后其效用函數(shù)值分布于[0.932,0.992]區(qū)間的樣本數(shù)據(jù)進(jìn)行提取與計(jì)數(shù),可以得到細(xì)分后三個(gè)子市場(chǎng)的樣本容量大小,分別為:子市場(chǎng)1(1 822)、子市場(chǎng)2(891)、子市場(chǎng)3(1 134)。其余樣本數(shù)據(jù)經(jīng)分類后,未分布在效用顯著區(qū)間,故不予統(tǒng)計(jì)。

3.1 聚類中心識(shí)別

分別搜索各個(gè)子市場(chǎng)的類中心,并以類中心為圓心按子市場(chǎng)容量的55%為半徑,選擇各個(gè)子類的代表性樣本數(shù)據(jù),如圖6所示。

圖6 按代表性樣本數(shù)據(jù)的市場(chǎng)細(xì)分Fig.6 Clusters of the sub-markets

3.2 子市場(chǎng)劃分

將提取出的代表性樣本數(shù)據(jù)按出行目的進(jìn)行歸納,可總結(jié)為:外出務(wù)工型(子市場(chǎng)1)、非經(jīng)濟(jì)出行型(子市場(chǎng)2)、商務(wù)出行型(子市場(chǎng)3)。并按照年齡、月收入和職業(yè)3個(gè)旅客特征指標(biāo)進(jìn)行統(tǒng)計(jì)分析,分別對(duì)每個(gè)子市場(chǎng)進(jìn)行細(xì)分,得到經(jīng)濟(jì)實(shí)惠、中堅(jiān)力量和出行品質(zhì)注重三個(gè)子群體。故建立子市場(chǎng)細(xì)分模型,如表1所示。

表1 子市場(chǎng)旅客容量統(tǒng)計(jì)表Tab.1 Population statistics of the submarkets

3.3 子市場(chǎng)合并與描述

由于需求模式最終反映為出行行為模式,同時(shí)為了便于進(jìn)行產(chǎn)品設(shè)計(jì),需要對(duì)市場(chǎng)采取一定的規(guī)則進(jìn)行合并,使之更貼合實(shí)際生產(chǎn)運(yùn)營的需要。其中,合并規(guī)則包括以下兩個(gè)方面:①將市場(chǎng)容量明顯偏小的子市場(chǎng)合并;②合并性質(zhì)類似的市場(chǎng)。故合并完成后的市場(chǎng)細(xì)分如表2所示。

由此可見,客運(yùn)市場(chǎng)被細(xì)分為如表3所示的A-E共計(jì)5個(gè)子市場(chǎng),且各個(gè)子市場(chǎng)具有顯著的差異化特征。

表2 合并后子市場(chǎng)旅客容量統(tǒng)計(jì)Tab.2 Population statistics of regrouped submarkets

表3 合并后子市場(chǎng)特征描述表Tab.3 Descriptive statistics of the regrouped submarkets

4 結(jié) 論

針對(duì)市場(chǎng)細(xì)分的旅客特征分析,本文得出如下結(jié)論:

(1)利用Logistic回歸分類法對(duì)隨機(jī)抽樣樣本數(shù)據(jù)分類處理,可在較少迭代次數(shù)內(nèi)得到平穩(wěn)解,利用出行目的維度投影得到的二維圖,表明該方法分類效果比較顯著。

(2)通過對(duì)子市場(chǎng)的合并,發(fā)現(xiàn)在各個(gè)子市場(chǎng)內(nèi)旅客的年齡、月收入與出行目的是進(jìn)行高鐵客運(yùn)市場(chǎng)細(xì)分和市場(chǎng)特征描述的顯著影響指標(biāo)。

(3)如何根據(jù)分析結(jié)果,對(duì)各細(xì)分市場(chǎng)的需求進(jìn)行預(yù)測(cè),并進(jìn)而制定科學(xué)的產(chǎn)品定價(jià)實(shí)現(xiàn)高鐵運(yùn)營收益最大化,將是下一步的研究方向。

[1] LUNN T. Segmenting and constructing markets[A].Robert Worcester and John Downham. Consumer market research handbook,Third revised and enlarged edition[C].Elsevier Science Pulishers B. V. ,1986,387-423.

[2] TSAI C Y,CHIU C C. A purchase-based market segmentation methodology[J]. Expert Systems with Applications,2004,27(2):265-276.

[3] 趙娟,任民. 京滬高鐵客運(yùn)市場(chǎng)細(xì)分與客票營銷策略研究[J]. 鐵道經(jīng)濟(jì)研究,2014(6):13-17.

[4] 錢丙益,帥斌,陳崇雙,等. 基于混合回歸模型的客運(yùn)專線旅客市場(chǎng)細(xì)分研究[J]. 鐵道運(yùn)輸與經(jīng)濟(jì),2014,36(1):60-65.

[5] TITTERINGTON D M,SMITH A F M,MAKOV U E.Statistical analysis of finite mixture distributions[M].New York:Wilcy,1985.

猜你喜歡
細(xì)分客運(yùn)旅客
非常旅客意見簿
客運(yùn)索道設(shè)備運(yùn)行初期的管理與創(chuàng)新
深耕環(huán)保細(xì)分領(lǐng)域,維爾利為環(huán)保注入新動(dòng)力
我是人
故事大王(2018年3期)2018-05-03 09:55:52
大數(shù)據(jù)在鐵路站段客運(yùn)市場(chǎng)營銷中的應(yīng)用探討
提高客運(yùn)駕駛?cè)税踩庾R(shí)
汽車與安全(2016年5期)2016-12-01 05:21:59
給小旅客的禮物
空中之家(2016年1期)2016-05-17 04:47:43
臺(tái)灣客運(yùn)業(yè):高鐵躲過破產(chǎn)危機(jī)?
1~7月,我國貨車各細(xì)分市場(chǎng)均有增長
專用汽車(2016年9期)2016-03-01 04:17:02
整體低迷難掩細(xì)分市場(chǎng)亮點(diǎn)
專用汽車(2015年2期)2015-03-01 04:05:42
海晏县| 长垣县| 海口市| 宜宾市| 炉霍县| 正蓝旗| 隆尧县| 厦门市| 资中县| 广河县| 新乡市| 沾益县| 安新县| 冷水江市| 宜兰市| 宁乡县| 长岛县| 东莞市| 四会市| 怀宁县| 富裕县| 屏东市| 辽阳市| 印江| 甘泉县| 涟源市| 新闻| 三台县| 德清县| 通道| 天峨县| 饶河县| 广元市| 讷河市| 光山县| 康乐县| 沈阳市| 嘉荫县| 山东省| 全椒县| 文成县|