国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國家庭購車行為影響因素研究

2017-06-09 19:53:18張鑫
科學與財富 2017年9期

張鑫

摘要:隨著中國汽車工業(yè)的高速增長及汽車市場的日益成熟,汽車消費也成為拉動內(nèi)需的一個重要“引擎”。購車行為是整個消費者行為過程最關(guān)鍵的環(huán)節(jié)。因此,對于中國汽車消費者的購車決策影響因素進行分析具有重要意義。本文主要利用機器學習中的三種分類算法并建立ROC曲線,對中國家庭購車決策影響因素進行分析。

關(guān)鍵詞:購車決策;分類算法;ROC曲線

一、引言

當前社會,汽車已經(jīng)成為人們?nèi)粘I钪胁豢苫蛉钡某鲂泄ぞ?。本文利用中國家庭金融調(diào)查數(shù)據(jù),分別利用Logistic回歸,線性判別LDA分類器和非線性二次判別QDA分類器這三種分類算法進行對比研究,并采用ROC分析技術(shù),分析出對于中國家庭購車行為的影響因素問題哪種分類方法更優(yōu)。

二、研究算法簡介

用機器學習的方法來分析數(shù)據(jù),挖掘大量數(shù)據(jù)背后的知識已成為今后的研究趨勢。在解決實際問題時,分類模式和回歸模式是使用最普遍的。分類的目的是學會一個分類函數(shù)或者分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某個類。本文主要研究了Logistic回歸模型,線性判別LDA分類器和非線性二次判別QDA分類器三種分類算法的對比。評估分類規(guī)則的準確率是模型的關(guān)鍵,如果準確率可以接受,則分類規(guī)則可用于新的數(shù)據(jù)的分類。ROC曲線是用來衡量分類算法的一種分析方法,能全面分析分類算法的分類性能。目前,通用的方法是計算ROC曲線下的面積AUC。AUC是曲線下區(qū)域與單位面積的比值,它的值在0到1之間。通常AUC值越大,意味著分類性能越好。

三、數(shù)據(jù)來源、變量說明

3.1數(shù)據(jù)來源

本文數(shù)據(jù)采用西南財經(jīng)大學2011年中國家庭金融調(diào)查(CHFS)數(shù)據(jù)。涉及到25個?。ㄖ陛犑校?、80個縣、320個社區(qū)的8438戶家庭,CHFS數(shù)據(jù)庫中包括家庭購車決策、家庭各項收入、戶主個人特征,如年齡、受教育程度等信息。首先用Statal2.0對數(shù)據(jù)進行處理,最后選取了8個變量,6203戶家庭信息。

3.2變量說明

VI:carif,家庭的購車決策(若購車,carif=1;不購車,cafif=0);V2:house,家庭住房擁有量,作為家庭財富的替代變量;v3:In_income,家庭年收入取對數(shù),家庭年收入包括家庭工資性收入(稅后)、福利性補貼收入、財產(chǎn)性收入、生產(chǎn)經(jīng)營性收入及非家庭成員對其轉(zhuǎn)移性收入,且為減輕可能存在的異方差影響,對家庭收入變量取對數(shù)處理;v4:age,戶主的年齡;v5:size,家庭規(guī)模;V6:sex,戶主性別;v7:edu,戶主的受教育程度,將受教育水平為大專及大專以上的取值為1,其他為0。V8:mar,戶主的婚姻狀況。

四、實證結(jié)果分析

4.1Logistic回歸

4.1.1擬合

對家庭是否購買汽車的選擇模型,先對家庭的購車決策(V1),家庭住房擁有量(V2),家庭年收入(V3),戶主的年齡(V4),家庭規(guī)模(V5),戶主性別(V6),戶主的受教育程度(V7),戶主的婚姻狀況(V8)進行擬合。然后用Step()函數(shù)進行逐步回歸,篩選出影響顯著的變量,結(jié)果變量V2,V6,V8被剔除。

Logistic回歸結(jié)果輸出見表2。且模型輸出結(jié)果中,AIC=2077.3,由表2可知訓練出來的模型為:

4.1.2預測

建立模型的一個重要目的就是預測,下面對6203戶家庭購車決策模型進行預測,用Logistic預測的分類結(jié)果中288個錯判。

4.1.3分類性能評價

本文通過ROC曲線來衡量分類算法的分類性能,加載R語言中的pROC程序包。得到Logistic模型的ROC曲線如圖1。圖1中ROC曲線下方面積(AUC)為0.747,大于0.5。

4.2LDA分類算法

用到的是程序包MASS中的函數(shù)lda0,得到LDA分類算法對家庭購車決策的分類結(jié)果。對于LDA分類性能評價,得到LDA模型的ROC曲線如圖2。圖2中ROC曲線下方面積(AUC)為0.746。

4.3QDA分類算法

用到的是程序包MASS中的函數(shù)qda(),得到QDA分類算法對家庭購車決策的分類結(jié)果,其中有289戶家庭分類錯判。對于LDA分類性能評價,得到LDA模型的ROC曲線如圖3。圖3中ROC曲線下方面積(AUC)為0.749,優(yōu)于前兩種分類方法。

從以上研究發(fā)現(xiàn)影響家庭購車行為決策的因素主要有家庭年收入,家庭規(guī)模,戶主年齡及受教育程度。且通過Logistic回歸,線性判別LDA分類器和非線性二次判別QDA分類器這三種分類算法的對比研究,結(jié)合KOC分析技術(shù),發(fā)現(xiàn)二次判別函數(shù)QDA對于中國家庭購車行為的影響因素問題的研究更優(yōu)。

武平县| 宣化县| 桂平市| 周至县| 天柱县| 古田县| 繁昌县| 紫阳县| 平阴县| 桑日县| 交口县| 明光市| 陆川县| 英吉沙县| 界首市| 瓮安县| 喀喇沁旗| 蓬安县| 桂阳县| 通山县| 界首市| 依安县| 乐安县| 抚州市| 张北县| 康乐县| 比如县| 日照市| 舞阳县| 安远县| 桐城市| 阜康市| 广州市| 阿拉善右旗| 浙江省| 甘肃省| 满洲里市| 绥江县| 青龙| 西乡县| 榕江县|