簡國明,黃文莉,王尚九,黃冰娜,周碧江
(韶關(guān)學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣東韶關(guān)512005)
大數(shù)據(jù)下消費(fèi)者網(wǎng)購影響因素的因子分析模型
簡國明,黃文莉,王尚九,黃冰娜,周碧江
(韶關(guān)學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,廣東韶關(guān)512005)
利用八爪魚采集器采集淘寶網(wǎng)站某款產(chǎn)品銷售的指標(biāo)數(shù)據(jù)來研究消費(fèi)者網(wǎng)購的影響因素。首先,經(jīng)過數(shù)據(jù)預(yù)處理后得到776家店鋪的數(shù)據(jù),共包含8個主要指標(biāo)。然后,應(yīng)用統(tǒng)計(jì)方法,建立了含有8指標(biāo)的因子分析模型,運(yùn)用SPSS軟件進(jìn)行求解,得出了相應(yīng)的影響因素的相關(guān)結(jié)論。因子分析模型的結(jié)果顯示,大數(shù)據(jù)下消費(fèi)者網(wǎng)購影響因素指標(biāo)可歸結(jié)為:服務(wù)質(zhì)量、人氣指數(shù)、安全保障及價格。
大數(shù)據(jù);消費(fèi)者網(wǎng)購;影響因素;因子分析
近些年,隨著我國網(wǎng)絡(luò)購物市場的飛速興起,網(wǎng)絡(luò)購物的客戶規(guī)模也在不斷壯大[1]。中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的《2015年中國網(wǎng)絡(luò)購物市場研究報告》顯示:截至2015年12月,我國網(wǎng)絡(luò)購物用戶規(guī)模達(dá)4.13億,同比增加5 183萬,增長率為14.3%,高于6.1%的網(wǎng)民數(shù)量增長率[2]。在“大數(shù)據(jù)”炒得火熱的時代,網(wǎng)購現(xiàn)象也變得越發(fā)普及和流行,影響消費(fèi)者網(wǎng)購的因素有很多,本文將針對淘寶網(wǎng)上某款產(chǎn)品的相關(guān)指標(biāo)數(shù)據(jù),通過建立因子分析模型,找到當(dāng)代消費(fèi)者網(wǎng)購的影響因子。
本文以淘寶網(wǎng)上銷售的同一規(guī)格的天堂傘作為研究對象,參考文獻(xiàn)[3]所用指標(biāo),從淘寶網(wǎng)頁面上可獲取下列關(guān)于網(wǎng)購的相關(guān)信息:淘寶價、淘金幣抵價、快遞費(fèi)、描述相符(0~5分)、服務(wù)態(tài)度(0~5分)、物流速度(0~5分)、收藏?cái)?shù)、好評數(shù)、賣家信用積分、保證金。首先,在淘寶網(wǎng)上共搜索到3 970家店鋪,然后,利用八爪魚采集器采集上述10個指標(biāo)的數(shù)據(jù),最終共采集到57 428個顧客購買情況的信息。將其導(dǎo)入Excel中,刪除缺失值、極端值等;為避免數(shù)據(jù)受到多重共線性的影響,將價格表示為:價格=淘寶價+快遞費(fèi)-淘金幣抵價;對同一賣家不同顧客的購買情況做歸一化處理,最終得到776家店鋪含有8指標(biāo)的有效數(shù)據(jù),部分?jǐn)?shù)據(jù)如表1所示。
表1 776家店鋪含8指標(biāo)的部分?jǐn)?shù)據(jù)列表
因子分析[4]以最少的信息丟失為準(zhǔn)則,將原有變量用較少且相互獨(dú)立的公共因子反映,找出具有命名解釋性的公共因子,最終以因子得分線性表示各變量與因子間的關(guān)系。
2.1 因子分析的前提條件
首先,需確定上述指標(biāo)之間是否具有相關(guān)關(guān)系,相關(guān)關(guān)系強(qiáng)說明適合進(jìn)行因子分析。此處采用KMO和巴特利特球度檢驗(yàn)[5]對各指標(biāo)的測量項(xiàng)目進(jìn)行結(jié)構(gòu)效度分析,表2為SPSS 21軟件的輸出結(jié)果。
表2 KMO和Bartlett球度檢驗(yàn)
由該檢驗(yàn)結(jié)果可知:KMO檢驗(yàn)值為0.748,顯著性檢驗(yàn)的P值為0.000<0.05,說明此研究數(shù)據(jù)具有比較好的構(gòu)建效度,適合進(jìn)行因子分析。
2.2 主成分法求解因子載荷陣
首先對各變量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,計(jì)算標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣R;然后求相關(guān)系數(shù)矩陣R的特征值λ1≥λ2≥…≥λp≥0及其相應(yīng)的特征向量γ1,γ2…,γp;根據(jù)R的特征根及特征向量計(jì)算求出因子載荷陣[6],其中p代表指標(biāo)變量的個數(shù)。但由于提取的公因子個數(shù)m一定小于原有的指標(biāo)個數(shù)p,因此僅僅提取前面m個特征根與其對應(yīng)的特征向量,算出因子載荷陣。
2.3 根據(jù)累計(jì)貢獻(xiàn)率確定因子數(shù)
2.4 最大方差法旋轉(zhuǎn)因子
為了更好地解釋上述2.3抽取出的公因子的實(shí)際意義,使用正交方差最大旋轉(zhuǎn)法[7],使得旋轉(zhuǎn)后的因子載荷陣B*=BT的每列元素的方差之和達(dá)到最大,也使得每一個因子都具有鮮明的實(shí)際意義。
2.5 回歸法計(jì)算因子得分
因子得分是因子分析的終極體現(xiàn),是原有變量線性組合的結(jié)果,即用原來p個變量來描述因子,根據(jù)回歸法計(jì)算第j個因子的因子得分可表示為:Fj=βj1X1+…+βjpXp(j=1,…,m),其中βj1,…,βjp分別是第j個因子和第1,…,p個原有變量的因子值系數(shù)。
根據(jù)建立的因子分析模型,運(yùn)用SPSS軟件[8]求解得到的系列結(jié)果如表3所示。
表3 因子解釋各原變量總方差的情況
續(xù)表
根據(jù)表3可知,當(dāng)提取前4個因子后,解釋原有8個變量的累積方差貢獻(xiàn)率達(dá)到85.322%((2.613+ 2.192+1.059+0.963)÷8×100%=85.322%),說明從總體上看原有變量的信息丟失比較少,運(yùn)用因子分析的效果較理想。
3.1 采用正交方差最大旋轉(zhuǎn)法得到旋轉(zhuǎn)后的因子載荷矩陣
使用最大方差法對因子載荷陣旋轉(zhuǎn)過后使因子更具有解釋性,旋轉(zhuǎn)后的因子載荷矩陣及成分得分系數(shù)矩陣如表4所示。從表4左側(cè)顯示的各原有變量在4個因子上的載荷可知:服務(wù)態(tài)度、物流速度、描述相符這三個變量在第1個因子的載荷均大于0.9,因此可命名第1個因子為“服務(wù)質(zhì)量”因子;收藏?cái)?shù)、好評數(shù)這兩個變量在第2個因子的載荷均大于0.9,因此可命名第2個因子為“人氣指數(shù)”因子;賣家信用積分、保證金這兩個變量在第3個因子的載荷均比較大,因此可命名第3個因子為“安全保障”因子;由淘寶價減去優(yōu)惠價再加上快遞費(fèi)得到的價格在第4個因子上的載荷最高,因此命名第4個因子為“價格”因子。
表4 旋轉(zhuǎn)后的因子載荷矩陣及成分得分系數(shù)矩陣
3.2 回歸法計(jì)算因子得分
根據(jù)表4右側(cè)可寫出下列因子得分函數(shù):
F1=0.353描述相符+0.364服務(wù)態(tài)度+0.362物流速度-0.006收藏?cái)?shù)-0.011好評數(shù)+0.001賣家信用積分+0.018價格-0.002保證金。
F2=-0.013描述相符-0.006服務(wù)態(tài)度-0.002物流速度+0.477收藏?cái)?shù)+0.498好評數(shù)+0.174賣家信用積分+0.046價格-0.154保證金。
F3=-0.013描述相符+0.013服務(wù)態(tài)度+0.000物流速度-0.067收藏?cái)?shù)-0.159好評數(shù)-0.407賣家信用積分+0.037價格+0.833保證金。
F4=-0.017描述相符+0.000服務(wù)態(tài)度+0.051物流速度+0.055收藏?cái)?shù)+0.037好評數(shù)-0.058賣家信用積分+0.998價格+0.070保證金。
由因子得分函數(shù)可知,影響消費(fèi)者網(wǎng)購的所有因素指標(biāo)可歸納為4類:服務(wù)質(zhì)量、人氣指數(shù)、安全保障及價格。淘寶店鋪的競爭力也恰恰由這4個因素構(gòu)成,要想吸引顧客,提升店鋪的影響力,就必須在保證質(zhì)量的基礎(chǔ)上提升服務(wù)的優(yōu)越性、制定價格的合理性和確保安全的保障性,以此增加商品人氣,在同類商品中取得優(yōu)勢。
本文在抓取了眾多淘寶頁面顯示的指標(biāo)數(shù)據(jù)并對所有數(shù)據(jù)進(jìn)行預(yù)處理后,建立因子分析模型,將原有的指標(biāo)濃縮成“服務(wù)質(zhì)量”、“人氣指數(shù)”、“安全保障”和“價格”這4個具有命名解釋性的因子,各因子間相互獨(dú)立并且能夠反映原有變量絕大部分的信息,最終確認(rèn)了影響消費(fèi)者網(wǎng)購的因素指標(biāo)。本文的模型對于討論網(wǎng)購對傳統(tǒng)零售業(yè)的影響因素、消費(fèi)者網(wǎng)購滿意度等方面的研究也具有一定的借鑒作用和參考價值。
[1]郭崇.基于大數(shù)據(jù)分析的網(wǎng)購客戶忠誠度建模仿真[J].計(jì)算機(jī)仿真,2015,32(10):239-242.
[2]中國互聯(lián)網(wǎng)絡(luò)信息中心.2015年中國網(wǎng)絡(luò)購物市場研究報告[EB/OL].[2016-07-07].http://cnnic.cn/gywm/xwzx/rdxw/2 016/201606/P020160721576734671513.pdf.
[3]時文靜,朱文倩,王美玲,等.影響網(wǎng)絡(luò)購物商品銷量的因素研究——基于SEM的淘寶網(wǎng)數(shù)據(jù)分析[C]//2015年(第四屆)全國大學(xué)生統(tǒng)計(jì)建模大賽論文集.北京:中國統(tǒng)計(jì)教育學(xué)會,2015.
[4]胡良平.SAS高級統(tǒng)計(jì)分析教程[M].2版.北京:電子工業(yè)出版社,2016.
[5]董超.西安大學(xué)生網(wǎng)絡(luò)團(tuán)購滿意度影響因素實(shí)證研究[J].電子商務(wù)評論,2012,1(2):7-10.
[6]謝智聰.運(yùn)用因子載荷陣分組變量的新主成分法及其應(yīng)用[J].統(tǒng)計(jì)與決策,2008(12):19-22.
[7]劉智敏.不確定度評定的一種方法——最大方差法[J].宇航計(jì)測技術(shù),1998,18(1):24-35.
[8]薛薇.SPSS統(tǒng)計(jì)分析方法及運(yùn)用[M].3版.北京:電子工業(yè)出版社,2013.
【責(zé)任編輯:王桂珍 foshanwgzh@163.com】
Factor analysis model of influencing factors of consumers’online shopping under big data
JIANGuo-ming,HUANGWen-li,WANGShang-jiu, HUANGBing-na,ZHOUBi-jiang
(School ofMathematics and Statistics,Shaoguan University,Shaoguan 512005,China)
In this article,the influence factors of consumer online shopping were analyzed with product sales data from Taobao website collected by the octopus data collector.First,after data preprocessing,we got the data of 776 stores,which including 8 main indicators.Then,we set up a factor analysis model with 8 parameters and solved byusingSPSS software which drawthe correspondingconclusion related factors.Factor analysis results of the model showthat the data under the consumer online shopping factors can be summarized as:service quality, popularityindex,securityand price.
bigdata;online shopping;influence factors;factor analysis
F713.36
A
1008-0171(2017)02-0001-04
2016-12-01
廣東大學(xué)生科技創(chuàng)新培育專項(xiàng)資金(2016b0455);廣東省本科高校教學(xué)質(zhì)量與教學(xué)改革工程項(xiàng)目(粵教高函〔2014〕97號)
簡國明(1958-),男,江西南昌人,韶關(guān)學(xué)院教授。
佛山科學(xué)技術(shù)學(xué)院學(xué)報(自然科學(xué)版)2017年2期