葉慧 何佳麗 張小皎
(江蘇科技大學(xué)數(shù)理學(xué)院 江蘇鎮(zhèn)江 212003)
隨著彩票的蓬勃發(fā)展,在帶來巨大經(jīng)濟利益的同時,彩民在消費過程中也表現(xiàn)出一系列非理性行為。如:拼彩詐騙,高價收購中彩行賄,舉債十萬購彩,購彩洗黑等事件。前人在這方面的研究,大部分是從問卷角度得到數(shù)據(jù),建立購彩模型;或從彩票出現(xiàn)的頻率分析彩票數(shù)字的概率為理性購彩提供借鑒。從和值和遺漏值出發(fā),直接對彩票數(shù)字進(jìn)行分析,可以省去在使用調(diào)查問卷數(shù)據(jù)時出現(xiàn)誤差的概率。本文通過網(wǎng)上隨機抽取100期11選5的數(shù)據(jù),對非理性購彩行為特征、評價及其成因進(jìn)行建模,得出其和值、平均遺漏值規(guī)律。本文的研究既為我國的管理者和研究者提供理論基礎(chǔ)同時也加強彩民的風(fēng)險和法規(guī)意識。
和值就是所有號碼的和,一般在過濾中會用到。平均遺漏值是號碼有多少期沒有出現(xiàn),而遺漏統(tǒng)計表則是對全部開獎號碼各種形態(tài)出現(xiàn)規(guī)律的一個全面統(tǒng)計。
可用統(tǒng)計量R2來檢驗?zāi)P偷臄M合優(yōu)度(1):
(Yi指樣本值,Y指的Yi平均值值擬的曲線的值,
TSS為總離差平方和(total sum of squares),反映樣本觀測值總體離差的大??;ESS為回歸平方和(explained sum of squarse),反映由模型中解釋變量所解釋的那部分離差的大小;RSS為殘差平方和(residual sum of squares),反映樣本觀測值與估計值偏離的大小,也是模型中解釋變量未解釋的那部分離差的大小。顯然,在總離平方和中,回歸平方和所占的比重越大,殘差平方和所占的比重越小,回歸直線與樣本點擬合得越好。統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。如果模型與樣本完全擬合,則有R2=1。
圖1 和值擬合曲線
圖2 平均遺漏值擬合曲線
表2 和值擬合方程
表3 平均遺漏值檢驗值
F檢驗是方差分析中的檢驗統(tǒng)計量。單因素方差分析的原假設(shè)是控制變量在不同水平下觀測變量各總體的均值無顯著差異。將F檢驗的值與查表得到的F表值比較,若F ≥ F表,表明控制變量在不同水平下觀測變量各總體的均值有顯著差異。
SST為觀測變量總離差平方和;SSA為組間離差平方和,是由控制變量的不同水平造成的變差;SSE為組內(nèi)離差平方和,是由抽樣誤差引起的變差。n為總樣本量,k-1和n-k分別為SSA和SSE的自由度。
從網(wǎng)上得到數(shù)據(jù)12011877期到12012012期的11選5的開獎結(jié)果(見附1體彩網(wǎng)站http://www.js-lottery.com/news/index.html)。計算出這一百期和值數(shù)據(jù),據(jù)計量經(jīng)濟學(xué)的理論知識,當(dāng)擬合度R2達(dá)到0.6,F(xiàn)檢驗較大,可認(rèn)為方程是合理的。為計算出合理的方程,用SPSS軟件進(jìn)行多種函數(shù)的和值擬合方程(見圖1)。
由圖1及公式(1)、(2)得到下面的檢驗值表。
表4 平均遺漏值擬合方程
從表1中的參數(shù)可得出5個形式不同的方程(見表2)。
由表1和表2得到,運用二次方程擬合出來的曲線的擬合度達(dá)到0.687,F(xiàn)檢驗為30.787。運用三次方程擬合出來的曲線的擬合度為0.692,F(xiàn)檢驗為20.240。由于兩者擬合度相差不大,但是二次方程F檢驗的值明顯大于三次方程,據(jù)計量經(jīng)濟學(xué)知識知,選取二次方程較好。即(3):
雖然該擬合優(yōu)度沒有達(dá)到0.8的高度擬合程度,但已是非常接近,所以方程(1)可信。因此彩民通過對二次函數(shù)峰值上對的和值的數(shù)值來購買彩票。
為了進(jìn)一步驗證二次方程的可信程度,用SPSS軟件進(jìn)行多種函數(shù)平均遺漏值的擬合方程與曲線,得到圖2。
由圖2及公式(1)、(2)得到下面的檢驗值表3。
從表3中的參數(shù)可得出5個形式不同的方程(見表4)。
由表3和表4得知,二次方程擬合出來的曲線的擬合度達(dá)到0.767,F(xiàn)檢驗為46.166。運用三次方程擬合出來的曲線的擬合度為0.771,F(xiàn)檢驗為30.347。由于兩者擬合度相差不大,但是二次方程F檢驗的值明顯大于三次方程,所以選取二次方程較好。由上表得二次方程為(4):
雖然該擬合優(yōu)度沒有達(dá)到0.8的高度擬合程度,但是已經(jīng)是非常接近,所以認(rèn)為該方程可信。上述兩部分分析可得,和值出現(xiàn)在25到35直接較多,并且彩民可以根據(jù)號碼的遺漏值來大約確定本期和值為多少。
運用SPSS對網(wǎng)上數(shù)據(jù)進(jìn)行和值、平均遺漏值的擬合,據(jù)R方和F檢驗值得出最優(yōu)的擬合方程,提高理性購彩。
[1]薛薇.統(tǒng)計分析與SPSS的應(yīng)用[M].中國人民出版社,2011.
[2]楊東鋒.對山西省體育彩票消費者的調(diào)查分析[J].中北大學(xué)學(xué)報(社會科學(xué)版),2008,24(4).
[3]馮百鳴.中國彩票業(yè)發(fā)展極不平衡 彩民年人均購彩超千元[J].中國經(jīng)濟周刊,2010.