国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于中國社會總體和諧度的調(diào)查分析

2011-09-05 02:47:40李春林屈駁韻
統(tǒng)計與決策 2011年13期
關(guān)鍵詞:平均水平細分決策樹

李春林,屈駁韻,萬 平

(河北經(jīng)貿(mào)大學 數(shù)學與統(tǒng)計學學院,石家莊 050061)

0 引言

《荀子·王制》有云:“和則一,一則多力,多力則強,強則勝物”,這其實是指一個多元兼容、統(tǒng)一一致、關(guān)系和諧的社會群體,定能夠產(chǎn)生可戰(zhàn)勝一切困難的強大力量!為研究當代中國社會和諧狀況及其因素,我們在全國范圍內(nèi)進行了關(guān)于《當代中國影響人際關(guān)系和諧因素》的問卷調(diào)查,并收回有效問卷2972份。因為問卷樣本數(shù)量巨大,知識豐富,為避免傳統(tǒng)的單變量頻數(shù)分析、對比分析或雙變量列聯(lián)表分析等在分析過程中造成的知識浪費,本文嘗試采用數(shù)據(jù)挖掘的相關(guān)方法對所得數(shù)據(jù)從不同層面,不同視角進行深層次挖掘,力求獲得更多有價值的知識。本文系屬此次調(diào)查研究的部分成果,著重利用數(shù)據(jù)挖掘中多運用于市場調(diào)查和社會調(diào)查中的CHAID(卡方自動交互檢測)算法,進行中國社會特定和諧滿意度下的人群細分。

1 細分變量確定及數(shù)據(jù)描述

1.1 細分變量的確定

在查閱特定問題下人群特點細分的諸多研究中,發(fā)現(xiàn)常用的細分變量主要是性別、年齡、學歷、收入水平、職業(yè)、個人所在地等。但隨著社會經(jīng)濟的發(fā)展,思想文化水平的提高,人們看待問題的觀點和側(cè)重點也越來越復雜,僅僅利用這幾類變量對中國社會和諧滿意程度進行人群細分很難看出問題的本質(zhì)。因此本文細分變量的確定借鑒了《CHAID分析在抽油煙機產(chǎn)品市場細分中的應(yīng)用》[1](蘇勝強,2006)的思想,將細分變量分為廣度細分變量和深度細分變量,其中廣度細分變量就是諸多研究中常用的有關(guān)被訪者的基本信息,通過廣度細分變量我國社會特定滿意度下的人群可以直接形象的得到描述。而深度細分變量是被訪者對影響當代社會總體和諧程度的經(jīng)濟、文化、政治、法律等深層次問題的認識狀況。

1.2 數(shù)據(jù)的基本信息

根據(jù)調(diào)查問卷的情況采用3分Likert評測法,測試影響中國社會和諧諸因素發(fā)展狀況,并將其作為深度細分變量,變量及其數(shù)據(jù)情況如表1。

2 CHAID算法的思想和步驟

2.1 CHAID算法的基本思想

CHAID的全稱是Chi-squared Automatic InteractionDetector(卡方自動交互檢測)。在1980年,由Kass等人提出,它的理論構(gòu)想主要來源于決策樹模型,根據(jù)反應(yīng)變量在解釋變量上的分布來劃分人群,適用于分類和序次等級數(shù)據(jù)的分析,是一種以目標最優(yōu)為依據(jù),具有目標選擇、變量篩選和聚類功能的分析方法[2]。它的基本分析思路是χ2自動交叉檢驗[3],首先選定分類的反應(yīng)變量,然后用解釋變量與反應(yīng)變量進行交叉分類,產(chǎn)生一系列二維分類表。分別計算二維分類表的χ2值或似然估計統(tǒng)計量,以最大統(tǒng)計量的二維表作為最佳初始分類表,并繼續(xù)使用分類指標對目標變量進行分類,重復上述過程直到滿足分類條件為止[4]。

表1 影響中國社會和諧的因素及其數(shù)據(jù)情況表 (人)

2.2 CHAID算法的求解過程

本文以深度細分變量對中國社會和諧滿意度進行人群特點挖掘為例來說明CHAID算法的求解過程。

(1)首先分別建立反應(yīng)變量Y與5個細分變量Xj(j=1,2,3,4,5)之間的二維列聯(lián)表。如反應(yīng)變量Y(即Q1)與細分變量X4(即Q28)的二維列聯(lián)表見表2:

表2 Y和分別與X4的列聯(lián)表

通過式(1)和式(2)計算 Pearson_χ2統(tǒng)計量和似然比 χ2統(tǒng)計量(L2)。在CHAID算法中反應(yīng)變量既可以為分類型或等級分類型,也可以是離散型或連續(xù)型,而解釋變量要求為分類型或等級分類型。因此,當反應(yīng)變量為分類型變量時,CHAID算法按式(1)計算反應(yīng)變量與各解釋變量所形成的二維列聯(lián)表的Pearson-χ2統(tǒng)計量;當反應(yīng)變量為等級分類變量或離散型變量時,CHAID算法按式(2)計算各二維列聯(lián)表的L2;當反應(yīng)變量為連續(xù)型時,則用F檢驗。

因為本文反應(yīng)變量Y是3 Likert等級分類型,因此計算的是似然比χ2統(tǒng)計量,即L2。Y與深度細分解釋變量Xj之間的二維列聯(lián)表結(jié)果見表3:

表3 第一步細分的各列聯(lián)表似然比χ2統(tǒng)計量(L2)

由表3可知,反應(yīng)變量Y與各細分變量所構(gòu)成的L2二維列聯(lián)表的中,與X4所構(gòu)成的列聯(lián)表的L2最大,為416.667,因此將此列聯(lián)表作為最佳初始分類表對反應(yīng)變量Y進行細分。因為X4為3個類別,故列聯(lián)表2可以拆分成3個2×4二維列聯(lián)表,并計算各表的L2。當所有的L2≥(n)時,則按細分變量原有的類別細分反應(yīng)變量,即將Y在按X4的三個類別進行細分;當其中某個L2≤(n)時,則將細分變量的這兩個類別合并成一個新的類別來細分反應(yīng)變量。當所有的L2≤(n)時,則不對反應(yīng)變量進行細分。Y和X4的二維列聯(lián)表拆分列聯(lián)表及其如表4。

(2)第一步確定反應(yīng)變量Y由細分變量X4分成三個類別,第二步細分將在這三個類別條件下構(gòu)造反應(yīng)變量Y與其他細分變量Xj(j=1,2,3,5)之間的二維列聯(lián)表,并計算相應(yīng)的L2,第二層細分的各列聯(lián)表及其L2如表5。

由表5可知,在細分變量X4=1的條件下,Y與細分變量X3所構(gòu)成的二維列聯(lián)表的似然比χ2統(tǒng)計量最大為76.262,(如*標識)。因此在細分變量X4=1的條件下再對Y進行細分時,將以X3為細分變量進行下一層的細分。同理,在細分變量X4=2和X4=3的條件下,反應(yīng)變量Y和細分變量X2之間的似然比χ2均為相應(yīng)組最大,分別為73.188和93.885,因此將由細分變量X2進行下一層細分。接著,在此基礎(chǔ)上進行與第一步同樣方法的拆分,直到CHAID算法滿足停止拆分的條件為止。

表4 Y和X4的二維列聯(lián)表拆分列聯(lián)表及其L2

表5 第二層細分的各列聯(lián)表及其L2

CHAID算法停止拆分的條件有兩個,第一個為第一步過程中的似然比χ2統(tǒng)計顯著性檢驗;另一個是人為自定義的,本文中因為樣本數(shù)量較大,CHAID決策樹龐大,將決策樹停止生長的條件定為父節(jié)點上最小樣本為50個,子節(jié)點上的最小樣本為30個。

3 細分結(jié)果分析

本文借助統(tǒng)計軟件SPSS的Clementine數(shù)據(jù)挖掘模塊中的CHAID決策樹節(jié)點來實現(xiàn)CHAID算法的人群細分過程。在細分過程中,隨著決策樹的生長,分類維數(shù)的增加,對樣本特征的描述越來越精確,決策樹中度量這一性質(zhì)的指標是索引,并且需大于1。

3.1 中國社會總體和諧滿意度的廣度細分人群特點

(1)對我國社會總體和諧程度滿意的人群特點。包括河北省在內(nèi)的中部各省的學歷為中小學的公務(wù)員、商業(yè)一般收入、商業(yè)高收入及教師等知識分子中,中國社會總體和諧滿意度為62.805%,高出全國平均水平14.798個百分點,尤其是河北省的這些屬性的人群中滿意度達77.78%,高出全國平均水平29.773個百分點,索引為1.62,這意味著當我們挖掘?qū)χ袊鐣傮w和諧滿意度高的人群屬性時,鎖定河北省中小學學歷的公務(wù)員、商業(yè)一般收入、商業(yè)高收入及教師等知識分子,命中率與在所有人中隨機抽查相比將提高1.62倍;中國軍人、農(nóng)民和工人的中國社會總體和諧滿意度為57.886%,尤其是京津地區(qū)的這些人群,滿意度達75%,高出全國平均水平23個百分點,且索引值為1.56,這意味著在挖掘?qū)χ袊鐣傮w和諧滿意度高的人群屬性時,鎖定京津地區(qū)的軍人、農(nóng)民和工人,命中率是在所有人中隨機抽查的1.56倍。

(2)對我國社會總體和諧程度不滿意的人群特點。僅從決策樹模型的第一層來看,在校學生、待業(yè)、失業(yè)和自由職業(yè)者的中國社會和諧滿意度僅為37.402%,低于全國平均水平達10.6個百分點。這些人群中,對中國社會和諧程度不滿意的人比重為15.88%,高出全國平均水平2.443個百分點。尤其京津、中部地區(qū)及河北的青年大中?;蛑行W學歷的在校學生、自由職業(yè)者、待業(yè)、失業(yè)人員中,有28.442%的人對中國社會總體和諧程度不滿意,高出全國平均水平15個百分點,其索引值為2.12,而西部和東部沿海地區(qū)的這些人群中,不滿意率為18.75%,索引值為1.39;另外還可以看到,京津和西部地區(qū)的本科或研究生學歷的在校學生及自由職業(yè)者、待業(yè)、失業(yè)人員中,對中國社會不滿意率為18.42%,高出全國平均水平4.98個百分點,且索引值為1.37。

因此從廣度細分變量來看,中國社會總體和諧滿意度高的人群主要為中小學學歷的低學歷人群,還有中國的軍人、農(nóng)民和工人對社會和諧程度滿意度很高;而不滿意度高的人群主要是在校學生,尤其像北京、天津等地區(qū)的學生不滿意度均很高,另外西部地區(qū)的高學歷者不滿意度也值得關(guān)注。

3.2 中國社會總體和諧滿意度的深度細分人群特點

由CHAID決策樹模型(圖略)可以看到,第一層細分變量為我國當前民主建設(shè)情況(X4),這說明人民在評價我國社會總體和諧程度時,首先關(guān)注的因素是我國民主建設(shè)狀況。X4將反應(yīng)變量細分為三個部份,對我國當前民主建設(shè)滿意的人群中,社會和諧滿意度達67.78%,高出全國平均水平19.77個百分點,不滿意度僅為3.58%,低于全國平均水平近10個百分點;而對我國當前民主建設(shè)不滿意的人群中,社會和諧滿意度僅為27.99%,低于全國平均水平20個百分點,不滿意度達27.427%,高出全國平均水平近14個百分點。

第二層細分變量為當前黨和政府反腐倡廉工作滿意度(X3)和當前社會道德水平高低(X2)。在對我國當前民主建設(shè)持滿意態(tài)度的人群內(nèi)部,人民更關(guān)注黨和政府反腐倡廉工作力度,對當前黨和政府反腐倡廉工作滿意的人群中社會和諧滿意度達84.72%,而對黨和政府反腐倡廉工作不滿意的人群中和諧滿意度僅37.5%。在對我國當前民主建設(shè)一般滿意或不滿意的兩個人群內(nèi)部,人們更關(guān)注道德水平的高低。這兩個人群中認為當前道德水平高的人群中社會總體和諧滿意度分別為81.84%和66.01%,而認為當前道德水平低的人群中社會總體和諧滿意度僅分別為44.44%和20%。

由決策樹模型可以看到,樹的終端葉節(jié)點主要是細分變量自身勞動收入水平滿意度(X1)和政府在應(yīng)對突發(fā)事件與復雜局面時的表現(xiàn) (X5),這說明當人們對我國當前民主建設(shè)、反腐倡廉、道德水平等方面的滿意程度一定時,會更關(guān)注自身收入水平和政府部門應(yīng)對突發(fā)事件和復雜局面的能力。

因此,從深度細分變量可以看出,在構(gòu)建社會主義和諧社會過程中,人們當前更關(guān)注我國民主建設(shè)、反腐倡廉和社會道德水平這三個方面。

4 結(jié)論

本文利用SPSS統(tǒng)計軟件中Clementine數(shù)據(jù)挖掘模塊對2910份調(diào)查問卷從廣度和深度兩個方面對特定社會和諧程度人群進行挖掘細分,挖掘出了令人滿意的結(jié)果。尤其是發(fā)現(xiàn)農(nóng)民的社會和諧滿意度較高,說明當前我國的各項惠農(nóng)政策產(chǎn)生了實效,讓農(nóng)民感覺社會更加和諧,生活更加幸福;同時發(fā)現(xiàn)我國高學歷的在校學生對社會和諧滿意度較低,這說明隨著我國社會經(jīng)濟的不斷發(fā)展,高學歷者面臨的競爭越來越激烈,尤其是就業(yè)壓力越來越大等原因,使高學歷者自身社會價值的實現(xiàn)越來越難,因此對社會和諧滿意度偏低;另外,通過深度細分變量挖掘出了我國當前民主建設(shè)滿意度、反腐倡廉工作、社會道德水平高低等問題是人們評價我國社會和諧與否的關(guān)鍵方面。

[1]蘇勝強.CHAID分析在抽油煙機產(chǎn)品市場細分中的應(yīng)用[J].商業(yè)研究,2006.

[2]王廣州.AID和CHAID在多變量市場細分中的應(yīng)用[J].研究市場與人口分析,1999.

[3]Chaturvedi A,Green P E,et al.SPSS for Windows,CHAID6.0[J].Journal of Marketing Research,1995,32(2).

[4]范曉清.決策樹技術(shù)在手機市場細分中的應(yīng)用[J].浙江統(tǒng)計,2004.

[5]宋家典.和諧社會的哲學底蘊[D].湘潭大學碩士學位論文,2007.

猜你喜歡
平均水平細分決策樹
深耕環(huán)保細分領(lǐng)域,維爾利為環(huán)保注入新動力
華人時刊(2020年23期)2020-04-13 06:04:12
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
歷年關(guān)稅平均水平
決策樹和隨機森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
歷年關(guān)稅平均水平
基于決策樹的出租車乘客出行目的識別
歷年關(guān)稅平均水平
1~7月,我國貨車各細分市場均有增長
專用汽車(2016年9期)2016-03-01 04:17:02
歷年關(guān)稅平均水平
整體低迷難掩細分市場亮點
專用汽車(2015年2期)2015-03-01 04:05:42
海盐县| 河北省| 翼城县| 盐山县| 平江县| 土默特左旗| 汽车| 淮南市| 信宜市| 日喀则市| 丹东市| 长岭县| 巴林右旗| 尚志市| 葵青区| 合山市| 北流市| 禹州市| 祁东县| 江西省| 嘉兴市| SHOW| 岳池县| 抚顺县| 荔波县| 翁牛特旗| 石阡县| 肃宁县| 遂昌县| 盐边县| 福清市| 四会市| 湟中县| 喀喇沁旗| 邹平县| 安多县| 新源县| 巴林右旗| 中宁县| 咸阳市| 博爱县|