陳龍禹
摘要:統(tǒng)計(jì)數(shù)據(jù)經(jīng)過(guò)整理和顯示后,我們對(duì)數(shù)據(jù)分布的類型和特點(diǎn)就有了一個(gè)大致的了解,但這種了解只是表面上的,還缺少代表性的數(shù)量特征值準(zhǔn)確地描述出統(tǒng)計(jì)數(shù)據(jù)的分布。對(duì)統(tǒng)計(jì)數(shù)據(jù)分布的特征,可以從三個(gè)方面進(jìn)行測(cè)度和描述:一是分布的集中趨勢(shì);二是分布的離散程度;三是分布的偏態(tài)和測(cè)度。這三個(gè)方面分別反映了數(shù)據(jù)分布的測(cè)度特征。
關(guān)鍵詞:數(shù)據(jù)分布;特征測(cè)度;分析
中圖分類號(hào):F270 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1005-913X(2014)08-0192-01
一、集中趨勢(shì)的測(cè)度
(一)分類數(shù)據(jù):眾數(shù)
眾數(shù)主要用于測(cè)度分類數(shù)據(jù)的集中趨勢(shì),同時(shí)也適用于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度位。需注意的是,只有當(dāng)數(shù)據(jù)較多,具有明顯集中趨勢(shì)時(shí),計(jì)算眾數(shù)才有意義,才可以利用它來(lái)作為某種決策的參考依據(jù)。如紡織企業(yè)職工“性別”中“女性”人數(shù)最多,則“女性”為眾數(shù)。再如鞋廠在制定各種尺碼鞋子的生產(chǎn)計(jì)劃時(shí),市場(chǎng)上銷量最多的型號(hào)是眾數(shù),也是生產(chǎn)廠家或經(jīng)銷商應(yīng)該重點(diǎn)生產(chǎn)和銷售的型號(hào)。
(二)數(shù)值型數(shù)據(jù):平均數(shù)
平均數(shù)用于反映所有數(shù)值型數(shù)據(jù)的一段水平。根據(jù)計(jì)算方法的不同,有算術(shù)平均數(shù)和幾何平均數(shù)之分。平均數(shù)表明所有變量值的集中趨勢(shì),受極端值的影響,它是集中趨勢(shì)的最主要測(cè)度值,主要用于數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度。
(三)眾數(shù)、中位數(shù)和平均數(shù)的比較
1.眾數(shù)、中位數(shù)和均值的關(guān)系
從分布的角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,而均值則是全部數(shù)據(jù)的算術(shù)平均。因此,對(duì)同一組數(shù)據(jù)計(jì)算眾數(shù)、中位數(shù)和均值,三者之間具有以下關(guān)系:在單蜂分布條件下,如果數(shù)據(jù)的分布是對(duì)稱的,則眾數(shù)、中位數(shù)和均值必定相等,即眾數(shù)=中位數(shù)=均值;如果數(shù)據(jù)是左偏分布,說(shuō)明數(shù)據(jù)存在極小值,必然拉動(dòng)均值向極小值一方靠,而眾數(shù)和中位數(shù)由于位置是代表值,不受極值的影響,因此三者之間的關(guān)系表現(xiàn)為:均值<中位數(shù)<眾數(shù);如果數(shù)據(jù)是右偏分布,說(shuō)明數(shù)據(jù)存在極大值,必然拉動(dòng)均值向極大值一邊靠,則眾數(shù)<中位數(shù)<均值,如圖1所示。
2.眾數(shù)、中位數(shù)和均值的特點(diǎn)與應(yīng)用場(chǎng)合
眾數(shù)、中位數(shù)和算術(shù)平均數(shù)各自具有不同的特點(diǎn),掌握它們之間的關(guān)系和各自的不同特點(diǎn),有助于在實(shí)際應(yīng)用中選擇合理的測(cè)度值來(lái)描述數(shù)據(jù)的集中趨勢(shì)。
(1)雖然對(duì)于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計(jì)算眾數(shù),但眾數(shù)主要適合于作為分類數(shù)據(jù)的集中趨勢(shì)測(cè)度值,而且眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義,當(dāng)數(shù)據(jù)量較少時(shí),不宣使用眾數(shù)。
(2)中位數(shù)以及其他分位數(shù)主要適用于作為順序數(shù)據(jù)的集中趨勢(shì)測(cè)度值,雖對(duì)于順序數(shù)據(jù)也可以使用眾數(shù),但以中位數(shù)為宜。
(3)算數(shù)平均數(shù)適合用于數(shù)值型數(shù)據(jù)的集中趨勢(shì)測(cè)度值,特別是當(dāng)分布比較法則,不存在極端值比較偏離現(xiàn)象時(shí),用算述平均數(shù)達(dá)標(biāo)集中趨勢(shì)最合適,但平均值的主要缺點(diǎn)是易受數(shù)據(jù)極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性差。因此,當(dāng)數(shù)據(jù)位偏態(tài)分布,特別是偏斜的程度較大時(shí),可以考慮選擇眾數(shù)或中位數(shù)等位置代表,這時(shí)它們的代表性要比平均數(shù)好。
(4)算術(shù)平均數(shù)包含的信息是最多的、最豐富的,算術(shù)平均數(shù)具有兩個(gè)重要的數(shù)學(xué)性質(zhì),即所有觀測(cè)值與算術(shù)平均數(shù)的離差和等于零;所有觀測(cè)值與算術(shù)平均勢(shì)的離差平方和為最小。
二、離散程度的測(cè)度
集中趨勢(shì)只是統(tǒng)計(jì)總體數(shù)據(jù)分布的特征之一。介于個(gè)體的差異性,總體中的各數(shù)據(jù)還呈現(xiàn)出與集中趨勢(shì)的代表值和分散的離中趨勢(shì),這是數(shù)據(jù)的另一特征,它所反映的是各變量值遠(yuǎn)離其中心值的程度。因此,對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析,除了要反映其分布的集中趨勢(shì)外,還要反映統(tǒng)計(jì)數(shù)據(jù)的離散程度,以達(dá)到對(duì)數(shù)據(jù)變動(dòng)規(guī)律的全面描述。
根據(jù)所依據(jù)數(shù)據(jù)類型的不同,數(shù)據(jù)離散程度的主要指標(biāo)有極差、平均差、四分位差、方差、標(biāo)淮差以及離散系數(shù)等。測(cè)度離散程度的主要作用如下。一是反映現(xiàn)象總體中變量分布的離中趨勢(shì)??傮w各單位的標(biāo)志值存在差異,標(biāo)志變動(dòng)度表明總體各單位標(biāo)志值的分散程度。變量值的差異越大,離散趨勢(shì)也越大;反之,變量值越小,離散趨勢(shì)也越小。二是衡量均值的代表性。均值作為總體數(shù)量標(biāo)志的代表,其代表性取決于總體各數(shù)據(jù)的差異程度。總體中各數(shù)據(jù)的變異程度越大,均值的代表性就越??;反之,總體中各數(shù)據(jù)的變異程度越小,均值的代表性就越大。三是測(cè)定現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度。離散程度能夠表明生產(chǎn)過(guò)程的節(jié)奏性和其他活動(dòng)的均衡性,可作為企業(yè)產(chǎn)品質(zhì)量控制和評(píng)價(jià)經(jīng)濟(jì)管理工作的依據(jù)。
三、偏態(tài)與峰態(tài)的測(cè)度
(一)偏態(tài)的測(cè)度
在客觀實(shí)際生活中,一些經(jīng)濟(jì)變量的次數(shù)分配往往是非對(duì)稱型的,如收入分配、市場(chǎng)占有份額、資源配置等等,這些經(jīng)濟(jì)變量經(jīng)分組后,總體各單位在不同的分組變量值下分布并不均勻?qū)ΨQ,而呈現(xiàn)出偏斜的分布狀況,統(tǒng)計(jì)上將其稱為偏態(tài)分布。利用眾數(shù)、中位數(shù)和平均數(shù)之間的關(guān)系就可以判斷分布是對(duì)稱、左偏還是右偏。顯然,判斷偏態(tài)的方向并不困難,但要測(cè)度偏斜的程度則需要計(jì)算偏態(tài)系數(shù)。統(tǒng)計(jì)分折中測(cè)定偏態(tài)系數(shù)的方法很多。
(二)峰態(tài)的測(cè)度
峰態(tài)是指數(shù)據(jù)分布的尖峭狀況和程度。峰態(tài)是次數(shù)分布的另一個(gè)數(shù)量特征。這個(gè)特征是:某種次數(shù)分布與正態(tài)分布相比較,是尖頂還是平頂,其尖頂或平頂?shù)某潭热绾?。蜂度是次?shù)分布曲線頂端的尖峭程度。峰度通常分為三種:正態(tài)峰度、尖峰度和平峰度。如果分布的形狀比正態(tài)分布更高更瘦,則稱為尖峰分布;如果分布的形狀比正態(tài)分布更矮更胖,則稱為平峰分布。峰態(tài)系數(shù)是統(tǒng)計(jì)中描述次數(shù)分布狀態(tài)的又一個(gè)重要特征值,用以測(cè)定鄰近數(shù)值周圍變量值分布的集中或分散程度。
參考文獻(xiàn):
[1] 陳文麗,韓立巖.λ-可加模糊測(cè)度的一般形式及分布特征[J].模糊系統(tǒng)與數(shù)學(xué),2007(1).
[2] 張 紅,王新生,余瑞林.基于Voronoi圖的測(cè)度點(diǎn)狀目標(biāo)空間分布特征的方法[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(3).
[責(zé)任編輯:文 筠]
摘要:統(tǒng)計(jì)數(shù)據(jù)經(jīng)過(guò)整理和顯示后,我們對(duì)數(shù)據(jù)分布的類型和特點(diǎn)就有了一個(gè)大致的了解,但這種了解只是表面上的,還缺少代表性的數(shù)量特征值準(zhǔn)確地描述出統(tǒng)計(jì)數(shù)據(jù)的分布。對(duì)統(tǒng)計(jì)數(shù)據(jù)分布的特征,可以從三個(gè)方面進(jìn)行測(cè)度和描述:一是分布的集中趨勢(shì);二是分布的離散程度;三是分布的偏態(tài)和測(cè)度。這三個(gè)方面分別反映了數(shù)據(jù)分布的測(cè)度特征。
關(guān)鍵詞:數(shù)據(jù)分布;特征測(cè)度;分析
中圖分類號(hào):F270 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1005-913X(2014)08-0192-01
一、集中趨勢(shì)的測(cè)度
(一)分類數(shù)據(jù):眾數(shù)
眾數(shù)主要用于測(cè)度分類數(shù)據(jù)的集中趨勢(shì),同時(shí)也適用于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度位。需注意的是,只有當(dāng)數(shù)據(jù)較多,具有明顯集中趨勢(shì)時(shí),計(jì)算眾數(shù)才有意義,才可以利用它來(lái)作為某種決策的參考依據(jù)。如紡織企業(yè)職工“性別”中“女性”人數(shù)最多,則“女性”為眾數(shù)。再如鞋廠在制定各種尺碼鞋子的生產(chǎn)計(jì)劃時(shí),市場(chǎng)上銷量最多的型號(hào)是眾數(shù),也是生產(chǎn)廠家或經(jīng)銷商應(yīng)該重點(diǎn)生產(chǎn)和銷售的型號(hào)。
(二)數(shù)值型數(shù)據(jù):平均數(shù)
平均數(shù)用于反映所有數(shù)值型數(shù)據(jù)的一段水平。根據(jù)計(jì)算方法的不同,有算術(shù)平均數(shù)和幾何平均數(shù)之分。平均數(shù)表明所有變量值的集中趨勢(shì),受極端值的影響,它是集中趨勢(shì)的最主要測(cè)度值,主要用于數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度。
(三)眾數(shù)、中位數(shù)和平均數(shù)的比較
1.眾數(shù)、中位數(shù)和均值的關(guān)系
從分布的角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,而均值則是全部數(shù)據(jù)的算術(shù)平均。因此,對(duì)同一組數(shù)據(jù)計(jì)算眾數(shù)、中位數(shù)和均值,三者之間具有以下關(guān)系:在單蜂分布條件下,如果數(shù)據(jù)的分布是對(duì)稱的,則眾數(shù)、中位數(shù)和均值必定相等,即眾數(shù)=中位數(shù)=均值;如果數(shù)據(jù)是左偏分布,說(shuō)明數(shù)據(jù)存在極小值,必然拉動(dòng)均值向極小值一方靠,而眾數(shù)和中位數(shù)由于位置是代表值,不受極值的影響,因此三者之間的關(guān)系表現(xiàn)為:均值<中位數(shù)<眾數(shù);如果數(shù)據(jù)是右偏分布,說(shuō)明數(shù)據(jù)存在極大值,必然拉動(dòng)均值向極大值一邊靠,則眾數(shù)<中位數(shù)<均值,如圖1所示。
2.眾數(shù)、中位數(shù)和均值的特點(diǎn)與應(yīng)用場(chǎng)合
眾數(shù)、中位數(shù)和算術(shù)平均數(shù)各自具有不同的特點(diǎn),掌握它們之間的關(guān)系和各自的不同特點(diǎn),有助于在實(shí)際應(yīng)用中選擇合理的測(cè)度值來(lái)描述數(shù)據(jù)的集中趨勢(shì)。
(1)雖然對(duì)于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計(jì)算眾數(shù),但眾數(shù)主要適合于作為分類數(shù)據(jù)的集中趨勢(shì)測(cè)度值,而且眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義,當(dāng)數(shù)據(jù)量較少時(shí),不宣使用眾數(shù)。
(2)中位數(shù)以及其他分位數(shù)主要適用于作為順序數(shù)據(jù)的集中趨勢(shì)測(cè)度值,雖對(duì)于順序數(shù)據(jù)也可以使用眾數(shù),但以中位數(shù)為宜。
(3)算數(shù)平均數(shù)適合用于數(shù)值型數(shù)據(jù)的集中趨勢(shì)測(cè)度值,特別是當(dāng)分布比較法則,不存在極端值比較偏離現(xiàn)象時(shí),用算述平均數(shù)達(dá)標(biāo)集中趨勢(shì)最合適,但平均值的主要缺點(diǎn)是易受數(shù)據(jù)極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性差。因此,當(dāng)數(shù)據(jù)位偏態(tài)分布,特別是偏斜的程度較大時(shí),可以考慮選擇眾數(shù)或中位數(shù)等位置代表,這時(shí)它們的代表性要比平均數(shù)好。
(4)算術(shù)平均數(shù)包含的信息是最多的、最豐富的,算術(shù)平均數(shù)具有兩個(gè)重要的數(shù)學(xué)性質(zhì),即所有觀測(cè)值與算術(shù)平均數(shù)的離差和等于零;所有觀測(cè)值與算術(shù)平均勢(shì)的離差平方和為最小。
二、離散程度的測(cè)度
集中趨勢(shì)只是統(tǒng)計(jì)總體數(shù)據(jù)分布的特征之一。介于個(gè)體的差異性,總體中的各數(shù)據(jù)還呈現(xiàn)出與集中趨勢(shì)的代表值和分散的離中趨勢(shì),這是數(shù)據(jù)的另一特征,它所反映的是各變量值遠(yuǎn)離其中心值的程度。因此,對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析,除了要反映其分布的集中趨勢(shì)外,還要反映統(tǒng)計(jì)數(shù)據(jù)的離散程度,以達(dá)到對(duì)數(shù)據(jù)變動(dòng)規(guī)律的全面描述。
根據(jù)所依據(jù)數(shù)據(jù)類型的不同,數(shù)據(jù)離散程度的主要指標(biāo)有極差、平均差、四分位差、方差、標(biāo)淮差以及離散系數(shù)等。測(cè)度離散程度的主要作用如下。一是反映現(xiàn)象總體中變量分布的離中趨勢(shì)??傮w各單位的標(biāo)志值存在差異,標(biāo)志變動(dòng)度表明總體各單位標(biāo)志值的分散程度。變量值的差異越大,離散趨勢(shì)也越大;反之,變量值越小,離散趨勢(shì)也越小。二是衡量均值的代表性。均值作為總體數(shù)量標(biāo)志的代表,其代表性取決于總體各數(shù)據(jù)的差異程度。總體中各數(shù)據(jù)的變異程度越大,均值的代表性就越小;反之,總體中各數(shù)據(jù)的變異程度越小,均值的代表性就越大。三是測(cè)定現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度。離散程度能夠表明生產(chǎn)過(guò)程的節(jié)奏性和其他活動(dòng)的均衡性,可作為企業(yè)產(chǎn)品質(zhì)量控制和評(píng)價(jià)經(jīng)濟(jì)管理工作的依據(jù)。
三、偏態(tài)與峰態(tài)的測(cè)度
(一)偏態(tài)的測(cè)度
在客觀實(shí)際生活中,一些經(jīng)濟(jì)變量的次數(shù)分配往往是非對(duì)稱型的,如收入分配、市場(chǎng)占有份額、資源配置等等,這些經(jīng)濟(jì)變量經(jīng)分組后,總體各單位在不同的分組變量值下分布并不均勻?qū)ΨQ,而呈現(xiàn)出偏斜的分布狀況,統(tǒng)計(jì)上將其稱為偏態(tài)分布。利用眾數(shù)、中位數(shù)和平均數(shù)之間的關(guān)系就可以判斷分布是對(duì)稱、左偏還是右偏。顯然,判斷偏態(tài)的方向并不困難,但要測(cè)度偏斜的程度則需要計(jì)算偏態(tài)系數(shù)。統(tǒng)計(jì)分折中測(cè)定偏態(tài)系數(shù)的方法很多。
(二)峰態(tài)的測(cè)度
峰態(tài)是指數(shù)據(jù)分布的尖峭狀況和程度。峰態(tài)是次數(shù)分布的另一個(gè)數(shù)量特征。這個(gè)特征是:某種次數(shù)分布與正態(tài)分布相比較,是尖頂還是平頂,其尖頂或平頂?shù)某潭热绾巍7涠仁谴螖?shù)分布曲線頂端的尖峭程度。峰度通常分為三種:正態(tài)峰度、尖峰度和平峰度。如果分布的形狀比正態(tài)分布更高更瘦,則稱為尖峰分布;如果分布的形狀比正態(tài)分布更矮更胖,則稱為平峰分布。峰態(tài)系數(shù)是統(tǒng)計(jì)中描述次數(shù)分布狀態(tài)的又一個(gè)重要特征值,用以測(cè)定鄰近數(shù)值周圍變量值分布的集中或分散程度。
參考文獻(xiàn):
[1] 陳文麗,韓立巖.λ-可加模糊測(cè)度的一般形式及分布特征[J].模糊系統(tǒng)與數(shù)學(xué),2007(1).
[2] 張 紅,王新生,余瑞林.基于Voronoi圖的測(cè)度點(diǎn)狀目標(biāo)空間分布特征的方法[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(3).
[責(zé)任編輯:文 筠]
摘要:統(tǒng)計(jì)數(shù)據(jù)經(jīng)過(guò)整理和顯示后,我們對(duì)數(shù)據(jù)分布的類型和特點(diǎn)就有了一個(gè)大致的了解,但這種了解只是表面上的,還缺少代表性的數(shù)量特征值準(zhǔn)確地描述出統(tǒng)計(jì)數(shù)據(jù)的分布。對(duì)統(tǒng)計(jì)數(shù)據(jù)分布的特征,可以從三個(gè)方面進(jìn)行測(cè)度和描述:一是分布的集中趨勢(shì);二是分布的離散程度;三是分布的偏態(tài)和測(cè)度。這三個(gè)方面分別反映了數(shù)據(jù)分布的測(cè)度特征。
關(guān)鍵詞:數(shù)據(jù)分布;特征測(cè)度;分析
中圖分類號(hào):F270 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1005-913X(2014)08-0192-01
一、集中趨勢(shì)的測(cè)度
(一)分類數(shù)據(jù):眾數(shù)
眾數(shù)主要用于測(cè)度分類數(shù)據(jù)的集中趨勢(shì),同時(shí)也適用于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度位。需注意的是,只有當(dāng)數(shù)據(jù)較多,具有明顯集中趨勢(shì)時(shí),計(jì)算眾數(shù)才有意義,才可以利用它來(lái)作為某種決策的參考依據(jù)。如紡織企業(yè)職工“性別”中“女性”人數(shù)最多,則“女性”為眾數(shù)。再如鞋廠在制定各種尺碼鞋子的生產(chǎn)計(jì)劃時(shí),市場(chǎng)上銷量最多的型號(hào)是眾數(shù),也是生產(chǎn)廠家或經(jīng)銷商應(yīng)該重點(diǎn)生產(chǎn)和銷售的型號(hào)。
(二)數(shù)值型數(shù)據(jù):平均數(shù)
平均數(shù)用于反映所有數(shù)值型數(shù)據(jù)的一段水平。根據(jù)計(jì)算方法的不同,有算術(shù)平均數(shù)和幾何平均數(shù)之分。平均數(shù)表明所有變量值的集中趨勢(shì),受極端值的影響,它是集中趨勢(shì)的最主要測(cè)度值,主要用于數(shù)值型數(shù)據(jù)集中趨勢(shì)的測(cè)度。
(三)眾數(shù)、中位數(shù)和平均數(shù)的比較
1.眾數(shù)、中位數(shù)和均值的關(guān)系
從分布的角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,而均值則是全部數(shù)據(jù)的算術(shù)平均。因此,對(duì)同一組數(shù)據(jù)計(jì)算眾數(shù)、中位數(shù)和均值,三者之間具有以下關(guān)系:在單蜂分布條件下,如果數(shù)據(jù)的分布是對(duì)稱的,則眾數(shù)、中位數(shù)和均值必定相等,即眾數(shù)=中位數(shù)=均值;如果數(shù)據(jù)是左偏分布,說(shuō)明數(shù)據(jù)存在極小值,必然拉動(dòng)均值向極小值一方靠,而眾數(shù)和中位數(shù)由于位置是代表值,不受極值的影響,因此三者之間的關(guān)系表現(xiàn)為:均值<中位數(shù)<眾數(shù);如果數(shù)據(jù)是右偏分布,說(shuō)明數(shù)據(jù)存在極大值,必然拉動(dòng)均值向極大值一邊靠,則眾數(shù)<中位數(shù)<均值,如圖1所示。
2.眾數(shù)、中位數(shù)和均值的特點(diǎn)與應(yīng)用場(chǎng)合
眾數(shù)、中位數(shù)和算術(shù)平均數(shù)各自具有不同的特點(diǎn),掌握它們之間的關(guān)系和各自的不同特點(diǎn),有助于在實(shí)際應(yīng)用中選擇合理的測(cè)度值來(lái)描述數(shù)據(jù)的集中趨勢(shì)。
(1)雖然對(duì)于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計(jì)算眾數(shù),但眾數(shù)主要適合于作為分類數(shù)據(jù)的集中趨勢(shì)測(cè)度值,而且眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義,當(dāng)數(shù)據(jù)量較少時(shí),不宣使用眾數(shù)。
(2)中位數(shù)以及其他分位數(shù)主要適用于作為順序數(shù)據(jù)的集中趨勢(shì)測(cè)度值,雖對(duì)于順序數(shù)據(jù)也可以使用眾數(shù),但以中位數(shù)為宜。
(3)算數(shù)平均數(shù)適合用于數(shù)值型數(shù)據(jù)的集中趨勢(shì)測(cè)度值,特別是當(dāng)分布比較法則,不存在極端值比較偏離現(xiàn)象時(shí),用算述平均數(shù)達(dá)標(biāo)集中趨勢(shì)最合適,但平均值的主要缺點(diǎn)是易受數(shù)據(jù)極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性差。因此,當(dāng)數(shù)據(jù)位偏態(tài)分布,特別是偏斜的程度較大時(shí),可以考慮選擇眾數(shù)或中位數(shù)等位置代表,這時(shí)它們的代表性要比平均數(shù)好。
(4)算術(shù)平均數(shù)包含的信息是最多的、最豐富的,算術(shù)平均數(shù)具有兩個(gè)重要的數(shù)學(xué)性質(zhì),即所有觀測(cè)值與算術(shù)平均數(shù)的離差和等于零;所有觀測(cè)值與算術(shù)平均勢(shì)的離差平方和為最小。
二、離散程度的測(cè)度
集中趨勢(shì)只是統(tǒng)計(jì)總體數(shù)據(jù)分布的特征之一。介于個(gè)體的差異性,總體中的各數(shù)據(jù)還呈現(xiàn)出與集中趨勢(shì)的代表值和分散的離中趨勢(shì),這是數(shù)據(jù)的另一特征,它所反映的是各變量值遠(yuǎn)離其中心值的程度。因此,對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析,除了要反映其分布的集中趨勢(shì)外,還要反映統(tǒng)計(jì)數(shù)據(jù)的離散程度,以達(dá)到對(duì)數(shù)據(jù)變動(dòng)規(guī)律的全面描述。
根據(jù)所依據(jù)數(shù)據(jù)類型的不同,數(shù)據(jù)離散程度的主要指標(biāo)有極差、平均差、四分位差、方差、標(biāo)淮差以及離散系數(shù)等。測(cè)度離散程度的主要作用如下。一是反映現(xiàn)象總體中變量分布的離中趨勢(shì)。總體各單位的標(biāo)志值存在差異,標(biāo)志變動(dòng)度表明總體各單位標(biāo)志值的分散程度。變量值的差異越大,離散趨勢(shì)也越大;反之,變量值越小,離散趨勢(shì)也越小。二是衡量均值的代表性。均值作為總體數(shù)量標(biāo)志的代表,其代表性取決于總體各數(shù)據(jù)的差異程度??傮w中各數(shù)據(jù)的變異程度越大,均值的代表性就越小;反之,總體中各數(shù)據(jù)的變異程度越小,均值的代表性就越大。三是測(cè)定現(xiàn)象變動(dòng)的均勻性或穩(wěn)定性程度。離散程度能夠表明生產(chǎn)過(guò)程的節(jié)奏性和其他活動(dòng)的均衡性,可作為企業(yè)產(chǎn)品質(zhì)量控制和評(píng)價(jià)經(jīng)濟(jì)管理工作的依據(jù)。
三、偏態(tài)與峰態(tài)的測(cè)度
(一)偏態(tài)的測(cè)度
在客觀實(shí)際生活中,一些經(jīng)濟(jì)變量的次數(shù)分配往往是非對(duì)稱型的,如收入分配、市場(chǎng)占有份額、資源配置等等,這些經(jīng)濟(jì)變量經(jīng)分組后,總體各單位在不同的分組變量值下分布并不均勻?qū)ΨQ,而呈現(xiàn)出偏斜的分布狀況,統(tǒng)計(jì)上將其稱為偏態(tài)分布。利用眾數(shù)、中位數(shù)和平均數(shù)之間的關(guān)系就可以判斷分布是對(duì)稱、左偏還是右偏。顯然,判斷偏態(tài)的方向并不困難,但要測(cè)度偏斜的程度則需要計(jì)算偏態(tài)系數(shù)。統(tǒng)計(jì)分折中測(cè)定偏態(tài)系數(shù)的方法很多。
(二)峰態(tài)的測(cè)度
峰態(tài)是指數(shù)據(jù)分布的尖峭狀況和程度。峰態(tài)是次數(shù)分布的另一個(gè)數(shù)量特征。這個(gè)特征是:某種次數(shù)分布與正態(tài)分布相比較,是尖頂還是平頂,其尖頂或平頂?shù)某潭热绾巍7涠仁谴螖?shù)分布曲線頂端的尖峭程度。峰度通常分為三種:正態(tài)峰度、尖峰度和平峰度。如果分布的形狀比正態(tài)分布更高更瘦,則稱為尖峰分布;如果分布的形狀比正態(tài)分布更矮更胖,則稱為平峰分布。峰態(tài)系數(shù)是統(tǒng)計(jì)中描述次數(shù)分布狀態(tài)的又一個(gè)重要特征值,用以測(cè)定鄰近數(shù)值周圍變量值分布的集中或分散程度。
參考文獻(xiàn):
[1] 陳文麗,韓立巖.λ-可加模糊測(cè)度的一般形式及分布特征[J].模糊系統(tǒng)與數(shù)學(xué),2007(1).
[2] 張 紅,王新生,余瑞林.基于Voronoi圖的測(cè)度點(diǎn)狀目標(biāo)空間分布特征的方法[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(3).
[責(zé)任編輯:文 筠]