馮鶴林,陳勇明
(成都信息工程學(xué)院數(shù)學(xué)學(xué)院,成都610225)
一種改進(jìn)的T型灰色關(guān)聯(lián)度及應(yīng)用研究
馮鶴林,陳勇明
(成都信息工程學(xué)院數(shù)學(xué)學(xué)院,成都610225)
文章通過對(duì)唐五湘和孫玉剛提出T型關(guān)聯(lián)度思想與灰色關(guān)聯(lián)度幾何意義的分析,對(duì)于某些目標(biāo)序列和各因素序列量綱相同的系統(tǒng),無需對(duì)每組數(shù)據(jù)都進(jìn)行標(biāo)準(zhǔn)化處理,提出了灰色T型關(guān)聯(lián)度的一種改進(jìn)模型,改進(jìn)后的T型關(guān)聯(lián)度既能反映正、負(fù)關(guān)聯(lián)度,特別是在總體上能夠體現(xiàn)兩序列的相關(guān)程度。最后給出了改進(jìn)算法的一個(gè)應(yīng)用實(shí)例。
T型關(guān)聯(lián)度;標(biāo)準(zhǔn)化處理;整體;正、負(fù)關(guān)聯(lián)度;占里
灰色關(guān)聯(lián)度不僅是灰色系統(tǒng)理論的重要組成部分,并為灰色系統(tǒng)分析、預(yù)測(cè)、決策奠定基礎(chǔ)?;疑P(guān)聯(lián)分析的工具是灰色關(guān)聯(lián)度,所以對(duì)灰色關(guān)聯(lián)度進(jìn)行研究具有重要的意義。其主要就兩序列之間的幾何相似程序進(jìn)行比較,描述其相近程度。序列越接近,關(guān)聯(lián)程度越大。自鄧聚龍教授[1]提出鄧氏關(guān)聯(lián)度以來,灰色關(guān)聯(lián)度就得到很大的發(fā)展和改進(jìn)。1995年唐五湘[2]通過增量來刻畫兩序列的關(guān)聯(lián)度,提出T型關(guān)聯(lián)度,用來度量正、負(fù)相關(guān)性;1997年查金茂[3]就唐五湘提出的T型關(guān)聯(lián)度,提出一系列問題如不滿足規(guī)范性以及增量為零時(shí)沒有意義,但并未提出解決方法;1998年張吉峰[4]在T型關(guān)聯(lián)度的基礎(chǔ)上引入了周期;2003年沈明宇[5]就唐五湘提出的T型關(guān)聯(lián)度的缺陷在兩增量為0時(shí),以及其中一序列為常數(shù)列時(shí)產(chǎn)生問題,提出了解決方案并修正了T型關(guān)聯(lián)度;2008年孫玉剛[6]則進(jìn)一步改進(jìn)了T型關(guān)聯(lián)度,在唐五湘的基礎(chǔ)上重新給出新的T型關(guān)聯(lián)系數(shù),并給出了改進(jìn)的關(guān)聯(lián)度的性質(zhì)。本文進(jìn)一步分析唐五湘和孫玉剛的T型關(guān)聯(lián)度的缺陷,并給出改進(jìn)的算法,并通過實(shí)例驗(yàn)證該方法的可行性。
唐五湘[2]提出的T型關(guān)聯(lián)度的基本思想如下:按照因素的時(shí)間序列曲線的相對(duì)變化勢(shì)態(tài)的接近程度來計(jì)算關(guān)聯(lián)度。對(duì)于離散時(shí)間序列,所謂兩曲線的相對(duì)變化勢(shì)態(tài)的接近程度,是指兩時(shí)間序列在對(duì)應(yīng)各時(shí)段△tk=tk-tk-1(k=1,2,…n)間原始變量經(jīng)標(biāo)準(zhǔn)化后的增量的大小來判定,若在時(shí)段△tk間兩增量相等或接近于相等,則這兩時(shí)間序列在時(shí)段△tk間的關(guān)聯(lián)系數(shù)就大;反之,就小。兩時(shí)間序列的關(guān)聯(lián)度定義為:各時(shí)段△tk間的關(guān)聯(lián)系數(shù)的加權(quán)平均值,權(quán)數(shù)為△tk。
按照T型關(guān)聯(lián)度的思想方法,唐五湘[2]給出T型關(guān)聯(lián)度的計(jì)算方法。對(duì)于時(shí)間區(qū)間[a,b],b>a≥0,令△tk=tk-tk-1,k=2,3,坌k兩原始時(shí)間序列在[a,b]間各點(diǎn)的取值分別為:
X1={X1(t1),X1(t2),…X1(tn)}和X2={X2(t1),X2(t2),…X2(tn)}
步驟1:標(biāo)準(zhǔn)化。
標(biāo)準(zhǔn)化的目的是使各序列之間具有可比性。具體的作法是
步驟2:求增量序列
△y1={△y1(tk)=y1(tk)-y1(tk-1),k=2,3,…n}
△y2={△y2(tk)=y2(tk)-y2(tk-1),k=2,3,…n}
步驟3:計(jì)算各時(shí)段的關(guān)聯(lián)系數(shù)
孫玉剛改進(jìn)的T型關(guān)聯(lián)系數(shù)計(jì)算公式
在式中,sgn(△y1(tk).△y2(tk))確定關(guān)聯(lián)系數(shù)ξ(tk)的符號(hào),當(dāng)ξ (tk)>0時(shí),表示X1和X2在tk-1點(diǎn)到tk這時(shí)間段內(nèi)是同方向變化的,即正關(guān)聯(lián),反之,若ξ(tk)<0,則負(fù)關(guān)聯(lián)。
步驟4:計(jì)算總體的關(guān)聯(lián)度。記原始時(shí)間序列X1和X2的關(guān)聯(lián)度為r(X1,X2),則
為了說明T型關(guān)聯(lián)度的缺陷,我們先證明一個(gè)定理
定理1:當(dāng)X2={X2(t1),X2(t2),…,X2(tn)}序列與X1={X1(t1),X1(t2),…,X1(tn)}存在線性關(guān)系時(shí),不妨記為X2(tk)=aX1(tk)+b,k=1,2,…,n,a≠0時(shí),按照唐五湘的T型關(guān)聯(lián)度計(jì)算得到的關(guān)聯(lián)度r (X1,X2)=±1
注:用孫玉剛的T型關(guān)聯(lián)系數(shù)計(jì)算,可得到當(dāng)序列與存在線性關(guān)系時(shí),也得到的關(guān)聯(lián)度。
證明:
步驟1:求標(biāo)準(zhǔn)化序列
步驟2:求增量序列
步驟3:計(jì)算各時(shí)段的關(guān)聯(lián)系數(shù)
X1和X2在tk-1點(diǎn)tk到這時(shí)間段內(nèi)的關(guān)聯(lián)度ξ(tk)為
當(dāng)a>0時(shí),ξ(tk)=1,當(dāng)a<0時(shí),ξ(tk)=-1
步驟4:計(jì)算總體的關(guān)聯(lián)度r(X1,X2)
故當(dāng)X2={X2(t1),X2(t2),…,X2(tn)}序列與X1={X1(t1),X1(t2),…,X1(tn)}存在線性關(guān)系時(shí),關(guān)聯(lián)度r(X1,X2)=±1。
同理,換用孫玉剛定義的T型關(guān)聯(lián)系數(shù)計(jì)算會(huì)得出當(dāng)X2序列與X1存在線性關(guān)系時(shí),關(guān)聯(lián)度r(X1,X2)=±1。
通過下面的幾個(gè)問題,來說明T型關(guān)聯(lián)度的缺陷。
問題一:根據(jù)灰色關(guān)聯(lián)度的思想,當(dāng)兩序列形狀相近或相似時(shí),其關(guān)聯(lián)程序就越大,對(duì)于X2序列與X1存在線性關(guān)系,從這種角度來分析,它們形狀絕對(duì)不是完全相同(相反)。結(jié)合定理1,這說明這樣定義T型關(guān)聯(lián)度過程中都存在一定的問題。歸結(jié)其原因,導(dǎo)致這樣原因在于,采用了消除量綱的方法,最終導(dǎo)致量化后的序列△y1與△y2間的增量|△y1|與|△y2|相等或相反。由于T型關(guān)聯(lián)度研究的對(duì)象是各序列增量之間的相互情況。如果不分具體情況對(duì)所有的數(shù)據(jù)進(jìn)行量綱化處理,反而會(huì)弱化或放大某些增量間的關(guān)系,導(dǎo)致錯(cuò)誤的結(jié)論。
考慮到這個(gè)問題,我們必須思考是不是有必要對(duì)所有的數(shù)據(jù)進(jìn)行量綱化處理。為了說明其實(shí)不然,我們?cè)賮砜匆粋€(gè)例子:
兩原始時(shí)間序列在[a,b]間各點(diǎn)的取值分別為:X1= {0,3,4,6}和X2={1,3,4,6},按照灰色關(guān)聯(lián)度的思想,這兩個(gè)序列在后面的△t2,△t3這兩部分不僅是平行的,更是完全重合的,其關(guān)聯(lián)系數(shù)ξ(tk)在△t2,△t3內(nèi)應(yīng)該為ξ(t2)=ξ(t3)=1,按唐五湘提出的T型關(guān)聯(lián)度的思想,對(duì)其做標(biāo)準(zhǔn)化處理后的數(shù)據(jù)相對(duì)應(yīng)的關(guān)聯(lián)系數(shù)為:這與灰色關(guān)聯(lián)度的思想不相符。由此可以看出不是每個(gè)序列都要對(duì)其做標(biāo)準(zhǔn)化處理。在下面的討論中,主要是對(duì)量綱相同,意義完全一樣的序列進(jìn)行分析,不需要采取標(biāo)準(zhǔn)化處理
問題二:計(jì)算序列X1和X2的關(guān)聯(lián)度r(X1,X2)采用關(guān)聯(lián)度只能正確反映出局部關(guān)聯(lián)系數(shù)間的關(guān)系,即只是對(duì)各區(qū)間段關(guān)聯(lián)系數(shù)進(jìn)行簡(jiǎn)單的求平均,并不能反映出各區(qū)間之間增量的差異。若不同區(qū)間內(nèi)兩序列關(guān)聯(lián)系數(shù)一樣,但這些區(qū)間內(nèi)增幅程度并不完全相同,其關(guān)聯(lián)度按孫玉剛或唐五湘提出的關(guān)聯(lián)度的計(jì)算方法和公式并無本質(zhì)區(qū)別,對(duì)于區(qū)間之間的差異沒有進(jìn)行充分描述,不能體現(xiàn)出整體差異。舉例說明:
已知X1={0,3,4,6},X2={0.9,3,4,6},X3={0,3,4,5.2}
求X1分別與X2,X3的T型關(guān)聯(lián)度。
增量序列為:△X1={3,1,2}△X2={2.1,1,2}△X3={3,1,1.2}
按孫玉剛給出改進(jìn)后的T型關(guān)聯(lián)系數(shù)公式可求得:
若按唐五湘,孫玉剛給出的T型關(guān)聯(lián)度計(jì)算公式將得出,
但參照?qǐng)D1和圖2:
序列2和序列3在[2,3]這段與序列1完全重合,要比較它們與序列1之間的關(guān)系實(shí)質(zhì)就是要比較序列2與序列1在[1,2]這段與序列3與序列1在[3,4]這段的近似程度。雖然在[1,2]這段序列2與序列1的關(guān)聯(lián)系數(shù)ξ12與在[3,4]這段序列3與序列1的關(guān)聯(lián)系數(shù)ξ13相等,即相對(duì)接近程序相同,但總體來看,序列3與序列1之間的差距只有0.8,但序列2與序列1的差距卻有0.9,這樣序列3比序列2更接近于序列1,其關(guān)聯(lián)度也應(yīng)該更大些。具體分析原因就是,在[1,2]區(qū)間上,序列2和序列1的關(guān)聯(lián)系數(shù)相對(duì)于區(qū)間[3,4]上序列3與序列1的關(guān)聯(lián)系數(shù)一樣,即相對(duì)接近程序一樣,但由于在[1,2]區(qū)間上,原始序列1的增幅程度卻大于在[3,4]區(qū)間上的增幅程度,所以在[1,2]區(qū)間上影響大于在[3,4]區(qū)間上的影響,即在[1,2]區(qū)間上所占的權(quán)重要大于在[3,4]區(qū)間上的權(quán)重。在[1,2]區(qū)間上序列3與序列1重合,但序列2與序列1卻存在差異,在[3,4]區(qū)間上所以這段上序列2與序列1重合,但序列3與序列1卻存在差異,這兩段區(qū)間關(guān)聯(lián)系數(shù)是相等的,但權(quán)重不等,據(jù)此,可得出序列3與序列1的關(guān)聯(lián)度要大于序列2與序列1的關(guān)聯(lián)度。但若采用r(X1,X2)=這種方式來度量其關(guān)聯(lián)度,則將這種區(qū)別完全消除了。
在量綱相同和意義一樣的兩時(shí)間序列,按照因素的時(shí)間序列曲線的相對(duì)變化勢(shì)態(tài)的與原始序列的接近程度來計(jì)算關(guān)聯(lián)度。對(duì)于離散時(shí)間序列,所謂兩曲線的相對(duì)變化勢(shì)態(tài)的接近程度,是指兩時(shí)間序列在對(duì)應(yīng)各時(shí)段△tk=tk-tk-1(k=2,3,…, n)間原始變量的增量的大小來判定,無須進(jìn)行標(biāo)準(zhǔn)化處理,若在時(shí)段△tk間兩增量相等或接近于相等,則這兩時(shí)間序列在時(shí)段△tk間的關(guān)聯(lián)系數(shù)就大。兩時(shí)間序列的關(guān)聯(lián)度定義為:相同時(shí)段△tk間的關(guān)聯(lián)系數(shù)的加權(quán)平均值,權(quán)數(shù)為△X1(tk)。
對(duì)于量綱和意義相同的兩離散時(shí)間序列X1={X1(t1),X1(t2),…X1(tn)},X2={X2(t1),X2(t2),…X2(tn)}間T型關(guān)聯(lián)系數(shù)可采用下列步驟:
步驟1:求增量序列
△X1={△X1(tk)=X1(tk)-X1(tk-1),k=2,3,…n}
△X2={△X2(tk)=X2(tk)-X2(tk-1),k=2,3,…n}
步驟2:求兩序列間的關(guān)聯(lián)系數(shù)
設(shè)[a,b]上的兩時(shí)間序列分別為△X1={△X1(t1),X1(t2),…X1(tn)}和△X2={△X2(t1),X2(t2),…X2(tn)},稱
為序列X1與X2的在從tk-1到tk時(shí)間段△tk內(nèi)的關(guān)聯(lián)系數(shù),
min△X(tk)=min(|△X1(tk)|,|△X2(tk)|),max△X(tk)=max(|△X1(tk)|,|△X2(tk)|)
步驟3:求兩序列X1={X1(t1),X1(t2),…,X1(tn)},X2={X2(t1),X2(t2),…X2(tn)}間的關(guān)聯(lián)度,稱為X1與X2改進(jìn)的灰色T型關(guān)聯(lián)度。
r不僅能夠反映正負(fù)關(guān)聯(lián)程度,更能夠確切的表明某一時(shí)間段△tk內(nèi),增量對(duì)整體相似的貢獻(xiàn)程度。避免了以前所定義的T型關(guān)聯(lián)程度出現(xiàn)的,局部關(guān)聯(lián)系數(shù)不同,但總體關(guān)聯(lián)度可能相同,對(duì)應(yīng)的圖形與事實(shí)相差甚遠(yuǎn)的情況。
下面就貴州占里的生育問題分析給出改進(jìn)后T型關(guān)聯(lián)度的一個(gè)應(yīng)用實(shí)例,分析不同階段占里生育狀況、觀念的動(dòng)態(tài)變化情況。調(diào)查統(tǒng)計(jì)的有關(guān)數(shù)據(jù)見表1。
表1 占里數(shù)據(jù)表
依次記29-59年、60-75年、76-90年出生的戶主所構(gòu)成的序列分別為
X1=(3.736842105,30.26666667,4.857142857);X2= (2.438095238,24.926055,5.473683);X3=(3.3,25.30769231,4.6).
可求得:
△X1={26.5298,-25.4095};△X2={22.4880,-19.4524};△X3= {22.0077,-20.7077}
求得關(guān)聯(lián)系數(shù):
ζ21(t1)=0.3229,ζ21(t2)=0.2442,ζ23(t1)=0.7995,ζ23(t2)=0.6031計(jì)算關(guān)聯(lián)度為=0.7084
因此,r21與r23的關(guān)系應(yīng)該為r23>r21:
將60-75年出生的家庭(記為第二代)和76-90年出生的家庭(記為第三代)生育情況對(duì)比60-75年出生家庭和29-59年出生的家庭(記為第一代)的生育情況,前者比后者更為接近。從數(shù)據(jù)分析結(jié)果看,雖然第三代和第一代與第二代在平均孩子間年齡差上有一定的差異,但差異不大。其部分原因是,76-90年這一代正是剛結(jié)婚不久的一代,有一定的可變性,有些家庭還沒有第二個(gè)孩子,統(tǒng)計(jì)到的家庭應(yīng)該是結(jié)婚偏早和初育年齡偏小型的數(shù)據(jù)。相比第二代和第三代家庭與配偶的年齡對(duì)比第一代和第二代要相近得多,更重要的是初育年齡十分接近,甚至沒有什么較大的改變。從社會(huì)因素的角度來考慮,外界對(duì)占里的影響越來越大,信息的交流和思想的改變也正在逐漸影響占里,賴以生存的社會(huì)基礎(chǔ)發(fā)生的變革,一些傳統(tǒng)民俗日益淡化,生育習(xí)俗的活動(dòng)陣地縮小,傳統(tǒng)節(jié)日逐步被現(xiàn)代節(jié)日代替,傳統(tǒng)節(jié)育藥物和醫(yī)術(shù)的失傳,再加上科學(xué)的進(jìn)步和市場(chǎng)經(jīng)濟(jì)的發(fā)展,文化生活日益豐富,村民外出打工,參加祭祀活動(dòng)減少,一般情況下,中青年比老年更容易受新事物影響,占里生育狀況也隨之逐漸有所變化。
[1]劉思峰,黨耀國(guó),方志耕等.灰色系統(tǒng)理論及其應(yīng)用[M].北京:科學(xué)出版社,2008.
[2]唐五湘.T型關(guān)聯(lián)度及其計(jì)算方法[J].?dāng)?shù)理統(tǒng)計(jì)與管理,1995,14(1).
[3]查金茂.T型關(guān)聯(lián)度的缺陷[J].武漢交通科技大學(xué)學(xué)報(bào),1997,21(2).
[4]張吉峰.基于能量關(guān)聯(lián)度的時(shí)間序列周期分析[J].系統(tǒng)工程理論與實(shí)踐,1998,(9).
[5]沈明宇,胡寶清.修正T型關(guān)聯(lián)度及其在證券市場(chǎng)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2003,(5).
[6]孫玉剛,黨耀國(guó).灰色T型關(guān)聯(lián)度的改進(jìn)[J].系統(tǒng)工程理論與實(shí)踐, 2008,(4).
(責(zé)任編輯/亦民)
N941.5
A
1002-6487(2011)05-0160-04
教育部人文社會(huì)科學(xué)青年研究基金(10YJCZH157);四川省哲學(xué)社會(huì)科學(xué)重點(diǎn)研究基地民間文化研究中心資助(MJ09-03);成都信息工程學(xué)院引進(jìn)人才科研啟動(dòng)基金(KYTZ201001)
馮鶴林(1986-),男,湖北黃岡人,碩士研究生,研究方向:應(yīng)用統(tǒng)計(jì)、灰色系統(tǒng)。
陳勇明(1972-),男,四川成都人,博士研究生,副教授,研究方向:應(yīng)用統(tǒng)計(jì)、灰色系統(tǒng)、數(shù)據(jù)挖掘。