龔艷冰,戴靚靚,胡娜
(河海大學企業(yè)管理學院,江蘇常州213022)
在預測評價與決策等領域,回歸分析方法是一個重要且常用的研究方法,但是傳統(tǒng)回歸往往依賴于精確的統(tǒng)計數值及二值邏輯。在社會經濟活動中,部分或者全部的觀測數據常常是不精確或者用語言值描述的數據,使得經典線性回歸模型受到限制。人們常常使用自然語言值表示定性概念,例如大概、溫度不高、相當小等,恰恰是人們賴以識別分析乃至決策的重要依據。針對現實世界語言值的模糊性,日本學者Tanaka等[1]首次提出模糊線性回歸模型,主要用于反映自變量和因變量的模糊關系。經典回歸模型把真實數據和估計值之間的偏差認為是觀測誤差,而模糊回歸模型將這種誤差視為系統(tǒng)結構自身的模糊性,并把數據和其估計值之間的偏差視為系統(tǒng)參數的模糊性,從而由參數模糊化來解決這一問題[2]。國內外許多學者對模糊線性回歸模型的參數估計方法進行了大量研究[3-11],并在系統(tǒng)預測、評估和決策等方面開展了大量應用研究[12-15]。
現有估計參數方法主要是最小二乘或最小一乘回歸模糊數截集距離方法。模糊截集距離方法一旦隸屬度被選擇,“硬化”成精確數字,關于概念的所有不確定性都消失了,并且計算較復雜。針對上述方法的不足,本文試圖通過引入模糊數的COWA可能性期望,僅僅考慮模糊數的可能性期望區(qū)間,并對期望區(qū)間信息進行COWA算子集結,從COWA算子期望距離最小的角度估計回歸模型的參數。本文方法通過決策中偏好期望的形式反映人的主觀模糊性,在某種程度上提升了模糊回歸模型的靈活性和合理性。
定義1:設模糊數A的隸屬函數為:
則稱A=(a,α,β)為三角模糊數,其中α,β稱為三角模糊數的左右擴展。根據Zadeh的擴展原理,可得三角模糊數A=(a,α1,β1)和B=(b,α2,β2)的算術運算法則為[9]:
A+B=(a+b,α1+α2,β1+β2)
定義2[16]:設模糊數A的γ截集為A(γ)=[al(γ),au(γ)],則模糊數A的可能性區(qū)間期望為:
定義3[17]:設a=[a-,a+]為區(qū)間數,且
其中,Q:[0,1]→[0,1]是具有下列性質的函數:①Q(0)=0;②Q(1)=1;③若x>y,則Q(x)>Q(y),則稱f為連續(xù)區(qū)間數據OWA算子,簡稱為COWA算子。Q稱為基本的單位區(qū)間單調(BUM)函數。由文獻[17]可知,若令表示決策者的主觀偏好,則COWA算子可以表示為:
因此,由定義2和定義3,可以給出模糊數A的偏好期望值為:
特別的,如果模糊數A=(a,α,β)是三角模糊數,則A的偏好期望值為:
考慮自變量和因變量都為模糊數的線性回歸模型,即:
其中,xi=(1,x1i,x2i,…,xpi)表示模糊數自變量向量,yi表示模糊數因變量,bj,j=0,1,2,…,p為回歸系數。為方便起見,本文以三角模糊數為例并令三角模糊數xji=(aji,αji,βji)(=0,1,2,…,p;i=1,2,…,n),則模型(7)的模糊數據回歸模型可改寫成:
由于模型本身的模糊性,上述三角模糊線性回歸模型要成立,并不需要對于任意截集都成立,只需要模型(7)的期望值成立,即對于給定的偏好系數λ(0≤λ≤1),模型(7)可以轉化為傳統(tǒng)回歸模型:
為了估計上述模型的參數,本文給出COWA算子期望距離的概念,即模糊數A和B的距離可以定義為:
特別的,令λ=k/m(k=0,1,2,…,m),可以得到離散化的COWA算子期望距離:
結合離散化的偏好期望距離公式(11),可將模糊因變量估計值與觀測值間的誤差表示為:
將式(7)代入式(12)可得期望誤差為:
根據最小二乘法令:
和
通過求解上述線性方程組(14)和(15)可得到模糊線性回歸模型(7)的回歸系數的估計值,我們稱這種最小二乘參數估計方法為COWA期望距離最小二乘方法(COWA-EDLS)。
為了有效評估上述模糊線性回歸模型的性能,需要對模型的誤差進行估計。傳統(tǒng)的回歸分析是針對觀測值與擬合值的距離進行比較,利用點對點的差距來評價擬合結果。本文將擬合值與實際值之間的偏好期望距離差作為誤差估計的檢驗依據,當回歸方程擬合出來的模糊回歸模型具有較小的E值,則說明該模型應該是不錯的模型。
為了說明本文方法的可行性,以Chen等[3]給出的人員績效評估的例子進行實證研究。人員績效評估是企業(yè)人力資源管理中一項重要的功能,顯然,由于人員績效評估的主觀性,通常采用語言值來描述評估值,科學合理的評估結果將影響到人力資源管理功能的整體表現。根據人力資源管理的相關理論,考慮工作績效(因變量y)的四個主要影響因素(自變量)包括[3]:工作能力(x1)、抗壓性(x2)、拖延頻率(x3)和溝通和協調能力(x4)。假定影響因素評估論域均為[0,100],樣本容量為30,并且語言值用三角模糊數表示,如下頁表1所示。
應用Matlab軟件,選取偏好參數λ=0,0.1,0.2,…,1,即m=10,將上述數據代入線性方程組(14)和(15)可得下列線性方程組:
表1 績效評估自變量和因變量三角模糊數樣本
22181.5b0+1482402b1+1554375.7b2+1402096.9b3+1165618.3b4=1150361.2
20163b0+1329906.8b1+1402096.9b2+1366366.8b3+1026775.4b4=1015677.4
17138b0+1125334.7b1+1.165618.3b2+1026775.4b3+1040556.7b4=898216.9
求解上述線性方程組,可得回歸系數:
b0=10.5671,b1=0.8681,b2=-0.170,b3=-0.1489,b4=0.0882
則三角模糊線性回歸方程為:
y(xi)=10.5671(1,0,0)+0.8681(a1i,α1i,β1i)-0.1705(a2i,α2i,β2i)-0.1489b3(a3i,α3i,β3i)+0.0882(a4i,α4i,β4i)
從上述回歸模型看到工作能力(x1)對員工工作績效的影響是最大的,溝通和協調能力(x4)對員工工作績效也存在正面影響,弱抗壓性(x2)和拖延頻率(x3)這兩個變量對工作績效產生負面影響但影響力度不大,這與實際情況是相一致的。
根據三角模糊數的算術運算法則,計算上述回歸模型的預測值yci,并按照距離公式(10)計算預測值yci=(y1i,α1i,β1i)與實際值yi=(y0i,α0i,β0i)之間的偏好期望距離差:
將其作為誤差估計的檢驗依據,結果如表2所示。結果表明,本文的COWA期望距離最小二乘估計方法是可行的,與傳統(tǒng)最小二乘方法和截集距離最小二乘方法比較誤差也相對較小。
表2 擬合效果與距離誤差測度表
最小二乘估計方法是模糊線性回歸模型中常用的參數估計方法,考慮到三角模糊數的普遍性,針對數據輸入、輸出為三角模糊數的模糊線性回歸模型,引入模糊數的COWA算子可能性期望值的概念,在此基礎上,定義COWA算子期望距離,提出了模糊線性回歸模型的參數估計方法,并對模型進行了誤差分析。通過員工績效的實例計算和其他模型的比價結果表明,本文的方法具有良好的擬合效果,且計算簡單。
[1]Tanaka H,Uejima S,Asai K.Linear Regression Analysis With Fuzzy Model[J].IEEE Transactions on Systems Man,and Cybernetics,1982,(12).
[2]柏林,房勇.基于模糊回歸分析的投資組合選擇模型[J].系統(tǒng)工程理論與實踐,2015,35(7).
[3]Chen L H,Hsueh C C.Fuzzy Regression Models Using the Leastsquares Method Based on the Concept of Distance[J].IEEE Transactions on Fuzzy Systems,2009,(17).
[4]Farhadinia B.Sensitivity Analysis in Interval-valued Trapezoidal fuzzy Number Linear Programming Problems[J].Applied Mathematical Modelling,2014,(38).
[5]Wan S P,Dong J Y.Possibility Linear Programming With Trapezoidal Fuzzy Numbers[J].Applied Mathematical Modelling,2014,(38).
[6]Ebrahimnejad A,Tavana M.A Novel Method for Solving Linear Programming Problems With Symmetric Trapezoidal Fuzzy Numbers[J].Applied Mathematical Modelling,2014,(38).
[7]任燕,郭嗣琮.基于結構元最小二乘序的模糊線性回歸[J].模糊系統(tǒng)與數學,2015,29(1).
[8]李俊紅,曾文藝.基于梯形模糊數的模糊最小一乘回歸模型[J].系統(tǒng)工程理論與實踐,2015,35(6).
[9]石苗,王達布希拉圖.基于LR模糊數據的線性回歸模型[J].廣州大學學報:自然科學版,2014,13(2).
[10]彭宇文,郭莉莎,毛超.基于改進模擬退火算法的模糊回歸參數估計[J].統(tǒng)計與決策,2014,(1).
[11]岳立柱.系數為一般模糊數的多元線性回歸模型[J].統(tǒng)計與決策,2015,(3).
[12]任麗麗,陸秋君.基于模糊線性回歸的電子商務交易額預測[J].統(tǒng)計與決策,2013,(3).
[13]趙建有,周孫鋒,崔曉娟,王高青.基于模糊線性回歸模型的公路貨運量預測方法[J].交通運輸工程學報,2012,12(3).
[14]張轉,常安定,王媛英,王曉晨.基于正態(tài)模糊線性回歸確定河流橫向擴散系數[J].長江科學院院報,2015,32(8).
[15]邵良杉,趙琳琳,溫廷新,孔祥博.基于模糊多元線性回歸模型的巖石可爆性評價[J].中國安全科學學報,2015,25(7).
[16]Carlsson C,Fullér R.On Possibilistic Mean Value and Variance of Fuzzy Numbers[J].Fuzzy Sets and Systems,2001,(122).
[17]Yager R R.OWA Aggregation Over a Continuous Interval Argument With Application to Decision Making[J].IEEE Transactions on Systems Man and Cybernetics-Part B,2004,(34).