繆子陽(yáng),李婷玉,祝夢(mèng)琳
(1.南京郵電大學(xué)管理學(xué)院,江蘇南京210000;2.南京郵電大學(xué)貝爾英才學(xué)院,江蘇南京210000)
葡萄酒的評(píng)價(jià)模型
繆子陽(yáng)1,李婷玉2,祝夢(mèng)琳1
(1.南京郵電大學(xué)管理學(xué)院,江蘇南京210000;2.南京郵電大學(xué)貝爾英才學(xué)院,江蘇南京210000)
對(duì)于多個(gè)葡萄酒樣品,2組評(píng)酒員的打分不盡相同。要解決的就是通過(guò)顯著性檢驗(yàn)來(lái)判別不同組別的評(píng)酒員的打分是否具有顯著性差異,同時(shí)根據(jù)2組評(píng)分的方差的平均值來(lái)判斷哪一組的可信度更高;對(duì)釀酒葡萄進(jìn)行聚類分析。
葡萄酒;t-檢驗(yàn);聚類分析;多元線性回歸
葡萄酒質(zhì)量的好壞通常都是聘請(qǐng)一些專業(yè)的評(píng)酒員來(lái)鑒定。而葡萄酒的質(zhì)量往往與釀酒葡萄有關(guān),因此對(duì)釀酒葡萄的理化指標(biāo)、葡萄酒本身的理化指標(biāo)和葡萄酒質(zhì)量這三者的關(guān)系進(jìn)行研究是十分必要的[1]。本文結(jié)合2012年全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽A題建立數(shù)學(xué)模型對(duì)葡萄酒進(jìn)行評(píng)價(jià)。
對(duì)于問(wèn)題一,分析2組評(píng)酒員的評(píng)價(jià)結(jié)果有無(wú)顯著性差異,將紅、白2種葡萄酒分別進(jìn)行顯著性檢驗(yàn)。首先將每位評(píng)酒員對(duì)每種樣品葡萄酒的各指標(biāo)評(píng)分進(jìn)行求和,得到總評(píng)分,然后對(duì)每一種葡萄酒樣品的2組的10個(gè)總評(píng)分進(jìn)行t-檢驗(yàn),最后總體分析對(duì)于紅、白2種葡萄酒,不同組別的評(píng)酒員的評(píng)分是否具有顯著性差異。此過(guò)程可以通過(guò)SPSS軟件進(jìn)行數(shù)據(jù)分析得出結(jié)果。
對(duì)于問(wèn)題一中分析哪一組的評(píng)價(jià)結(jié)果更可信,首先計(jì)算出2個(gè)組的10個(gè)評(píng)酒員對(duì)每一樣品葡萄酒的總評(píng)分的方差,再分別計(jì)算2個(gè)組對(duì)紅、白2種葡萄酒不同樣品總評(píng)分的方差的平均值,求得的平均值越小,說(shuō)明評(píng)價(jià)值越穩(wěn)定,可信度越高。法二對(duì)2個(gè)組對(duì)紅、白葡萄酒評(píng)分的平均差進(jìn)行比較,較小者可信度高。
對(duì)于問(wèn)題二,將釀酒葡萄進(jìn)行聚類分析,可以以第一問(wèn)比較可信的那組的葡萄酒質(zhì)量評(píng)分和釀酒葡萄的理化指標(biāo)為依據(jù)。對(duì)于葡萄酒的質(zhì)量,采用問(wèn)題一求解出的可信度較高的一組總評(píng)分來(lái)衡量,將釀酒葡萄的理化指標(biāo)無(wú)量綱化,利用MATLAB軟件進(jìn)行聚類分析,可分別對(duì)紅、白2種葡萄酒進(jìn)行分級(jí)。
假設(shè)各評(píng)酒員的評(píng)價(jià)水平穩(wěn)定,不發(fā)生改變;各評(píng)酒員之間的評(píng)價(jià)結(jié)果相互獨(dú)立,互不影響。
X1ij表示第1組各評(píng)酒員對(duì)各紅葡萄酒樣品的總評(píng)分(i表示評(píng)酒員編號(hào),j表示酒樣品編號(hào),下同),x2ij表示第2組各評(píng)酒員對(duì)各紅葡萄酒樣品的總評(píng)分,x3ij表示第1組各評(píng)酒員對(duì)各白葡萄酒樣品的總評(píng)分,x4ij表示第2組各評(píng)酒員對(duì)各白葡萄酒樣品的總評(píng)分。
4.1.1 模型的建立
4.1.1.1 顯著性檢驗(yàn)
分析2組評(píng)酒員的評(píng)價(jià)結(jié)果有無(wú)顯著性差異,將紅、白2種葡萄酒分別進(jìn)行顯著性檢驗(yàn)。首先將每位評(píng)酒員對(duì)每種樣品葡萄酒的各指標(biāo)評(píng)分進(jìn)行求和,得到總評(píng)分,然后對(duì)每一種葡萄酒樣品的2組的10個(gè)總評(píng)分進(jìn)行t-檢驗(yàn),最后總體分析對(duì)于紅、白2種葡萄酒,不同組別的評(píng)酒員的打分是否具有顯著性差異。
首先對(duì)紅葡萄酒的2組評(píng)分樣中的每一種葡萄酒樣品進(jìn)行方差的齊性檢驗(yàn),此題運(yùn)用Levene方差齊性檢驗(yàn)?zāi)P蚚2],進(jìn)行F-檢驗(yàn)。檢驗(yàn)假設(shè)H0∶σ1=σ2=…=σk,即各處理組方差相等;H1∶σi≠σj,即各處理組方差不全相等。取α=0.01或α=0.05.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值:
Zhi的定義公式如下:
然后對(duì)紅葡萄酒的2組評(píng)分樣中的每一種葡萄酒樣品進(jìn)行樣本平均數(shù)差異的顯著性檢驗(yàn)。運(yùn)用SPSS軟件處理數(shù)據(jù),進(jìn)行數(shù)據(jù)等同性t-檢驗(yàn)[3]。
檢驗(yàn)假設(shè)H0∶μ1=μ2;H1∶μi≠μ2,即各處理組方差不全相等。取α=0.01或α=0.05.
構(gòu)造檢驗(yàn)統(tǒng)計(jì)量t并計(jì)算:
4.1.1.2 可信度評(píng)價(jià)
對(duì)于分析哪一組的評(píng)價(jià)結(jié)果更可信,法一首先計(jì)算出2個(gè)組的10個(gè)評(píng)酒員對(duì)每一樣品葡萄酒的總評(píng)分的方差,再分別計(jì)算2個(gè)組對(duì)紅、白2種葡萄酒不同樣品總評(píng)分的方差的平均值,求得的平均值越小,說(shuō)明評(píng)價(jià)值越穩(wěn)定,可信度越高。法二對(duì)2個(gè)組對(duì)紅、白葡萄酒評(píng)分的平均差進(jìn)行比較,較小者可信度高。
運(yùn)用平均差評(píng)價(jià)時(shí),對(duì)每種酒樣品的10個(gè)總評(píng)分計(jì)算平均差,再計(jì)算每組評(píng)價(jià)的平均平均差。
對(duì)于第1組紅葡萄酒的評(píng)分,每種酒樣品的平均差為:
第1組評(píng)分的平均差:式(6)中:n為樣品數(shù)目。
同理對(duì)于第2組,對(duì)紅葡萄酒的評(píng)分以及白葡萄酒的2組評(píng)分也作上述處理,此處不再贅述。
4.1.2 模型的求解
4.1.2.1 顯著性評(píng)價(jià)結(jié)果
對(duì)于顯著性檢驗(yàn),運(yùn)用SPSS軟件處理數(shù)據(jù),得到紅、白2種葡萄酒的每一種樣品的2組總評(píng)分的顯著性檢驗(yàn)結(jié)果,紅葡萄酒的27組評(píng)價(jià)結(jié)果中,在0.05顯著水平上,有樣品2,3,11,12,13,16,23,24這8個(gè)樣品的2組評(píng)價(jià)結(jié)果有顯著性差異;在0.01顯著水平上,只有12,23這2組存在顯著性差異。所以可以認(rèn)為,對(duì)于紅葡萄酒,2組評(píng)分結(jié)果不存在顯著性差異。同理,白葡萄酒的28組評(píng)價(jià)結(jié)果中,在0.05顯著水平上,有樣品5,27這2組存在顯著性差異;在0.01顯著水平上,沒(méi)有存在顯著性差異的組。所以認(rèn)為,對(duì)于白葡萄酒,2組評(píng)分結(jié)果不存在顯著性差異。
綜上,對(duì)于紅、白2種葡萄酒,2組的評(píng)分結(jié)果都不存在顯著性差異。
4.1.2.2 可信度評(píng)價(jià)結(jié)果
對(duì)于分析哪組評(píng)價(jià)結(jié)果可信度高,根據(jù)模型可以求得一系列方差數(shù)據(jù),得到不管是紅葡萄酒的評(píng)分,還是白葡萄酒,都是第2組給出的評(píng)分穩(wěn)定,即紅、白2種葡萄酒的評(píng)分都是第2組的可信度高。
運(yùn)用平均差評(píng)價(jià)的方法,也可以得到一系列平均差值及最終的平均平均差,AD1=6.48,AD2=4.71,AD3=9.05,AD4=5.85,顯然AD1>AD2,AD3>AD4.因此可以認(rèn)為不管是紅葡萄酒的評(píng)分,還是白葡萄酒,都是第2組給出的評(píng)分穩(wěn)定,也即紅、白2種葡萄酒的評(píng)分都是第2組的可信度高。
綜合2種可信度評(píng)價(jià)的方法,可以得到相同的結(jié)果,即不管是紅葡萄酒的評(píng)分,還是白葡萄酒,都是第2組給出的評(píng)分穩(wěn)定,也即紅、白2種葡萄酒的評(píng)分都是第2組的可信度高。運(yùn)用2種方法求出的結(jié)果相同,也說(shuō)明模型的可靠性。
4.2.1 模型的建立
設(shè)Yi=(Yi1,Yi2,Yi3,…,Yi30,Yi31)表示第i個(gè)酒釀葡萄樣品的理化指標(biāo)和葡萄酒的質(zhì)量為(Yi1,Yi2,Yi3,…,Yi30,Yi31)個(gè)指標(biāo)統(tǒng)計(jì)值的樣本均值為μj,樣本方差為σ.
根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí),對(duì)于葡萄酒的質(zhì)量,采用問(wèn)題一求解出的可信度較高的一組(組二)的總評(píng)分來(lái)衡量,即:
酒釀葡萄的理化指標(biāo)采用了附件2中所給的30個(gè)一級(jí)指標(biāo),對(duì)于其中有多次測(cè)量的指標(biāo),取平均值。
由于各指標(biāo)量綱不統(tǒng)一,且數(shù)據(jù)相差懸殊,為了消除不同量級(jí)和不同量綱指標(biāo)對(duì)距離的影響,先將樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,采用Zscore法進(jìn)行如下變換:
設(shè)dij表示第i個(gè)酒釀葡萄樣品的理化指標(biāo)和葡萄酒的質(zhì)量Yi與第k個(gè)酒釀葡萄樣品的理化指標(biāo)和葡萄酒的質(zhì)量Yk之間的歐式標(biāo)準(zhǔn)距離,即:
dij越小,表示第i個(gè)酒釀葡萄樣品的理化指標(biāo)和葡萄酒的質(zhì)量與第j個(gè)酒釀葡萄樣品的理化指標(biāo)和葡萄酒的質(zhì)量整體情況越接近,即這2個(gè)葡萄樣品劃為一類的機(jī)會(huì)就越大。
4.2.2 模型的求解
利用MATLAB軟件進(jìn)行聚類分析,可分別對(duì)紅、白2種葡萄酒的酒釀葡萄進(jìn)行分類,得到譜系圖。根據(jù)譜系圖,將紅葡萄酒酒釀葡萄分為5類,分類結(jié)果為{11},{1},{10},{3},{2,4,5,6,7,8,9,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27}。將白葡萄酒分為7類,分類結(jié)果為{27},{3},{15},{1,13},{22},{8,11,16},{2,4,5,6,7,9,10,12,14,17,18,19,20,21,23,24,25,26,28}。
再通過(guò)計(jì)算每一類酒釀葡萄對(duì)應(yīng)的葡萄酒的評(píng)分的平均值,按照評(píng)分的高低排序,對(duì)其進(jìn)行分級(jí)。
經(jīng)總結(jié),得出以下結(jié)論:①問(wèn)題一中分析2組評(píng)分的可信度運(yùn)用方差和平均差2種方法分析,且得到相同的結(jié)果,驗(yàn)證了模型的正確性與可靠性;②對(duì)數(shù)據(jù)進(jìn)行歸一化處理,消除量剛不同的問(wèn)題;③不僅分析出理化指標(biāo)間的關(guān)聯(lián)度,還運(yùn)用多元線性回歸給出具體的表達(dá)式;④葡萄分級(jí)的結(jié)果存在明顯的極端現(xiàn)象,有些級(jí)別分到的樣品過(guò)少,而有些級(jí)別過(guò)多,需要運(yùn)用其他模型,比如模糊綜合評(píng)價(jià)等方法進(jìn)行改進(jìn)。
[1]劉偉城.葡萄酒的評(píng)價(jià)[J].才智,2013(10):312.
[2]程琮,范華.Levene方差齊性檢驗(yàn)[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2005,22(6):408-409.
[3]孫立宏.獨(dú)立樣本平均數(shù)差異的顯著性檢驗(yàn)方法與應(yīng)用[J].職大學(xué)報(bào),2009,4(3):34-35.
〔編輯:劉曉芳〕
O212.1
:A
10.15913/j.cnki.kjycx.2017.16.022
2095-6835(2017)16-0022-03