范梓淼, 周菊玲
(新疆師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,新疆 烏魯木齊 830017)
?
育種雜交棉的品質(zhì)分析
范梓淼,周菊玲
(新疆師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,新疆 烏魯木齊 830017)
摘 要:文章用主成分分析法分析了新疆南疆22種育種雜交棉的馬克隆、上半均長、整齊度、短纖維、反射率、黃度等9項(xiàng)指標(biāo),目的是找出代表絕大部分信息的綜合變量。結(jié)果顯示:四個(gè)主成分可以代表原始信息85%以上的信息,降低了數(shù)據(jù)維度,極大簡化了育種雜交棉品質(zhì)評價(jià)程序,為客觀準(zhǔn)確的評價(jià)棉花品質(zhì)提供了理論依據(jù)。
關(guān)鍵詞:育種雜交棉;主成分分析;品質(zhì)評價(jià)
棉花產(chǎn)業(yè)是新疆經(jīng)濟(jì)發(fā)展支柱產(chǎn)業(yè),為新疆提供了大量的就業(yè)機(jī)會(huì)。在新疆棉花產(chǎn)業(yè)快速發(fā)展的同時(shí),棉花自身出現(xiàn)了很多問題:如棉花品種“多、亂、雜”現(xiàn)象,且品種退化嚴(yán)重;原棉“類型單一、纖維一致性差、強(qiáng)力不足”等問題,這些都影響和制約新疆棉花產(chǎn)業(yè)持續(xù)發(fā)展。因此,培育出優(yōu)質(zhì)、豐產(chǎn)的廣適棉為新疆育種目標(biāo)[1]。而對育種雜交棉品質(zhì)評價(jià)問題為首要問題。文章便是針對如何客觀、正確地評價(jià)育種棉花品質(zhì),簡化品質(zhì)評價(jià)程序展開的研究。以新疆南疆某單位培育的22個(gè)育種雜交棉品種為例,對其馬克隆、上半均長、整齊度、短纖維、反射率、黃度等9項(xiàng)指標(biāo)進(jìn)行分析。由于該數(shù)據(jù)指標(biāo)多、數(shù)量級差異且各指標(biāo)間可能有很大關(guān)聯(lián),因此文章選擇主成分分析法解決。主成分分析是常用的多元統(tǒng)計(jì)方法,由于其降維的思想與多指標(biāo)評價(jià)指標(biāo)序化的要求非常接近,近年來更多地被應(yīng)用于社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、農(nóng)學(xué)的評價(jià)中,逐漸成為極具特色的多指標(biāo)評價(jià)技術(shù)[2]。
1主成分分析
1.1主成分分析原理
主成分分析(Principal Components Analysis)也叫主分量分析,在1933年由霍特林首先提出。主成分分析是利用降維的思想,在損失最少信息的條件下,把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合變量的多元統(tǒng)計(jì)方法,這幾個(gè)綜合指標(biāo)就成為主成分[3]。這些主成分的特點(diǎn)是,它們是原始指標(biāo)的線性組合,且各主成分間彼此不相關(guān)。這樣在研究指標(biāo)多的問題上通過主成分分析就可以只考慮少數(shù)幾個(gè)變量,濾去重疊信息的同時(shí)也不至于損失太多信息,便更容易抓住研究對象的主要矛盾,揭示其內(nèi)部規(guī)律,使問題簡化。
主成分分析的數(shù)學(xué)步驟如下:
設(shè)有n個(gè)樣品,每個(gè)樣品有p個(gè)指標(biāo),這樣共得到np個(gè)數(shù)據(jù),原始資料矩陣如下:
1.2建立模型
表1 公因子方差
*提取方法:主成分分析。
首先需要知道信息損失量,也就是 9個(gè)指標(biāo)轉(zhuǎn)化成新的綜合變量提取原始指標(biāo)信息的能力??梢詮谋?“提取”一列看出,除上半均長提取信息較少(0.699),即損失較大外,新的綜合變量幾乎包含了其他指標(biāo)85%以上的信息,這就保證了接下來分析的客觀性。
表2 解釋的總方差
*提取方法:主成分分析。
在育種雜交棉品質(zhì)評價(jià)的問題中,保留累積方差貢獻(xiàn)率85%以上為宜。觀察表2,前四個(gè)成分的方差累積率已達(dá)85.709%,因此文章提取四個(gè)綜合變量,即主成分,就可保留絕大部分原始的信息,且起到了降維作用。再由表3成分矩陣分析知,第一主成分方差貢獻(xiàn)率為36.774%,是分析的主要方面,它與強(qiáng)度(0.855)、整齊度(0.76)、成熟度(0.662)正相關(guān),與伸長率(-0.866)、短纖維(-0.518)、黃度(-0.461)負(fù)相關(guān)。該主成分幾乎涉及所有變量且各特征值絕對值大即顯著相關(guān),因此可稱為品質(zhì)綜合因子,第一主成分得分高的品種,纖維整齊度好,紡出的紗強(qiáng)力高,外觀色澤好。第二主成分方差貢獻(xiàn)率為25.887%,與馬克隆值(0.838)、成熟度(0.659)、短纖維(0.618)正相關(guān),與上半均長(-0.583)、黃度(-0.49)負(fù)相關(guān)。第二主成分得分適中的品種棉纖維細(xì)度好,且可保證纖維平均長度,稱為細(xì)度因子。第三主成分與反射率(0.883)正相關(guān),稱為反射率因子。得分高的品種,成熟度高。第四主成分與黃度(0.683)正相關(guān),成為外觀色澤因子[4]。
表3 成份矩陣(a)
*提取方法 :主成分分析法。a已提取了 4 個(gè)成分。
1.3計(jì)算得分并排序
表4 各主成分系數(shù)
由表4得到四個(gè)主成分y1,y2,y3,y4的線性組合為:
表5 各品種對應(yīng)各主成分的得分
表6 各育種雜交棉品種得分
2結(jié)語
主成分分析法能夠在面對變量較多,信息重疊的問題時(shí),通過線性變換將多個(gè)變量減少為幾個(gè)綜合因子,簡化算法,提高分析效率,其特點(diǎn)是提取出的主成分能夠極大可能的反映原始數(shù)據(jù)的信息且主成分盡量互不相關(guān)。所以,主成分分析方法是解決此類問題行之有效的方法。文章中提取了累積貢獻(xiàn)率達(dá)85%以上的四個(gè)主成分,分別是品質(zhì)綜合因子、細(xì)度因子、反射率因子、外觀色澤因子,通過主成分得分可計(jì)算出各雜交棉品種得分,從而對培育雜交棉提供了指導(dǎo)意見。因此,此方法應(yīng)用于農(nóng)業(yè)等相關(guān)產(chǎn)業(yè)的指導(dǎo)中,將大有益處[5]。
參考文獻(xiàn):
[1] 崔建平.新疆棉花生產(chǎn)現(xiàn)狀及持續(xù)發(fā)展建議[J].新疆農(nóng)業(yè)科學(xué),2008,(45):46-48.
[2] 李靖華.主成分分析用于多指標(biāo)評價(jià)的方法研究[J].管理工程學(xué)報(bào),2002,(1):39-44.
[3] 何曉群.多元統(tǒng)計(jì)方法[M].北京:中國人民大學(xué)出版社,2011,12.
[4] 朱明哲,等.雜交春棉纖維品質(zhì)性狀的多元統(tǒng)計(jì)分析[J].河南科技學(xué)院學(xué)報(bào),2007,35(3):4-6.
[5] 王芳.主成分分析與因子分析的異同比較與應(yīng)用[J].統(tǒng)計(jì)教育,2003,(5):1-17.
The Quality Characters Analysis of Breeding Hybrid Cotton
FAN Zi-miao,ZHOU Ju-ling
(DepartmentofMathematicalSciences,XinjiangNormalUniversity,Urumqi,Xinjiang, 830017,China)
Abstract:The breeding hybrid in the southern Xinjiang was assessed by using the principal component analysis. Nine indexes have analyzed including micromere, uniformity ration, reflectivity etc, so that calculated the new comprehensive variables which consists of most of the information. The results showed that 85% of the raw information could be described by the four comprehensive variables. By this way, the goal was achieved that the data dimension reduced, and then greatly simplifies the breeding hybrid cotton quality evaluation program. There’s theory for evaluating the quality objectively and accurately.
Key words:Breeding hybrid cotton; Principal component analysis; Quality evaluation
中圖分類號(hào):S114
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1008-9659(2016)01-058-05
[作者簡介]范梓淼(1991-),女,新疆阿克蘇人,碩士研究生,主要從事概率論與數(shù)理統(tǒng)計(jì)方向的研究。
[基金項(xiàng)目]新疆師范大學(xué)研究生科技創(chuàng)新基金資助(XYS201502011)。
[收稿日期]2015-10-25
新疆師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2016年1期