国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一個高效實現(xiàn)灰色關聯(lián)分析的R程序

2015-12-25 00:34:52高志華李桂琴石曉輝馬莉麗
安徽農(nóng)學通報 2015年23期
關鍵詞:R語言灰色關聯(lián)分析

高志華++李桂琴++石曉輝++馬莉麗

摘 要:灰色關聯(lián)分析模型是一種廣泛應用于各個科研領域的重要的統(tǒng)計模型,但其數(shù)據(jù)處理過程計算量很大。R是一門高級統(tǒng)計計算編程語言,可以在通用公共許可(GPL)規(guī)則下從互聯(lián)網(wǎng)免費獲取。該研究基于灰色關聯(lián)分析方法設計了一個可快速自動計算鄧氏關聯(lián)度的R程序,通過成功應用于實例,驗證了本程序的可行性和高效性。

關鍵詞:R語言;灰色關聯(lián)分析;R程序應用實例

中圖分類號 N941.5 文獻標識碼 A 文章編號 1007-7731(2015)23-13-04

An Efficient R Program for Implementing Grey Relational Analysis

Gao Zhihua1,2,3 et al.

(1College of Biological Science and Engineering,Hebei University of Economics and Business,Shijiazhuang 050061,China;2 School of Life Science,Hebei Normal University,Shijiazhuang 050016,China;3 School of Life Sciences,F(xiàn)udan University,Shanghai 200438,China)

Abstract:Grey relational analysis model widely used in various scientific research fields is a very important statistical model,but it needs lots of computations to finish the whole data process. R is an advanced programming language for statistical computing and is available as free software downloaded from the Internet under the terms of the Free Software Foundations GNU General Public License.In this paper,based on the method of grey relational analysis,a fast automatic calculation program in R for Deng relational degree is designed,and successfully applied into the actual case to verify its feasibility and high-efficiency.

Key words:R program;Grey relational analysis;Application case in R program

灰色關聯(lián)分析是從無序、隨機的系統(tǒng)特征量中確定各因素間的關聯(lián)程度,早在1982年,鄧聚龍教授就提出了計算灰色關聯(lián)度的統(tǒng)計模型,該模型基本思想是根據(jù)序列曲線幾何形狀的相似程度來判斷其聯(lián)系是否密切,曲線越接近,則相應序列之間關聯(lián)度就越大,反之則越小[1-3]?;疑P聯(lián)分析方法是處理“小樣本”、“貧信息”不確定系統(tǒng)的有效方法,因其實用性強,且不像其他多元統(tǒng)計模型(如相關、回歸等)要求大樣本和符合典型分布,故在許多科學研究領域都用廣泛應用[4]。經(jīng)初步統(tǒng)計中國知網(wǎng)文獻檢索結(jié)果,發(fā)現(xiàn)從2000年至今,公開發(fā)表的應用灰色關聯(lián)分析模型解決生命科學問題的相關學術(shù)論文已有506篇,且大體呈上升趨勢(如圖1所示),可見,灰色關聯(lián)分析方法在生命科學領域的應用日益廣泛。

圖1 2000年至今發(fā)表的灰色關聯(lián)分析方面論文篇數(shù)

目前,常用的數(shù)理統(tǒng)計軟件有:Excel、SPSS、SAS、DPS等[5,6]。在這506篇論文中有120篇明確指出了灰色關聯(lián)分析所使用的數(shù)據(jù)分析軟件,但是所使用的軟件種類卻不盡相同(見表1)。

Excel是Microsoft Office辦公軟件的組件之一,具有數(shù)據(jù)統(tǒng)計分析的功能,比較靈活、直觀,能夠根據(jù)不同計算目的,編寫不同的公式來進行一些簡單的數(shù)據(jù)分析,有6.67%的灰色關聯(lián)分析單獨使用Excel來完成,有27.5%的灰色關聯(lián)分析需要Excel配合其它軟件來完成,說明Excel在日常數(shù)據(jù)分析中占有重要地位,但是,如果使用Excel處理大量數(shù)據(jù),即使是使用相同算法,也需要每次輸入眾多數(shù)學公式,進行繁瑣的代數(shù)運算,費時費力,還易出錯;SPSS和SAS都是非常優(yōu)秀的國外數(shù)理統(tǒng)計軟件,它們區(qū)別在于:前者已經(jīng)將常用的統(tǒng)計算法固化于軟件之中,只要熟練掌握使用方法,能夠減少重復性勞動,且分析效率高,但由于其自身封閉性,如果想使用一些不常用或最新的算法處理自己的數(shù)據(jù),則不支持,除非軟件編制者更新這些算法,后者除了具備各種統(tǒng)計功能之外,還能夠通過編程來實現(xiàn)自己的特殊算法,以滿足不同的數(shù)據(jù)處理需求,但是,要求使用者事先熟練掌握其復雜的編程語法,由于二者都要求使用者事先熟練掌握大量的功能函數(shù)及相應分析模型的理論,而且都是英文操作界面,這就使得基礎科技工作者難以在短期內(nèi)準確掌握;Matlab已經(jīng)發(fā)展為綜合高性能的數(shù)值計算軟件,在數(shù)理統(tǒng)計方面的功能不斷增強,也支持編程,情況與SAS類似[7];DPS(Data Processing System)是由浙江大學農(nóng)業(yè)與生物技術(shù)學院唐啟義教授研發(fā)的國內(nèi)首款中文操作界面數(shù)理統(tǒng)計軟件,因其無需使用者了解具體運算細節(jié),僅靠點擊鼠標即可完成絕大多數(shù)的數(shù)據(jù)分析任務,簡單易行,所以越來越得到廣大科技工作者的認可[8]。與SPSS、SAS和Matlab的22.5%使用率相比,有56.67%的學者選擇DPS進行灰色關聯(lián)分析也充分說明了這一點。但值得一提的是,無論是與SPSS、SAS、Matlab,還是DPS,都屬于商業(yè)軟件,有的甚至還需要二次支付額外費用才能使用這些軟件的某些數(shù)理統(tǒng)計模塊,無疑給科研工作增加了不小的成本投入。也正是基于這一點,本文首次探索R語言實現(xiàn)灰色關聯(lián)分析的新途徑。

1 R語言簡介

R語言是一門出色的統(tǒng)計計算編程語言,屬于解釋性計算機語言,可以在通用公共許可(GPL)規(guī)則下從互聯(lián)網(wǎng)免費獲取,能夠?qū)⑵洳渴鹪贛icrosoft Windows、UNIX、Linux以及Macintosh OS X系統(tǒng)中,可以實現(xiàn)“一次編碼,到處運行”,極大提高了分析效率[9]。R語言為統(tǒng)計建模和圖示提供了種類繁多、唾手可得的軟件包,還允許用戶既可以使用成熟的統(tǒng)計技術(shù),也可以使用實驗性的統(tǒng)計技術(shù)。同時,R語言具有極其豐富的繪圖功能,如前文圖1就是使用ggpolt2 R包繪制。與C/C++語言相比,R語言是一種更加高級的編程語言,易學易用,盡管其執(zhí)行速度稍遜,但實踐表明,其開發(fā)速度帶來的效益遠遠大于執(zhí)行速度帶來的損失,特別是在現(xiàn)代計算機的處理速度情況下。R語言現(xiàn)已逐步成為國內(nèi)外眾多科技工作者青睞的數(shù)據(jù)分析工具。

2 鄧氏灰色關聯(lián)分析算法簡介及R實現(xiàn)

灰色關聯(lián)分析方法依據(jù)空間理論的數(shù)學基礎,按照規(guī)范性、偶對稱性、整體性和接近性的灰色關聯(lián)四原則,以確定參考序列和若干個比較序列之間的關聯(lián)系數(shù)和關聯(lián)度。鄧氏關聯(lián)分析模型是最早運用灰色系統(tǒng)理論計算灰色關聯(lián)度的統(tǒng)計模型,在各個學科領域均有應用,所以尋求一種簡單、自動、高效的鄧氏關聯(lián)度計算方法十分必要。

2.1 鄧氏灰色關聯(lián)分析算法 鄧氏灰色關聯(lián)分析模型包括以下6個計算步驟:

(1)確定待分析的變量序列。參考序列用x0表示,比較序列用xi(i=1,2,…,n,表示共有n個比較序列)表示,統(tǒng)稱為變量序列[4]。

(2)對變量序列進行無量綱化。為了消除各指標量綱不一致對關聯(lián)分析的影響,要在分析前對變量序列原始數(shù)據(jù)進行無量綱化處理,處理后的參考序列用x′0表示,比較序列用x′i(i=1,2,…,n,表示共有n個比較序列)表示。常用的方法有初值化法、均值化法、區(qū)間化法、逆化法、倒數(shù)化法等[10-11]。

(3)求差序列、最大差和最小差。根據(jù)公式:△0i(k)=|x′0(k)-x′i(k)|(其中,i=1,2,…,n,表示共有n個比較序列;k=1,2,…,m,表示每個比較序列由m個指標組成)計算參考序列與其余各比較序列的絕對差值,并找出其中的最大差和最小差,分別用△max與△min表示。

(4)計算關聯(lián)系數(shù)。其中,為關聯(lián)系數(shù),ρ為分辨系數(shù),0≤ρ≤1,一般ρ取0.5。

(5)計算關聯(lián)度。其中,為參考序列x0與比較序列xi的鄧氏關聯(lián)度,為第k個指標的加權(quán)系數(shù)。

(6)按取值大小進行排序。對各從大到小進行排序,取值越大,說明比較序列與參考序列的平均距離越小,越相似。

2.2 鄧氏灰色關聯(lián)分析算法的R實現(xiàn)及要求 利用R軟件(V3.20)編程實現(xiàn)上述算法,該程序提供了初值化和均值化兩種變量序列無量綱化方法,及是否加權(quán)計算鄧氏關聯(lián)度的選項,運行該程序的基本環(huán)境要求如下:(1)硬件要求:目前主流的個人電腦配置(32位或64位)均可,一般硬盤最好40GB以上,內(nèi)存最好2GB以上。(2)軟件要求:安裝WindowXP或Windows 7操作系統(tǒng),安裝2003及以上Microsoft Office辦公軟件,安裝V3.20及以上R環(huán)境。

3 R程序應用于實例

以灰度關聯(lián)分析方法對不同南瓜品種的產(chǎn)量和果膠質(zhì)量(果膠含量、酯化度、粘度)進行綜合評價為例[12],使用上述R程序進行灰度關聯(lián)分析過程如下:

3.1 新建原始數(shù)據(jù)文件 新建原始數(shù)據(jù)文件example.csv,鍵入不同南瓜品種的產(chǎn)量和果膠質(zhì)量(果膠含量、酯化度、粘度)的原始數(shù)據(jù)(見表2),保存并退出。

在上述命令中,greyRelationalAnalysis.R為鄧氏灰色關聯(lián)分析R程序,example.csv為原始數(shù)據(jù)文件,接下來的2個“1”分別是無量綱化方法參數(shù)和是否加權(quán)參數(shù),out.csv為分析結(jié)果文件。在此,無量綱化方法參數(shù)共有2個:1表示初值化法,2表示均值化法;是否加權(quán)參數(shù)也有兩個:0表示不加權(quán),1表示加權(quán)。

3.3 分析結(jié)果 采用初值化法將9種南瓜品種(含假設理想品種)各指標的平均值進行無量綱化后,得到如表3所示結(jié)果;再將8種南瓜品種分別與假設理想品種做比較,得到8種南瓜品種與假設理想品種間各指標的關聯(lián)系數(shù)(見表4);然后按照加權(quán)(各指標的權(quán)重依次為:0.35、0.25、0.20、0.20)和不加權(quán)兩種方式計算8種南瓜品種與假設理想品種間鄧氏關聯(lián)度;最后對兩類關聯(lián)度分別進行排序(見表5)。

由表5可知,不論是加權(quán)還是不加權(quán),北京1號的鄧氏關聯(lián)度最高,京紅栗的鄧氏關聯(lián)度最低,根據(jù)灰色系統(tǒng)理論,北京1號不僅產(chǎn)量高,而且果膠品質(zhì)好,適宜用于果膠開發(fā),京紅栗不宜作果膠開發(fā)原料,這與蘇艷玲等[12]的分析結(jié)果一致,說明本文開發(fā)的R程序可以進行鄧氏灰色關聯(lián)分析。

4 討論與結(jié)論

根據(jù)研究對象的不同特征,除鄧氏灰色關聯(lián)分析模型外[13],還有灰色絕對關聯(lián)度、相對關聯(lián)度、廣義關聯(lián)度[14-16]、灰色斜率關聯(lián)度、區(qū)間關聯(lián)度Ⅰ[17]、點關聯(lián)度、區(qū)間關聯(lián)度Ⅱ[18]、B型關聯(lián)度、C型關聯(lián)度[19]、T型關聯(lián)度[20]、向量關聯(lián)度、復數(shù)關聯(lián)度[21]等。SPSS和DPS是十分成熟的軟件,但很難涵蓋上述所有灰色關聯(lián)分析模型;SAS和Matlab除了提供各種統(tǒng)計功能,還支持編程,但由于和SPSS、DPS一樣,只有付費才能獲得正版軟件的使用權(quán),增加了廣大科技工作者的科研成本;Excel生動直觀,但計算繁瑣且容易出錯。R軟件是一款自由、免費、開源的軟件,具有強大的統(tǒng)計分析功能,同時又是一門高級編程語言,而且無需編譯過程,開發(fā)周期較短,代碼維護方便,程序運行簡單。本文根據(jù)鄧氏灰色關聯(lián)分析算法編寫的R程序分析了不同南瓜品種的產(chǎn)量和果膠質(zhì)量(果膠含量、酯化度、粘度)各指標,得到了與蘇艷玲等[12]一致的分析結(jié)果,并且從原始數(shù)據(jù)輸入到分析任務完成僅用0.019秒(見圖2),可見本程序?qū)疑P聯(lián)分析的可行性和高效性,同樣,本程序也非常適合大量數(shù)據(jù)的分析和重復性強的工作。通過利用R編程對鄧氏關聯(lián)分析的成功探索,為日后繼續(xù)開發(fā)其它灰色關聯(lián)分析模型的R程序奠定了堅實基礎。

參考文獻

[1]鄧聚龍.灰色系統(tǒng)基礎方法[M].武漢:華中理工大學出版社,1987.

[2]李東亮,馮廣林,李剛,等.灰色系統(tǒng)理論在煙草質(zhì)量評價中的應用[M].北京:中國水利水電出版社,2013.

[3]劉思峰,謝乃明.灰色系統(tǒng)理論及其應用[M].北京:科學出版社,2013.

[4]譚學瑞,鄧聚龍.灰色關聯(lián)分析:多因素統(tǒng)計分析新方法[J].統(tǒng)計研究,1995,65(3):46-48.

[5]朱海濤,陳黎,涂自良,等.DPS數(shù)據(jù)處理系統(tǒng)在藥學研究數(shù)據(jù)處理中的應用[J].醫(yī)藥導報,2006,25(4):363-365.

[6]唐啟義,馮明光.DPS數(shù)據(jù)處理系統(tǒng)——實驗設計、統(tǒng)計分析及模型優(yōu)化[M].北京:科學出版社,2006.

[7]周建興,豈興明,矯津毅,等.MATLAB從入門到精通[M].北京:人民郵電出版社,2012.

[8]唐啟義.通用統(tǒng)計軟件DPS研制與應用[J].科學中國人,2004(9):56.

[9]郝智恒,何通,鄧一碩,等.R語言統(tǒng)計入門(第2版)[M].北京:人民郵電出版社,2014.

[10]徐文鳳,毛志泉,孫海濤,等.灰色關聯(lián)度分析法在拮抗絲核菌木霉菌株篩選中的應用[J].山東農(nóng)業(yè)大學學報,2012,43(2):189-192.

[11]劉新梅,徐潤芳,張若勇.鄧氏灰色關聯(lián)分析的應用模型[J].統(tǒng)計與決策,2008,262(20):23-25.

[12]蘇艷玲,張學杰.不同南瓜品種果膠含量與特性分析及其利用評價[J].園藝學報,2014,41(11):2323-2328.

[13]鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中理工大學出版社,1990.

[14]劉思峰,黨耀國,方志耕.灰色系統(tǒng)理論及其應用[M].北京:科學出版社,2010.

[15]XIE N M,LIU S F.Research on evaluations of several grey relational models adapt to grey relational axioms[J].Journal of Systems Engineering and Electronics,2009,20( 2):304-309.

[16]GU H,SONG B F.Study on effectiveness evaluation of weapon systems based on grey relational analysis and TOPSIS[J].Journal of Systems Engineering and Electronics,2009,20(1):106-111.

[17]崔杰,黨耀國,劉思峰.幾類關聯(lián)分析模型的新性質(zhì)[J].系統(tǒng)工程,2009,27(4):65-70.

[18]肖新平,宋中民,李峰.灰技術(shù)基礎及其應用[M].北京:科學出版社,2005.

[19]王清印.灰色B型關聯(lián)度分析[J].華中理工大學學報,1989,17(6):77-81.

[20]唐五湘.T型關聯(lián)度及其計算方法[J].數(shù)理統(tǒng)計與管理,1995,14(1):34-37.

[21]謝乃明,劉思峰.積累關聯(lián)度模型的平行性和一致性[J].系統(tǒng)工程,2007,25(8):98-103.

(責編:張長青)

猜你喜歡
R語言灰色關聯(lián)分析
運動員組織承諾水平的評價與提升策略
基于GPS軌跡數(shù)據(jù)進行分析改善城市交通擁擠
新疆向西開放度與經(jīng)濟增長灰色關聯(lián)分析
基于R語言的Moodle平臺數(shù)據(jù)挖掘技術(shù)的研究
基于灰色關聯(lián)的河南省旅游收入影響因素研究
科技與管理(2016年3期)2016-12-20 10:35:11
基于灰色關聯(lián)分析的制造企業(yè)跨國并購財務決策
秸稈資源化對吉林省經(jīng)濟結(jié)構(gòu)的影響研究
中國能源消費與經(jīng)濟增長關系研究
時代金融(2016年30期)2016-12-05 19:01:53
基于R語言的湖南產(chǎn)業(yè)結(jié)構(gòu)對其經(jīng)濟增長貢獻分析
商(2016年24期)2016-07-20 08:03:39
注重統(tǒng)計思維培養(yǎng)與應用為主導的生物統(tǒng)計學課程建設
考試周刊(2016年15期)2016-03-25 04:09:43
文化| 晋中市| 建阳市| 烟台市| 托克托县| 瑞丽市| 漳浦县| 瓮安县| 牡丹江市| 古蔺县| 疏附县| 洞头县| 漳浦县| 广东省| 黄陵县| 泾源县| 天镇县| 内丘县| 略阳县| 澎湖县| 罗甸县| 龙门县| 延寿县| 西盟| 九龙坡区| 夹江县| 东安县| 诸暨市| 仁怀市| 承德县| 澄迈县| 玛曲县| 台前县| 平凉市| 广水市| 军事| 新泰市| 商城县| 光泽县| 榆社县| 高陵县|