国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于類平均聚類法的普通高等??茖W(xué)校辦學(xué)規(guī)模區(qū)域差異研究*

2015-03-21 10:21:48陳江麗
關(guān)鍵詞:規(guī)模聚類辦學(xué)

陳江麗

(滇西科技師范學(xué)院信息科學(xué)與技術(shù)系,云南臨滄677000)

基于類平均聚類法的普通高等??茖W(xué)校辦學(xué)規(guī)模區(qū)域差異研究*

陳江麗

(滇西科技師范學(xué)院信息科學(xué)與技術(shù)系,云南臨滄677000)

在市場經(jīng)濟(jì)的背景下,全國各地的普通高等專科學(xué)校呈現(xiàn)出區(qū)域發(fā)展的趨勢。在學(xué)校招生規(guī)模、培養(yǎng)規(guī)模和畢業(yè)生規(guī)模等指標(biāo)的基礎(chǔ)上,采用類平均聚類法對各地區(qū)普通高等專科學(xué)校的辦學(xué)規(guī)模進(jìn)行分析,利用Matlab平臺(tái)進(jìn)行仿真,生成不同區(qū)類的劃分,有利于進(jìn)一步研究不同區(qū)域間學(xué)校發(fā)展的戰(zhàn)略和因地制宜的人才培養(yǎng)方向。

類平均聚類法;高等??茖W(xué)校;辦學(xué)規(guī)模;系統(tǒng)聚類樹;不一致系數(shù)

《中國教育大辭典》中指出:高等??茖W(xué)校的主要宗旨是實(shí)施全日制高等職業(yè)技術(shù)教育,培養(yǎng)專門技術(shù)人員,注重實(shí)際知識(shí)和理論的掌握及實(shí)際技能的訓(xùn)練,以培養(yǎng)適應(yīng)經(jīng)濟(jì)和社會(huì)發(fā)展的技能型人才為目標(biāo)[1]。因此,普通高等??茖W(xué)校的畢業(yè)生主要面向和服務(wù)社會(huì)的技術(shù)和應(yīng)用型崗位,輻射較廣泛,社會(huì)需求較大,在經(jīng)濟(jì)發(fā)展和社會(huì)進(jìn)步中起到巨大的促進(jìn)作用。

但由于經(jīng)濟(jì)和文化條件不同,各地普通高等專科學(xué)校辦學(xué)規(guī)模的差異較大,區(qū)域差異在總體上呈擴(kuò)大趨勢。區(qū)域教育發(fā)展不協(xié)調(diào),帶來了許多經(jīng)濟(jì)問題和社會(huì)問題。它不僅嚴(yán)重制約了我國經(jīng)濟(jì)的可持續(xù)發(fā)展和社會(huì)的全面進(jìn)步,而且造成了教育機(jī)會(huì)和教育過程的不公平,對社會(huì)和諧、政治穩(wěn)定構(gòu)成了潛在威脅,同時(shí)也進(jìn)一步加劇了技能型人才的流失。

因此,準(zhǔn)確分析和全面把握高等專科學(xué)校辦學(xué)規(guī)模區(qū)域發(fā)展的差異性,有利于國家立足于本地區(qū)的經(jīng)濟(jì)現(xiàn)狀、社會(huì)需求和自身實(shí)際情況,準(zhǔn)確定位學(xué)校的人才培養(yǎng)目標(biāo)、服務(wù)面向和辦學(xué)特色,更好地推動(dòng)區(qū)域經(jīng)濟(jì)和社會(huì)的發(fā)展。

1 類平均聚類法

類平均聚類法是將類與類間的距離定義為樣品間平方距離的平均值,將距離最近的兩類合并為一類,最終實(shí)現(xiàn)聚類的目的[2]。假設(shè)存在類GK、GL,則GK和GL之間的平方距離的計(jì)算如公式(1)所示[3]。

若某一步類GK和GL合并成新類GM時(shí),GM與另一類GJ間的平方距離可以推廣為公式(2)。

從公式(1)、(2)中可以看出,類平均法充分地利用了所有樣品之間的信息,同一類中的平均距離小,表示樣本間的相似度高;而不同類間的平均距離大,表示樣本間的相似度低。因此,類平均法是一種較合理有效的系統(tǒng)聚類法。

2 利用類平均聚類法分析普通高等??茖W(xué)校辦學(xué)規(guī)模的區(qū)域差異

普通高等??茖W(xué)校辦學(xué)規(guī)模的評價(jià)主要參照學(xué)校招生規(guī)模、培養(yǎng)規(guī)模和畢業(yè)生規(guī)模等指標(biāo),如表1列出2013年全國31個(gè)省、市、自治區(qū)和直轄市高等??茖W(xué)校的各項(xiàng)數(shù)據(jù)。利用類平均聚類法進(jìn)行聚類分析,將地區(qū)按辦學(xué)規(guī)模劃分為不同的類,根據(jù)同一類地區(qū)普通高等??茖W(xué)校辦學(xué)規(guī)模的相似性,不同類地區(qū)間的差異性,為區(qū)域間普通高等專科學(xué)校辦學(xué)規(guī)模的差異性研究提供重要依據(jù),對全面提高普通高等??茖W(xué)校辦學(xué)能力、促進(jìn)區(qū)域協(xié)調(diào)發(fā)展提供科學(xué)的指導(dǎo)。

表1 2013年全國各地區(qū)普通高等??茖W(xué)校辦學(xué)規(guī)模指標(biāo)數(shù)據(jù)

數(shù)據(jù)來源:中華人民共和國國家統(tǒng)計(jì)局網(wǎng)站,2014年《中國統(tǒng)計(jì)年鑒》

2.1 類平均聚類分析各地區(qū)普通高等??茖W(xué)校辦學(xué)規(guī)模的Matlab實(shí)現(xiàn)

利用MATLAB對各地區(qū)普通高等??茖W(xué)校的辦學(xué)規(guī)模進(jìn)行聚類分析。需要先讀取表1中的招生數(shù)、在校生數(shù)、畢業(yè)生數(shù)和預(yù)計(jì)畢業(yè)生數(shù)4個(gè)變量數(shù)據(jù)放入矩陣X中,X就是一個(gè)31×4的矩陣。再讀取表1中的地區(qū)名稱放入矩陣area中,area是一個(gè)包含31個(gè)元素的列向量。完成數(shù)據(jù)的準(zhǔn)備工作后,接著按以下四個(gè)步驟進(jìn)行分析處理。

2.1.1 樣本的預(yù)處理

為了保證分析結(jié)果的準(zhǔn)確性,需要對樣本數(shù)據(jù)進(jìn)行一些預(yù)處理,如平滑處理、標(biāo)準(zhǔn)化變換和極差歸一化變換等。在實(shí)際應(yīng)用中,可根據(jù)數(shù)據(jù)特征選擇相應(yīng)的處理。

針對學(xué)校辦學(xué)規(guī)模指標(biāo)數(shù)據(jù)各變量的量綱和數(shù)量級不一致的情況,采用zsocre函數(shù)對原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,如式(3)所示。

2.1.2 計(jì)算樣本間距離

聚類開始時(shí),先將31個(gè)地區(qū)樣本各自作為一類,接著計(jì)算各個(gè)樣本間的距離,為接下來對距離最近的兩類進(jìn)行合并提供依據(jù)。

樣本間距離的計(jì)算方法包括明氏距離、蘭氏距離、馬哈拉諾比斯距離和斜交空間距離等。其中最常用的是明氏距離中的歐式距離。第i個(gè)樣本和第j個(gè)樣本之間的歐式距離計(jì)算如公式(4)所示[4]。

MATLAB中使用pdist函數(shù)計(jì)算樣本間的歐式距離,對于各地區(qū)的指標(biāo)數(shù)據(jù)X,調(diào)用函數(shù)格式為y= pdist(X),輸出y是31個(gè)樣本間的距離向量,分別對應(yīng)第i個(gè)(其中i=2,3,…,31)和第j個(gè)(其中j=1,2,…,30)樣本間的距離。

2.1.3 利用類平均聚類法創(chuàng)建聚類樹

創(chuàng)建聚類樹是聚類分析中的關(guān)鍵環(huán)節(jié),可以完整地反映聚類的過程。MATLAB工具箱中提供了linkage函數(shù)創(chuàng)建系統(tǒng)聚類樹,對31個(gè)地區(qū)指標(biāo)樣本的距離向量y,調(diào)用函數(shù)格式為Z=linkage(y, 'average')。其中'average'表示使用類平均法進(jìn)行聚類。輸出Z是創(chuàng)建的各地區(qū)專科學(xué)校辦學(xué)規(guī)模聚類樹,包含個(gè)元素的矩陣,它的每一行對應(yīng)一次聚類。

為了清晰直觀地反映創(chuàng)建的聚類樹,可利用MATLAB工具箱中的dendrogram函數(shù)生成聚類樹形圖,對聚類樹Z,地區(qū)名稱area,調(diào)用函數(shù)格式為H= dendrogram(Z,0,'orientation','right','labels',area),生成的聚類樹形圖如圖1所示。圖中的倒U形線用來連接聚類對象,線的高度表示聚類距離,距離的遠(yuǎn)近反映聚類的先后順序。聚類樹形圖的方向從右至左,地區(qū)名作為葉節(jié)點(diǎn)標(biāo)簽,顯示在圖的左側(cè)。通過聚類樹形圖,可以完整和清晰展現(xiàn)聚類的過程。

圖1 聚類樹形圖

2.1.4 計(jì)算聚類樹的不一致系數(shù)

系統(tǒng)聚類樹的不一致系數(shù)可用來確定最終的分類個(gè)數(shù),可使用MATLAB工具箱中的inconsistent函數(shù)進(jìn)行計(jì)算。對上一步創(chuàng)建的聚類樹Z,調(diào)用函數(shù)格式為T=inconsistent(Z),輸出參數(shù)T是一個(gè)包含30×4個(gè)元素的矩陣,其中的第4列為每一次聚類的不一致系數(shù),T(:,4)=[0,0,0,0.7071,0,0.7071,0, 0.7071,0,0,0.7071,1.0928,0.7071,0,0.7071,0, 0.7071,1.1418,0.7071,0,0.7071,1.0843,0.9893, 1.1488,0.7071,0.7071,1.1293,1.1544,1.0867, 1.0233]’。

若某一次聚類的不一致系數(shù)較上一次有大幅增加,則說明這次聚類的效果并不好,而上一次的聚類效果比較好。通過觀察和比較不一致系數(shù)T(:, 4)??紤]倒數(shù)第4、5次聚類的不一致系數(shù)的變化,不一致系數(shù)大幅增加0.4222,說明倒數(shù)第5次的聚類效果是比較好的,對照圖1的系統(tǒng)聚類樹形圖可看出,此時(shí)樣本被劃分為5類。因此,可明確將各地區(qū)專科學(xué)校的招生規(guī)模指標(biāo)數(shù)據(jù)聚為5類是最合適的。

2.1.5 生成聚類結(jié)果

最終根據(jù)創(chuàng)建好的系統(tǒng)聚類樹和確定的聚類個(gè)數(shù)生成聚類結(jié)果并輸出,以完成整個(gè)聚類過程。

聚類結(jié)果的生成可利用MATLAB工具箱中的cluster函數(shù)實(shí)現(xiàn),由創(chuàng)建的聚類樹Z和聚類個(gè)數(shù)5,調(diào)用函數(shù)格式為C=cluster(Z,’maxclust’,5),輸出參數(shù)C為每一個(gè)樣本的所屬的類序號。每個(gè)聚類所包含的地區(qū)如下所示:

(1)第1類地區(qū):海南、西藏、青海、寧夏;

(2)第2類地區(qū):北京、天津、內(nèi)蒙古、吉林、黑龍江、上海、重慶、貴州、云南、甘肅、新疆;

(3)第3類地區(qū):河北、安徽、湖北、湖南、四川;

(4)第4類地區(qū):山西、遼寧、浙江、福建、江西、廣西、陜西;

(5)第5類地區(qū):江蘇、山東、河南、廣東。

2.2 分析結(jié)果

利用類平均聚類法對全國31個(gè)地區(qū)的普通高等??茖W(xué)校辦學(xué)規(guī)模進(jìn)行聚類分析,最終劃分為5類地區(qū)。通過分析每類地區(qū)間的差異,可以發(fā)現(xiàn)普通高等??茖W(xué)校的辦學(xué)規(guī)模與地理位置、經(jīng)濟(jì)發(fā)展水平、人口數(shù)量、教育發(fā)展水平等客觀因素有關(guān)。

第1類地區(qū)的招生規(guī)模最小。首先四個(gè)省份或自治區(qū)的地理位置屬偏遠(yuǎn)地區(qū),人口較少,教育水平相對較差。尤其西藏、青海和寧夏地區(qū)的經(jīng)濟(jì)發(fā)展水平較落后。這些因素都客觀地影響著普通高等??茖W(xué)校的辦學(xué)規(guī)模。

第2類地區(qū)的招生規(guī)模處于較低水平。其中,北京、上海、天津作為國際化的大都市,是中國政治、文化、科教的中心,對學(xué)歷層次的要求較高,因此在一定程度上也制約了??茖W(xué)校的發(fā)展。重慶、貴州、云南、甘肅、新疆、內(nèi)蒙古等省份作為西部地區(qū)城市,吉林和黑龍江位于祖國的東北,地理位置和經(jīng)濟(jì)發(fā)展水平等因素都制約了普通高等??茖W(xué)校的辦學(xué)規(guī)模的發(fā)展。

第3類地區(qū)的招生規(guī)模處于中等水平。河北、安徽、湖北、湖南、四川均處于中部地區(qū),地理?xiàng)l件較好,教育發(fā)展水平在全國處于前列,這些客觀因素都促進(jìn)了普通高等專科學(xué)校辦學(xué)規(guī)模的擴(kuò)大。

第4類地區(qū)的招生規(guī)模處于中上水平。這些地區(qū)大都處于東部或西部工業(yè)較發(fā)達(dá)的城市,對技能型和應(yīng)用型人才的需求量較大,在很大程度上促進(jìn)了??茖W(xué)校畢業(yè)生的就業(yè)。因此,在一定程度上推動(dòng)了普通高等??茖W(xué)校辦學(xué)規(guī)模的發(fā)展。

第5類地區(qū)的招生規(guī)模最大。其中的江蘇和廣東都是全國工業(yè)發(fā)展水平最高,經(jīng)濟(jì)實(shí)力最強(qiáng)的城市,對??菩蛻?yīng)用技能人才的需求量最大。河南和山東分別是中國人口的第一和第二大省,人力資源豐富,對??茖W(xué)校的辦學(xué)需求量較大。

3 結(jié)束語

利用類平均聚類法對全國各地區(qū)普通高等??茖W(xué)校的辦學(xué)規(guī)模進(jìn)行聚類分析,劃分為不同的區(qū)類,進(jìn)而研究區(qū)域間差異的因素,有利于國家立足于本地區(qū)的實(shí)際,促進(jìn)專科學(xué)校區(qū)域辦學(xué)的協(xié)調(diào)發(fā)展,更好地推動(dòng)經(jīng)濟(jì)和社會(huì)的可持續(xù)發(fā)展。

注釋及參考文獻(xiàn):

[1]李曉娟.東西部高等教育協(xié)調(diào)發(fā)展研究[D].石河子:石河子大學(xué),2010.

[2]Jiawei Han,Micheeline Kamber著,范明,孟小峰等譯.?dāng)?shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2010.

[3]于秀林,任雪松.多元統(tǒng)計(jì)分析[M].北京:中國統(tǒng)計(jì)出版社,2008.

[4]鄭紅英.?dāng)?shù)據(jù)挖掘聚類算法的分析和應(yīng)用研究[D].沙坪壩:重慶大學(xué),2002.

[5]趙光龍.中國高等教育資源配置空間分布研究[D].上海:華東師范大學(xué),2014.

[6]袁靜.區(qū)域高等教育與經(jīng)濟(jì)的協(xié)調(diào)發(fā)展研究[D].蘇州:蘇州大學(xué),2008.

Study on the Regional Differences between Higher Specialty Institutions Based on the ClassAverage Clustering Method

CHEN Jiang-li
(Department of Information Science and Technology,Dianxi Science and Technology Normal University, Lincang,Yunan 677000)

The development of higher specialty institutions in our country shows regional tendency under the market economy background.On the basis of the scale of enrollment,training and graduates and other indicators,weuse the class average clustering method to analyze school running scale of higher specialty institutions in every region,use MATLAB to simulation,and then we get different class divisions.The research is conducive to the further study of the school development strategy and local talent training direction between different regions.

class average clustering method;higher specialty institutions;school running scale;system clustering tree;inconsistent coefficient

TP301.6;G648.2

A

1673-1891(2015)03-0046-03

2015-03-25

云南省教育廳科學(xué)研究基金資助(項(xiàng)目編號:2013C037);臨滄師范高等??茖W(xué)校自然科學(xué)、基礎(chǔ)應(yīng)用研究基金資助項(xiàng)目(項(xiàng)目編號:LCSZL2013009)。

陳江麗(1984-),女,云南大理人,講師,碩士,研究方向:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘。

猜你喜歡
規(guī)模聚類辦學(xué)
2024年底A股各板塊市場規(guī)模
中外合作辦學(xué)在晉招生錄取情況一覽表
網(wǎng)絡(luò)平臺(tái)補(bǔ)短板 辦學(xué)質(zhì)量穩(wěn)提升
規(guī)模之殤
能源(2018年7期)2018-09-21 07:56:14
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
Mentor Grpahics宣布推出規(guī)??蛇_(dá)15BG的Veloce Strato平臺(tái)
汽車零部件(2017年2期)2017-04-07 07:38:47
基于改進(jìn)的遺傳算法的模糊聚類算法
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
落實(shí)和擴(kuò)大高校辦學(xué)自主權(quán)
嚴(yán)控公立醫(yī)院規(guī)模過快擴(kuò)張
古丈县| 定襄县| 衡阳县| 南宫市| 古浪县| 瑞安市| 义马市| 额济纳旗| 青海省| 汪清县| 麻城市| 绵竹市| 东辽县| 兴文县| 台山市| 尼木县| 墨竹工卡县| 闸北区| 广灵县| 石泉县| 新宁县| 繁昌县| 都安| 湘乡市| 宣武区| 桐梓县| 河南省| 徐水县| 钟祥市| 镇安县| 东丰县| 兴宁市| 曲周县| 成武县| 都江堰市| 浦城县| 双峰县| 德昌县| 江川县| 阿坝县| 桐柏县|