華燦城,程 驊,余躍生,陸玉炯,楊小軍
(黔南民族醫(yī)學(xué)高等??茖W(xué)校,貴州都勻558013)
布依族、侗族、仡佬族、水族、毛南族、仫佬族、壯族、傣族和黎族同屬漢藏語系壯侗語族民族,與我國古代南方“百越”族系有著密切關(guān)系?!鞍僭健敝捣倍?,諸如于越、揚(yáng)越、南越、閩越、駱越、東甌、山越、滇越、西甌等。由于歷史上的民族遷徙、分化、融合等事件,居住在南方不同地區(qū)的越人,逐漸形成現(xiàn)今壯侗語族各民族[1]。目前,壯侗語族民族群體的文化人類學(xué)、體質(zhì)人類學(xué)和群體遺傳學(xué)等領(lǐng)域的調(diào)查研究較多[2-5],但有關(guān)膚紋特征的模糊聚類分析的報(bào)道鮮見。
膚紋是人類外露的生物學(xué)特征,因其性狀穩(wěn)定,終身不變,每人各異,無一雷同,而備受群體遺傳學(xué)、體質(zhì)人類學(xué)、臨床醫(yī)學(xué)、法醫(yī)學(xué)等研究廣泛關(guān)注,尤其是在當(dāng)今大數(shù)據(jù)時(shí)代,膚紋學(xué)的重要性日益凸顯。膚紋特征不僅存在個(gè)體差異,而且在不同民族或同一民族不同群體之間也有所不同,表現(xiàn)出生物遺傳性狀的多態(tài)性和民族體質(zhì)特征的多樣性,可以通過不同人群膚紋參數(shù)的多元分析來了解彼此間的親緣關(guān)系[6-7]。為此,本文應(yīng)用模糊數(shù)學(xué)方法,對(duì)我國壯侗語族10個(gè)民族群體的11項(xiàng)膚紋參數(shù)進(jìn)行聚類分析,從群體遺傳學(xué)角度探討民族群體間的淵源關(guān)系。結(jié)果報(bào)道如下。
1.1 材料 我國壯侗語族10個(gè)民族群體的指紋脊線總數(shù)(TFRC)、a-b脊線數(shù)(a-bRC)、弓型頻率(A)、尺箕型頻率(Lu)、撓箕型頻率(Lr)、斗型頻率(W),以及大魚際與第1指間區(qū)(T/I)、指間區(qū)Ⅱ、Ⅲ、Ⅳ、小魚際區(qū)(H)出現(xiàn)率共6大類的11項(xiàng)膚紋參數(shù)來自《中國民族膚紋學(xué)》[8]。見表1。
表1 我國壯侗語族10個(gè)民族群體的11項(xiàng)膚紋參數(shù)
1.2 模糊聚類分析法 該方法主要步驟簡化為[9-10]:(一)建立同趨勢化的原始數(shù)據(jù)矩陣。(二)數(shù)據(jù)標(biāo)準(zhǔn)化。由于各指標(biāo)的度量衡單位不同,往往會(huì)影響分析結(jié)果,需將數(shù)據(jù)進(jìn)行無綱量化處理,使指標(biāo)之間具有可比性。本文采用離差標(biāo)準(zhǔn)化,計(jì)算公式:u=(x-min)(max-min)-1。(三)建立模糊關(guān)系矩陣。根據(jù)標(biāo)準(zhǔn)化數(shù)據(jù),采用SPSS歐氏距離法構(gòu)建各民族群體之間的模糊關(guān)系矩陣。(四)選擇動(dòng)態(tài)直接聚類法。聚類步驟簡述為:(1)在距離矩陣D中找出D 的基元,共有n-1。①找出雙重主元,并記下該主元及其足碼集。假設(shè)有P個(gè)雙重主元。②找出單重主元,同樣記下該主元及其足碼集,并與雙重主元的足碼集進(jìn)行填充變換。單重主元應(yīng)有n-2P個(gè)。③找出連接元。在除去雙重主元和單重主元后的其他元素中,依次從小到大找出連接元,應(yīng)有P-1個(gè)。(2)繪制動(dòng)態(tài)聚類圖。
2.1 數(shù)據(jù)標(biāo)準(zhǔn)化 因膚紋參數(shù)不存在高優(yōu)或低優(yōu)現(xiàn)象,所以對(duì)其原始數(shù)據(jù)不需進(jìn)行同趨勢化。但膚紋參數(shù)的單位不盡相同,則需進(jìn)行標(biāo)準(zhǔn)化處理,使各指標(biāo)數(shù)據(jù)轉(zhuǎn)換在[0,1]之間。結(jié)果見表2。
表2 我國壯侗語族10個(gè)民族群體的11項(xiàng)膚紋參數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)
2.2 模糊關(guān)系矩陣 使用SPSS18.0統(tǒng)計(jì)軟件計(jì)算我國壯侗語族各民族群體膚紋特征之間的歐氏距離。結(jié)果見表3。
表3 我國壯侗語族10個(gè)民族群體膚紋特征間的歐氏距離
2.3 動(dòng)態(tài)直接聚類 從表3中可得D的雙重主元有:2.518=D10,5,2.541=D8,7,3.163=D4,1
單重主元有:3.221=D2,1,3.397=D8,6,3.533=D3,1,4.396=D9,2
連接元有:3.812=D10,2,3.926=D8,5
由此可見,D的基元為:
數(shù)值:2.518 2.541 3.163 3.221 3.397 3.533 3.812 3.926 4.396
足碼:{10,5} {8,7}{4,1}{2,1}{8,6}{3,1}{10,2} {8,5}{9,2}
于是,易得D的動(dòng)態(tài)聚類圖(見圖1)。
圖1 我國壯侗語族10個(gè)民族群體動(dòng)態(tài)聚類圖
由表3可知,廣西侗族與海南黎族的歐氏距離最小(2.518),遺傳關(guān)系最近,其次為廣西壯族與廣西仫佬族(2.541),云南傣族與貴州水族的歐氏距離最大(6.283),遺傳關(guān)系最遠(yuǎn)。但僅從民族群體間歐氏距離分析,只能看出兩個(gè)民族群體間遺傳距離的遠(yuǎn)近,難以了解壯侗語族10個(gè)民族群體間遺傳距離的分布特征。有學(xué)者[7,11]采用普通聚類分析法對(duì)群體進(jìn)行分類,來探討民族群體的體質(zhì)特征間的遺傳關(guān)系。但該方法使用的前提條件是類別間的界限清晰,分類集合中的任意二個(gè)元素要么等價(jià),要么不等價(jià)。事實(shí)上,民族群體之間的遺傳關(guān)系往往是不清晰的,更多的是模糊關(guān)系,所以用普通聚類分析難以對(duì)模糊關(guān)系的群體進(jìn)行合理分類。因此,本文應(yīng)用模糊數(shù)學(xué)方法,對(duì)壯侗語族民族群體膚紋特征的遺傳關(guān)系進(jìn)行聚類分析。該方法的基本思想是:某一事物并不是要么“屬于”某類,要么“不屬于”某類,而是在不同程度上“屬于”某一類。由于民族群體膚紋特征的分類往往伴隨著模糊性,即“亦此亦彼”性,把模糊數(shù)學(xué)方法引入聚類分析,可使民族群體分類結(jié)果更符合實(shí)際。
從圖1中可以看出,當(dāng)3.533 ≤λ<3.812 時(shí),置信度是最佳分類水平,我國壯侗語族10個(gè)民族群體聚為四類:貴州仡佬族、侗族、布依族和水族聚為Ⅰ類,海南黎族和廣西侗族聚為Ⅱ類,廣西壯族、仫佬族和毛南族聚為Ⅲ類,云南傣族獨(dú)為Ⅳ類。由表3可得,Ⅱ類民族群體間的遺傳關(guān)系較近(D=2.518),Ⅰ類和Ⅲ類民族群體間次之(D平均值分別為3.820和3.368)。從四類民族群體之間的遺傳距離看,Ⅱ類與Ⅰ類、Ⅲ類民族群體間的遺傳關(guān)系較近(D平均值分別為4.331和4.369),與Ⅳ類民族群體間次之(D平均值為4.959),Ⅰ類與Ⅲ類、Ⅳ類,Ⅲ類與Ⅳ類民族群體間的遺傳關(guān)系較遠(yuǎn)(D平均值分別為5.314、5.436和5.104)。貴州侗族與廣西侗族之間的遺傳距離較遠(yuǎn)(D=4.563),分別聚在Ⅰ類和Ⅱ類(圖1)。但是,貴州侗族除與貴州仡佬族、布依族和水族遺傳距離較近外(D平均值為3.423),與海南黎族的遺傳距離也較近(D=3.812),相似于廣西侗族與海南黎族的遺傳關(guān)系。可見,貴州侗族與廣西侗族的膚紋特征既存在地域差異性,又具有本民族的許多共性。聚類結(jié)果提示:(1)壯侗語族民族群體膚紋特征具有一定的地域性,與他們居住的地理距離呈平行關(guān)系,分布距離靠近的民族群體的遺傳關(guān)系較近;(2)不同地域的同一民族群體的膚紋特征具有豐富的多樣性。有待民族學(xué)、體質(zhì)人類學(xué)、群體遺傳學(xué)等領(lǐng)域進(jìn)一步研究驗(yàn)證。