黃 瑋, 冉啟斌
(1 南開(kāi)大學(xué) 漢語(yǔ)言文化學(xué)院, 天津300071; 2 南開(kāi)大學(xué) 文學(xué)院, 天津300071)
現(xiàn)在所用的動(dòng)物分類(lèi)系統(tǒng),大多是以動(dòng)物形態(tài)或解剖的相似性和差異性的總和為基礎(chǔ)的。 根據(jù)古生物學(xué)、比較胚胎學(xué)、比較解剖學(xué)上的許多證據(jù),基本上能反映動(dòng)物界的自然類(lèi)緣關(guān)系[1]。 在分類(lèi)特征的依據(jù)方面,迄今形態(tài)學(xué)特征尤其是外部形態(tài)仍然是最直觀和常用的依據(jù)。
從動(dòng)物聲音的角度出發(fā),對(duì)動(dòng)物進(jìn)行分類(lèi),有別于傳統(tǒng)的動(dòng)物分類(lèi)體系,可以豐富動(dòng)物分類(lèi)的依據(jù),讓動(dòng)物分類(lèi)體系更加立體化,幫助人類(lèi)從聽(tīng)覺(jué)角度建立對(duì)動(dòng)物世界的再認(rèn)識(shí),形成全新的認(rèn)知系統(tǒng)。從動(dòng)物聲學(xué)距離的角度出發(fā)對(duì)動(dòng)物進(jìn)行分類(lèi),能夠在一定程度上反映出動(dòng)物聲音的聲學(xué)特征,進(jìn)而揭示動(dòng)物聲音的發(fā)展規(guī)律、演變順序等信息,有助于對(duì)動(dòng)物演化過(guò)程的研究。
在動(dòng)物聲音的研究方面,早在1995 年Kurt 等就設(shè)計(jì)了一款基于特征提取算法的程序,對(duì)海洋哺乳動(dòng)物的聲音進(jìn)行識(shí)別和歸類(lèi)[2];Yuanfeng Ma 等(2008)使用短時(shí)傅里葉變換(STFT)、摩爾模型等方法,從時(shí)頻感知的角度對(duì)海洋哺乳動(dòng)物的聲音進(jìn)行分類(lèi)[3];Che Yong Yeo 等(2011)提出了基于動(dòng)物聲音模式識(shí)別的動(dòng)物識(shí)別和檢測(cè)系統(tǒng),該系統(tǒng)使用零交叉率(ZCR)、梅爾頻率倒譜系數(shù)(MFCC)和動(dòng)態(tài)時(shí)間規(guī)整(DTW)聯(lián)合算法,并用狗的聲音做出了檢驗(yàn)[4];Fernando 等(2017)使用平行識(shí)別模型和倍率分析對(duì)海洋哺乳動(dòng)物的聲音進(jìn)行了探測(cè)和分類(lèi)[5],該研究考慮到了每個(gè)物種發(fā)出的多種聲音,但研究只涉及墨西哥灣的11 種海洋哺乳動(dòng)物;Tuomas Oikarinen 等(2018)引入了端到端前饋卷積神經(jīng)網(wǎng)絡(luò)對(duì)圈養(yǎng)狨猴的呼叫聲的來(lái)源和類(lèi)型進(jìn)行了分類(lèi)[6];Na Lin 等(2018)提出了一種對(duì)動(dòng)物聲音信號(hào)進(jìn)行分類(lèi)的新方法,即基于稀疏表示法的時(shí)頻域方法,可以對(duì)重疊的動(dòng)物聲音進(jìn)行分類(lèi)[7]。 綜合來(lái)看,前人的研究著重于兩個(gè)方面,一是從聲音角度對(duì)動(dòng)物進(jìn)行識(shí)別和歸類(lèi),主要運(yùn)用于海洋哺乳動(dòng)物;二是對(duì)動(dòng)物聲音的類(lèi)型進(jìn)行探測(cè)和歸類(lèi),主要使用狗、狨猴等較為單一的物種進(jìn)行檢驗(yàn)。
DTW 算法已經(jīng)被廣泛地應(yīng)用到基于識(shí)別、距離計(jì)算、數(shù)據(jù)匹配的各個(gè)領(lǐng)域,最具代表性的是應(yīng)用在人類(lèi)語(yǔ)音識(shí)別領(lǐng)域。 呂軍等(2007)較早使用DTW算法對(duì)漢語(yǔ)學(xué)習(xí)者的發(fā)音進(jìn)行識(shí)別并進(jìn)行評(píng)價(jià)系統(tǒng)設(shè)計(jì)[8];鄒韜(2012)使用DTW 算法對(duì)漢語(yǔ)揚(yáng)州方言的識(shí)別進(jìn)行了研究和設(shè)計(jì)[9];王國(guó)林(2017)使用DTW 算法設(shè)計(jì)評(píng)價(jià)系統(tǒng)對(duì)我國(guó)中學(xué)生的英語(yǔ)發(fā)音進(jìn)行自動(dòng)評(píng)價(jià)[10];Hossein Hamooni 等(2016)通過(guò)基于DTW 的分類(lèi)來(lái)對(duì)音素序列進(jìn)行識(shí)別,進(jìn)而實(shí)現(xiàn)對(duì)話語(yǔ)的識(shí)別[11]。 由此可見(jiàn),DTW 算法運(yùn)用于聲音的研究皆有先例可循。
本文將基于DTW 算法,提出對(duì)動(dòng)物物種從聲學(xué)角度進(jìn)行分類(lèi),而非對(duì)某類(lèi)動(dòng)物進(jìn)行識(shí)別和歸類(lèi),或者對(duì)動(dòng)物的某種聲音進(jìn)行識(shí)別。
本研究對(duì)175 種動(dòng)物的聲音進(jìn)行分類(lèi),每種動(dòng)物擬使用3 條聲音,即研究對(duì)象為525 條動(dòng)物聲音。在補(bǔ)充實(shí)驗(yàn)中,又對(duì)其中43 種動(dòng)物的聲音進(jìn)行了分類(lèi),每種動(dòng)物的聲音增加到10 條,總計(jì)430 條聲音。
1.2.1 聲音參數(shù)
本研究中使用的聲音均下載自www.animalsounds.org 等8 個(gè)國(guó)外聲音網(wǎng)站,下載的聲音文件格式有.mp3、.aiff、.wav 等,采樣率有11 025 Hz、22 050 Hz 等,存儲(chǔ)位數(shù)有8 位、16 位、32 位等,有單聲道聲音和雙聲道聲音。 最終,本文使用Praat(Praat:doing phonetics by computer,簡(jiǎn)稱(chēng)Praat)將聲音文件統(tǒng)一為.wav 格式,將聲音采樣率統(tǒng)一為22 050 Hz,將存儲(chǔ)位數(shù)調(diào)整為16 位,將聲道設(shè)置為單聲道,進(jìn)行保存和實(shí)驗(yàn)。
1.2.2 聲音處理
本實(shí)驗(yàn)中用以剪切聲音的軟件是Praat,一款實(shí)現(xiàn)跨平臺(tái)多功能語(yǔ)音學(xué)實(shí)驗(yàn)的專(zhuān)業(yè)軟件,主要用于對(duì)數(shù)字化的聲音信號(hào)進(jìn)行分析、標(biāo)注、處理及合成等,同時(shí)輸出各類(lèi)語(yǔ)圖和文字報(bào)表。 在實(shí)驗(yàn)中,用Praat 分別將動(dòng)物的聲音打開(kāi),將滿(mǎn)足研究需要的聲音剪切出來(lái)并保存。
在剪切中遵循以下標(biāo)準(zhǔn):如果有較為明確的周期,則按一個(gè)周期剪切出聲音,例如布谷鳥(niǎo)的叫聲是“布谷布谷”,則剪切出“布谷”;沒(méi)有明確周期的,或者周期極短、聲音急促而連續(xù)的,則按1 秒的聲音長(zhǎng)度剪切。
1.3.1 動(dòng)態(tài)時(shí)間規(guī)整算法
日本學(xué)者 Itakura 提出的動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)算法是把時(shí)間規(guī)整和距離測(cè)度計(jì)算結(jié)合起來(lái)的一種非線性規(guī)整技術(shù),采用動(dòng)態(tài)規(guī)劃(Dynamic Programming,DP)思想將一個(gè)復(fù)雜的全局最優(yōu)化問(wèn)題轉(zhuǎn)化為許多局部最優(yōu)化問(wèn)題,一步一步進(jìn)行決策,尋找出一條最佳路徑。DTW 算法早期廣泛應(yīng)用于語(yǔ)音識(shí)別領(lǐng)域,尤其適用于對(duì)孤立點(diǎn)的匹配和識(shí)別,具有計(jì)算速度較快,結(jié)論直觀等優(yōu)點(diǎn)。 現(xiàn)在,DTW 算法被廣泛應(yīng)用于語(yǔ)音檢索[13]、漢語(yǔ)聲調(diào)識(shí)別[14]、漢語(yǔ)方言語(yǔ)音識(shí)別[7]、手寫(xiě)簽名識(shí)別[15]、手勢(shì)識(shí)別[16]、圖形識(shí)別[17]、空中目標(biāo)識(shí)別[18]、農(nóng)作物遙感影像識(shí)別及歸類(lèi)[19]、電波識(shí)別[20]等領(lǐng)域。
在本實(shí)驗(yàn)中,DTW 算法作為核心工具,主要用于計(jì)算各條聲音兩兩之間的聲學(xué)距離(即DTW 距離),這些聲學(xué)距離將用于系統(tǒng)聚類(lèi)分析。
1.3.2 系統(tǒng)聚類(lèi)分析
本實(shí)驗(yàn)使用的系統(tǒng)聚類(lèi)分析和主成分分析工具是SPSS,它是一款著名的數(shù)據(jù)統(tǒng)計(jì)與分析軟件,全稱(chēng)為Statistical Product and Service Solutions(統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案軟件) ,最初軟件全稱(chēng)為Statistical Package for the Social Sciences(社會(huì)科學(xué)統(tǒng)計(jì)軟件包),它涵蓋了數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等功能,其中統(tǒng)計(jì)分析又包含系統(tǒng)聚類(lèi)分析和主成分分析等功能。 本實(shí)驗(yàn)使用SPSS 將上述的聲學(xué)距離進(jìn)行系統(tǒng)聚類(lèi)分析,得出以聲學(xué)距離為基礎(chǔ)的譜系圖,該譜系圖作為以聲學(xué)距離為基礎(chǔ)進(jìn)行動(dòng)物分類(lèi)的直觀呈現(xiàn)。
1.3.3 其他實(shí)驗(yàn)工具及腳本
由于DTW 算法屬于一種計(jì)算思維,沒(méi)有具體的操作工具,本實(shí)驗(yàn)使用了承載DTW 算法的腳本來(lái)實(shí)現(xiàn)對(duì)聲學(xué)距離的計(jì)算。 在兩兩計(jì)算動(dòng)物聲音的聲學(xué)距離之前,需要將錄音名稱(chēng)修改為該動(dòng)物的名稱(chēng),由于逐個(gè)修改工作量大,容易出錯(cuò),本實(shí)驗(yàn)使用了重命名腳本來(lái)實(shí)現(xiàn),該腳本可以在幾秒鐘之內(nèi)將文件夾中的成百條錄音以上級(jí)文件夾的名稱(chēng)批量重命名,并將重命名之后的文件匯集到同一個(gè)文件夾之中。
使用距離計(jì)算腳本計(jì)算動(dòng)物間聲學(xué)距離后,距離文件以文本文檔格式保存,為了使其適用于SPSS的運(yùn)行方式,本實(shí)驗(yàn)使用了作者自己編寫(xiě)的制表工具sound2xls-full 將文本文檔轉(zhuǎn)存為Excel 表格。 該制表工具是基于Python 設(shè)計(jì)的應(yīng)用軟件,操作簡(jiǎn)單、實(shí)用高效,極大地簡(jiǎn)化了數(shù)據(jù)整理工作,保證了數(shù)據(jù)另存過(guò)程的準(zhǔn)確性。
由于客觀條件的限制,要保證有175 種動(dòng)物,而每種動(dòng)物的有效聲音只有3 條,聲音數(shù)量較少,對(duì)實(shí)驗(yàn)結(jié)果有一定的影響,為了驗(yàn)證本方法的科學(xué)性和可行性,做了一項(xiàng)補(bǔ)充實(shí)驗(yàn)。 補(bǔ)充實(shí)驗(yàn)中每種動(dòng)物采用10 條有效聲音。 經(jīng)過(guò)篩選,175 個(gè)物種中有43種能夠提取出10 條有效聲音。
通過(guò)計(jì)算和數(shù)據(jù)處理,得到175 種動(dòng)物的聚類(lèi)分析譜系圖,如圖1 所示。
圖1 是SPSS 生成的譜系圖,依據(jù)動(dòng)物之間距離的遠(yuǎn)近進(jìn)行分類(lèi)。 橫坐標(biāo)表示距離,該距離是將計(jì)算出的DTW 距離進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)換以后得到的,區(qū)間是0~25(左開(kāi)右閉區(qū)間,下同)。 當(dāng)從橫坐標(biāo)上取一個(gè)點(diǎn),從該點(diǎn)做一條垂直于橫軸的直線,該線與連接著動(dòng)物的水平線的交點(diǎn)數(shù)目,就是動(dòng)物被劃分出的類(lèi)別數(shù)量。 例如:當(dāng)距離取24 時(shí),有2 個(gè)交點(diǎn),則在這個(gè)距離上, 動(dòng)物被分為兩類(lèi), pewee 至chaffinch(指縱軸上由pewee 向下至chaffinch 范圍內(nèi)的所有動(dòng)物)為一類(lèi),dog 至lion 為一類(lèi);當(dāng)距離取20 時(shí),有3 個(gè)交點(diǎn),則在這個(gè)距離上,動(dòng)物被劃分為三類(lèi),pewee 至macaw 為一類(lèi),hamster 至chaffinch為一類(lèi),dog 至lion 為一類(lèi);當(dāng)距離取13 時(shí),有5 個(gè)交點(diǎn),則在這個(gè)距離上,動(dòng)物被劃分為五類(lèi),pewwee至hyena 為一類(lèi),alligator 至macaw 為一類(lèi),hamster至blackbird 為一類(lèi),chaffinch 單獨(dú)為一類(lèi),dog 至lion 為一類(lèi)。 另外,單從距離與動(dòng)物類(lèi)別的數(shù)量來(lái)看,當(dāng)距離為0~1 時(shí),動(dòng)物被劃分為175 類(lèi);距離為1~2 時(shí),劃分為102 類(lèi);距離為2 ~3 時(shí),劃分為47類(lèi);距離為3~4 時(shí)劃,分為25 類(lèi);距離為4~5 時(shí),劃分為19 類(lèi);距離為5~6 時(shí),劃分為13 類(lèi);距離為6~8 時(shí),劃分為9 類(lèi);距離為8~9 時(shí),劃分為8 類(lèi);距離為9~10 時(shí),劃分為7 類(lèi);距離為10 ~11 時(shí),劃分為6 類(lèi);距離為11~12 時(shí)劃分為14 類(lèi);距離為14 ~23時(shí)劃分為3 類(lèi);距離為23~25 時(shí)劃分為2 類(lèi)。
將圖1 所示的分類(lèi)結(jié)果與傳統(tǒng)動(dòng)物分類(lèi)方法進(jìn)行比較,發(fā)現(xiàn)有許多相吻合之處。 例如, blue jay 和crow 在距離大于1 時(shí),被劃分為一類(lèi),它們?cè)趥鹘y(tǒng)的動(dòng)物分類(lèi)上都是雀形目鴉科動(dòng)物;hamster 和mouse 在距離大于1 時(shí),被劃分為一類(lèi),它們都是嚙齒目鼠形亞目動(dòng)物;bobcat 和cheetah 在距離大于1時(shí),被劃分為一類(lèi),它們都是食肉目貓科動(dòng)物;tiger、cougar 和lion 在距離大于2 時(shí),被劃分為一類(lèi),它們都是食肉目貓科動(dòng)物;dog 和coyote 在距離大于3 時(shí),被劃分為一類(lèi),它們都是食肉目犬科犬屬動(dòng)物。
圖1 175 種動(dòng)物的分類(lèi)結(jié)果Fig. 1 Classification results of 175 species of animals
同時(shí),更多的是與傳統(tǒng)的動(dòng)物分類(lèi)方法相異的地方。 例如:polar bear(屬于哺乳綱)和alligator(屬于爬行綱) 在距離大于1 時(shí),被劃分為一類(lèi);hippopotamus(屬于鯨偶蹄目)和camel(屬于偶蹄目)在距離大于1 時(shí),被劃分在一類(lèi);elephant(屬于長(zhǎng)鼻目)和lemur(屬于靈長(zhǎng)目)在距離大于1 時(shí),被劃分在一類(lèi)。
圖2 顯示的是類(lèi)別數(shù)量與距離之間的對(duì)應(yīng)關(guān)系,以及相應(yīng)的變化趨勢(shì)。 可見(jiàn),距離區(qū)間與類(lèi)別數(shù)量成負(fù)相關(guān)關(guān)系,距離在0 ~6 區(qū)間時(shí),類(lèi)別數(shù)量的變化率較大,在6~25 區(qū)間時(shí),變化平緩。 在較小的距離內(nèi),類(lèi)別數(shù)量產(chǎn)生了較大的變化,說(shuō)明在動(dòng)物聲音之間的細(xì)微差異還是比較小。
圖2 175 種動(dòng)物的類(lèi)別數(shù)量與距離區(qū)間的關(guān)系Fig. 2 The relationship between the number of categories and the distance interval of 175 species of animals
通過(guò)重復(fù)主實(shí)驗(yàn)過(guò)程,對(duì)動(dòng)物聲音樣本進(jìn)行計(jì)算和數(shù)據(jù)處理之后,得到補(bǔ)充實(shí)驗(yàn)中43 種動(dòng)物的聚類(lèi)分析譜系圖。
如圖3 所示,當(dāng)距離為0 ~1 時(shí),動(dòng)物被劃分為43 類(lèi);距離為1 ~2 時(shí),劃分為39 類(lèi);距離為2 ~3時(shí),劃分為34 類(lèi);距離為3 ~4 時(shí),劃分為25 類(lèi);距離為4~5 時(shí),劃分為20 類(lèi);距離為5 ~6 時(shí),劃分為17 類(lèi);距離為6 ~7 時(shí),劃分為14 類(lèi);距離為7 ~8時(shí),劃分為10 類(lèi);距離為8~9 時(shí),劃分為8 類(lèi);距離為9~10 時(shí),劃分為7 類(lèi);距離為10 ~12 時(shí),劃分為6 類(lèi),距離為12~13 時(shí),劃分為5 類(lèi);距離為13 ~17時(shí),劃分為3 類(lèi);距離為17~25 時(shí),劃分為2 類(lèi)。
從傳統(tǒng)動(dòng)物分類(lèi)的角度對(duì)圖3 的結(jié)果進(jìn)行了分析,本次補(bǔ)充實(shí)驗(yàn)驗(yàn)證了本研究所用方法的科學(xué)性。首先,有證據(jù)顯示,在傳統(tǒng)分類(lèi)中屬于同一科的動(dòng)物,在研究中隨著聲音數(shù)目的增加,距離更近。 例如:jay 和blue jay 在距離大于5(主實(shí)驗(yàn)為11)時(shí)被劃分為同一類(lèi),它們都是雀形目鴉科動(dòng)物;dog 和wolf 在距離大于4(主實(shí)驗(yàn)為9)時(shí)被劃分為同一類(lèi),它們都是食肉目犬科犬屬動(dòng)物。 其次,雖然有的動(dòng)物之間的距離有所拉大,但是還在可以接受的范圍之內(nèi)。 例如:leopard 和jaguar 在距離大于3(主實(shí)驗(yàn)為2)時(shí)被劃分為同一類(lèi),它們都是食肉目貓科豹屬動(dòng)物;tiger 和lion 在距離大于3(主實(shí)驗(yàn)為2)時(shí)被劃分為同一類(lèi),它們都是食肉目貓科豹屬動(dòng)物;goat 和antelope 在距離大于6(主實(shí)驗(yàn)為3)時(shí)被劃分為同一類(lèi),它們都是偶蹄目??苿?dòng)物。 當(dāng)然,這是以傳統(tǒng)動(dòng)物分類(lèi)體系為參照做出的比較,因?yàn)槭菑穆曇艚嵌葘?duì)動(dòng)物進(jìn)行分類(lèi),與傳統(tǒng)分類(lèi)方法截然不同,但是目前尚無(wú)別的辦法。
圖3 43 種動(dòng)物的分類(lèi)結(jié)果Fig. 3 Classification results of 175 species of animals
圖4 顯示的是補(bǔ)充實(shí)驗(yàn)中動(dòng)物類(lèi)別數(shù)量與距離區(qū)間之間的關(guān)系,與主實(shí)驗(yàn)相比,本圖顯得較為平緩。 在距離較小的區(qū)間內(nèi),類(lèi)別數(shù)量沒(méi)有出現(xiàn)斷崖式的下跌,也反映出聲音內(nèi)部的特征距離比較大,這也可能是由于物種數(shù)量與主實(shí)驗(yàn)相比較少造成的。
圖4 43 種動(dòng)物的類(lèi)別數(shù)量與距離區(qū)間的關(guān)系Fig. 4 The relationship between the number of categories and the distance interval of 175 species of animals
統(tǒng)計(jì)了鳥(niǎo)類(lèi)在兩次實(shí)驗(yàn)中的區(qū)分率情況,發(fā)現(xiàn)補(bǔ)充實(shí)驗(yàn)?zāi)軌蚋玫貙ⅧB(niǎo)類(lèi)與其他動(dòng)物分開(kāi)。 在主實(shí)驗(yàn)中,鳥(niǎo)類(lèi)占總數(shù)的66.28%,當(dāng)只劃分為兩個(gè)大類(lèi)時(shí)(即距離大于23),鳥(niǎo)類(lèi)在第一類(lèi)中占比為75.52%,在第二類(lèi)中占比為25%;在補(bǔ)充實(shí)驗(yàn)中,鳥(niǎo)類(lèi)占總數(shù)的46.51%,只劃分為兩個(gè)大類(lèi)時(shí)(即距離大于17),鳥(niǎo)類(lèi)在第一類(lèi)中占比為72%,在第二類(lèi)中占比11.11%。 綜合來(lái)看,本研究能夠較好地將鳥(niǎo)類(lèi)和其他動(dòng)物區(qū)別開(kāi)來(lái),尤其是在補(bǔ)充實(shí)驗(yàn)中,第二類(lèi)里鳥(niǎo)類(lèi)的占比已經(jīng)非常少了。
本研究使用DTW 算法計(jì)算出動(dòng)物聲音之間的聲學(xué)距離,通過(guò)數(shù)據(jù)分析對(duì)動(dòng)物進(jìn)行聚類(lèi)分析,旨在探索一種新的動(dòng)物分類(lèi)維度和方法。 除了主實(shí)驗(yàn)外,還做了補(bǔ)充實(shí)驗(yàn)論證本方法的科學(xué)性。
在主實(shí)驗(yàn)中,當(dāng)距離區(qū)間在較小范圍內(nèi)(0 ~6)時(shí),類(lèi)別數(shù)量的變化較為劇烈,即當(dāng)距離尺度稍微放大,類(lèi)別數(shù)量就會(huì)大量減少,這說(shuō)明在動(dòng)物聲音之間的差別較小,對(duì)距離尺度的變化做出的反應(yīng)比較敏感。 在補(bǔ)充實(shí)驗(yàn)中,距離區(qū)間的變化與類(lèi)別數(shù)量的變化較為平緩,在較小距離區(qū)間也沒(méi)有出現(xiàn)類(lèi)別數(shù)量急劇變化的情況,這說(shuō)明動(dòng)物聲音之間的差別比較大,對(duì)距離尺度的變化做出的反應(yīng)比較遲鈍。 本文認(rèn)為,在主實(shí)驗(yàn)中,每種動(dòng)物只有3 條聲音,不能較好地反映該種動(dòng)物的聲音所具有的區(qū)別于其他動(dòng)物的特征,所以算法沒(méi)有能很好地捕捉到動(dòng)物聲音體現(xiàn)出的特征,進(jìn)而表現(xiàn)出類(lèi)別數(shù)量與距離之間較為敏感的對(duì)應(yīng);在補(bǔ)充實(shí)驗(yàn)中,每種動(dòng)物有10 條聲音,聲音數(shù)量的增加,更好地反映出每種動(dòng)物的聲音特征,使動(dòng)物之間的區(qū)別更加明顯,距離更大,因此在類(lèi)別數(shù)量與距離區(qū)間的對(duì)應(yīng)上,顯得不那么敏感;另外,本文認(rèn)為與動(dòng)物種類(lèi)的數(shù)量有關(guān),主實(shí)驗(yàn)中有175 種動(dòng)物,補(bǔ)充實(shí)驗(yàn)只有43 種動(dòng)物,因而在主實(shí)驗(yàn)中,由于基數(shù)較大,當(dāng)在較小的距離區(qū)間內(nèi)時(shí),類(lèi)別數(shù)量產(chǎn)生了大幅的變化;在補(bǔ)充實(shí)驗(yàn)中,動(dòng)物數(shù)量較少,類(lèi)別數(shù)量的變化范圍就會(huì)較小。 但是本質(zhì)上還是和動(dòng)物聲音特征的區(qū)別度有關(guān)。
聲音的物理特征包括音高、音強(qiáng)、音長(zhǎng)和音質(zhì)。其中音質(zhì)是聲音的基本屬性,由發(fā)音體、發(fā)音方法和共鳴器決定。 由于哺乳動(dòng)物和鳥(niǎo)類(lèi)在共鳴器上存在較大的差別,所以有理由相信在很大程度上,鳥(niǎo)類(lèi)聲音會(huì)與其他動(dòng)物的聲音有較大差別。 實(shí)驗(yàn)結(jié)果驗(yàn)證了這一猜想,在主實(shí)驗(yàn)和補(bǔ)充實(shí)驗(yàn)中,鳥(niǎo)類(lèi)聲音大體上都能與其他動(dòng)物的聲音區(qū)別開(kāi)來(lái),并且在補(bǔ)充實(shí)驗(yàn)中這一現(xiàn)象更加明顯。 另外,實(shí)驗(yàn)結(jié)果中對(duì)鳥(niǎo)類(lèi)的劃分與傳統(tǒng)動(dòng)物分類(lèi)體系的劃分相差較大,有很多鳥(niǎo)類(lèi)不是同一科,甚至不是同一目,會(huì)在很小的距離內(nèi)被劃分到一起。 相比之下,屬于同一目或同一科的哺乳動(dòng)物,尤其是貓科和犬科動(dòng)物,在音質(zhì)上統(tǒng)一性更好,所以被劃分到一起的幾率更大。 這也說(shuō)明,基于形態(tài)學(xué)方法對(duì)動(dòng)物的劃分,存在聲音維度上的欠缺。
本研究使用的DTW 算法是將動(dòng)物聲音的頻率(單位:Hz)轉(zhuǎn)化為梅爾刻度(Mel scale,單位:Mel)計(jì)算的。 Mel 與Hz 是心理-聲學(xué)相關(guān)的等價(jià)單位,它體現(xiàn)的是人耳對(duì)聲音的感知,這種感知與聲音的客觀頻率Hz 是非線性對(duì)應(yīng)關(guān)系[21]。 在研究中使用梅爾刻度,是立足于從人類(lèi)聽(tīng)覺(jué)感知的角度對(duì)動(dòng)物進(jìn)行分類(lèi)。
另外,王士元(1998)曾提出人類(lèi)學(xué)、遺傳學(xué)和語(yǔ)言學(xué)是一種綜合體,考古、遺傳和語(yǔ)言是了解人類(lèi)過(guò)去歷史的3 個(gè)窗口[22],語(yǔ)言的演化能反映人類(lèi)的發(fā)展。 本文認(rèn)為,從聲學(xué)意義上,動(dòng)物的聲音蘊(yùn)含著動(dòng)物的特征,動(dòng)物聲音的演化也能反映動(dòng)物的演化,動(dòng)物之間聲音的關(guān)系在一定程度上也能揭示動(dòng)物之間的關(guān)系。 在以后的研究中,應(yīng)該探究距離數(shù)據(jù)所代表的聲音特征,探索其中的聯(lián)系和規(guī)律。
由于傳統(tǒng)的動(dòng)物分類(lèi)體系幾乎不考慮動(dòng)物的聲音,目前沒(méi)有與本研究類(lèi)似的從動(dòng)物聲音角度對(duì)動(dòng)物進(jìn)行分類(lèi)的研究結(jié)果可供對(duì)比,所以在接下來(lái)的研究中應(yīng)該彌補(bǔ)不足,進(jìn)一步驗(yàn)證研究方法的科學(xué)性,深入挖掘研究的意義。
由于客觀條件的限制,主實(shí)驗(yàn)中涉及175 種動(dòng)物,每種動(dòng)物只有3 條聲音,樣本數(shù)量較少。 通過(guò)補(bǔ)充實(shí)驗(yàn)發(fā)現(xiàn),通過(guò)增加聲音樣本的數(shù)量,會(huì)使分類(lèi)結(jié)果更科學(xué)。 但是,補(bǔ)充實(shí)驗(yàn)中只涉及了43 種動(dòng)物,動(dòng)物的物種數(shù)量過(guò)少。 在接下來(lái)的研究中,應(yīng)該在增加物種數(shù)量的同時(shí),增加每種動(dòng)物的聲音數(shù)量。另外,對(duì)于沒(méi)有聲音和聲音較小的物種,比如魚(yú)類(lèi)和小型昆蟲(chóng),沒(méi)有辦法進(jìn)行分類(lèi)。
研究中使用的聲音材料下載自不同的網(wǎng)站,聲音質(zhì)量不統(tǒng)一,可能會(huì)對(duì)研究結(jié)果造成影響。 目前缺少高質(zhì)量、廣博齊全的動(dòng)物聲音數(shù)據(jù)庫(kù),所以這個(gè)問(wèn)題還沒(méi)有辦法很好的解決,只能在篩選聲音的時(shí)候更加仔細(xì)。
附錄一動(dòng)物聲音網(wǎng)站
http:/ /www.animal-sounds.org.
https:/ /www.seaworld.org/animals/sounds.
http:/ /www.findsounds.com/animals.html.
http:/ /www.animalsoundarchive.org.
https:/ /www.naturebits.org.
https:/ /www.freesound.org.
http:/ /www.grsites.com/archive/sounds.
https:/ /www.freesoundeffects.com.