鐘純懌,張俊波,2,楊振昊,季舒恒,萬榮,2,3*
( 1.上海海洋大學(xué) 海洋科學(xué)學(xué)院,上海 201306;2.國家遠(yuǎn)洋漁業(yè)工程技術(shù)研究中心,上海 201306;3.國家遠(yuǎn)洋漁業(yè)工程技術(shù)研究中心舟山分中心,浙江 舟山 316014)
在我國漁業(yè)現(xiàn)代化進(jìn)程不斷加快,漁業(yè)科技迅猛發(fā)展的形勢下,漁業(yè)裝備已廣泛應(yīng)用于捕撈與養(yǎng)殖業(yè)[1]。長期在水中作業(yè)的漁業(yè)裝備,常被營固著生活的水生動植物附著,如藤壺類、附著型貝類、藻類等。這些水生生物的分泌物以及死后的殘留物對漁業(yè)裝備性能產(chǎn)生較大的負(fù)面影響[2-5]。水體流速是影響固著型水生生物能否成功附著在漁業(yè)裝備上的重要環(huán)境因素,例如,流速的變化會改變藻類新陳代謝過程,制約藤壺類與附著型貝類幼蟲大面積擴(kuò)散[2,6-7]。聲學(xué)多普勒流速儀(Acoustic Doppler Velocimetry,ADV)是測量水流速度的主要儀器[8],根據(jù)聲學(xué)多普勒移頻效應(yīng)原理,利用超聲波探測水流速度,實現(xiàn)流體三維的瞬時速度、湍流特性和功率譜密度[9]測量,被廣泛應(yīng)用于野外和實驗室水動力學(xué)實驗中。相關(guān)系數(shù)和信噪比是影響ADV測量準(zhǔn)確度的重要參數(shù)[10]。野外監(jiān)測中常遇到水體產(chǎn)生浪花與氣泡(例如,海浪、池塘水體中增氧器的使用)、水底表層出現(xiàn)再懸浮顆粒物(例如,在近海水動力環(huán)境紊亂區(qū)及生物擾動、人類活動的影響)等情況,會影響ADV測量的相關(guān)系數(shù),降低信噪比,導(dǎo)致監(jiān)測的流速數(shù)據(jù)中出現(xiàn)大量野點[11-12],即產(chǎn)生與真實值差異較大的值。因此,進(jìn)行多普勒流速儀數(shù)據(jù)后置處理,對提高流速數(shù)據(jù)準(zhǔn)確度有著重要的意義。
目前,國內(nèi)外用于多普勒流速儀后置處理的算法主要有小波閾值法[13]、穩(wěn)健估算法[14]、三維相空間法[11]等。其中穩(wěn)健估算法和三維相空間法是數(shù)據(jù)后置處理算法中最重要的兩個方法[15]。穩(wěn)健估算法通過估算定位值和尺度估算值標(biāo)準(zhǔn)化樣本數(shù)據(jù),對比所設(shè)定的最小通過值進(jìn)行野點檢測;三維相空間法則是基于樣本平均值和標(biāo)準(zhǔn)偏差,采用迭代計算模式檢測野點[11]。然而,目前關(guān)于定量化評估兩種算法檢測效果的研究還尚未見報道。
本文以ADV實測流速數(shù)據(jù)為例,基于穩(wěn)健估算法與三維相空間法進(jìn)行數(shù)據(jù)后置處理,對比分析兩種方法的峰度系數(shù)與偏斜系數(shù),評估檢測效果,以期為準(zhǔn)確定量研究水流對漁業(yè)裝備附著生物的附著量與種類影響等內(nèi)容提供準(zhǔn)確的流速數(shù)據(jù)。
本研究使用的流速數(shù)據(jù)來自于上海市寶山區(qū)中華絨螯蟹養(yǎng)殖池塘(以下簡稱蟹塘),蟹塘內(nèi)設(shè)有微孔充氧系統(tǒng),間隔5 m均勻分布于塘底,由于曝氣而出現(xiàn)氣泡以及引起塘底顆粒物再懸浮,會對多普勒流速儀產(chǎn)生干擾,導(dǎo)致研究塘內(nèi)漁業(yè)裝備生物附著的流速測量不準(zhǔn)確。池塘面積為15 480 m2,長為180 m,寬為86 m,水深范圍為1~1.5 m。流速監(jiān)測站點A(圖1)位于蟹塘右下方,距最近岸邊距離10 m,附近設(shè)有1個微孔充氧器。流速監(jiān)測設(shè)備為聲學(xué)多普勒流速儀(VECTOR,NORTEK Inc.,Normay ),采樣頻率為 1 Hz。測量深度為水面下30 cm以及離底20 cm,測量時間分別為2 min和70 min。
圖1 研究區(qū)域與流速監(jiān)測站點Fig.1 Study area and velocity monitoring site
2.2.1 穩(wěn)健估算法
該方法最初由Rousseeuw[14]開發(fā),利用估算定位值和尺度估算值標(biāo)準(zhǔn)化樣本數(shù)據(jù),通過標(biāo)準(zhǔn)化后的數(shù)據(jù)與所設(shè)定的檢測閾值進(jìn)行比較,檢測閾值外的點為野點。穩(wěn)健估算法的計算公式為
式中,M為估算定位值(單位:m/s);n為速度數(shù)據(jù)點的數(shù)量;u為水流速度數(shù)據(jù)(單位:m/s);S為尺度估算值(單位:m/s);e為估計器系數(shù)(1.483);Zi為標(biāo)準(zhǔn)化觀測值;Oi為野點判斷值;c為截止值(2.5)。如果Oi的值大于0,則確定為野點并刪除。通常對野點前兩個數(shù)據(jù)進(jìn)行外推法計算,獲得的新數(shù)據(jù)作為替換值代替被刪除的野點。
2.2.2 三維相空間法
三維相空間法最初由Nikora和Goring[16]開發(fā),并由Wahl[17]進(jìn)行了改進(jìn)。該方法通過全局閾值將流速數(shù)據(jù)與其導(dǎo)數(shù)構(gòu)筑成橢球體,位于橢球體外的點被視為野點,采用迭代的方式不斷收縮全局閾值以進(jìn)一步檢測野點。三維相空間法的計算公式為
式中,U為水流速度的平均值(單位:m/s);n為速度數(shù)據(jù)點的數(shù)量;u為水流速度數(shù)據(jù)(單位:m/s);ui′為脈動速 度 (單 位 : m/s) ; Δui′為 速 度 的 一 階 導(dǎo) 數(shù) (單位:m/s),為其平均數(shù);Δ2ui′為速度的二階導(dǎo)數(shù)(單位:m/s),為其平均數(shù);σ為波動速度的標(biāo)準(zhǔn)偏差;λ為通用閾值;θ為主軸的旋轉(zhuǎn)角度(rad),由于對稱性,Δui′與ui′以及 Δ2ui′與 Δui′的旋轉(zhuǎn)角度為 0。由公式(12)和公式(13)構(gòu)筑橢球體,位于橢球體外的點為野點,被刪除的野點通常使用三階樣條式插值法進(jìn)行插值。
主要采用標(biāo)準(zhǔn)偏差、峰度系數(shù)、偏斜系數(shù)等指標(biāo)統(tǒng)計分析數(shù)據(jù)處理結(jié)果[18-19]。其中,峰度系數(shù)是表征概率密度分布曲線在平均值處峰值高低的特征數(shù)。峰度系數(shù)高說明數(shù)據(jù)存在大于或小于平均值的極端差值。偏度系數(shù)是表征概率分布密度曲線相對于平均值不對稱程度的特征數(shù)。計算公式為
式中,kur為峰度系數(shù);skew為偏斜系數(shù)。
水面下30 cm處流速監(jiān)測數(shù)據(jù)如圖2所示。圖3為穩(wěn)健估算法檢測結(jié)果圖,虛線為標(biāo)準(zhǔn)化觀測值Zi,高于Zi的數(shù)據(jù)被判斷為野點。穩(wěn)健估算法在3個速度分量的流速數(shù)據(jù)中檢測出野點個數(shù)分別為7個、6個、5個,檢出率為5.76%、4.96%、4.13%。三維相空間法檢測結(jié)果如圖4所示,檢測出野點個數(shù)分別為18個、12個、23個,檢出率 14.88%、9.92%、19.01%。表1為水面下30 cm處數(shù)據(jù)及經(jīng)兩種方法處理后數(shù)據(jù)的統(tǒng)計參數(shù)值,原始數(shù)據(jù)的峰度系數(shù)分別約為16.91、27.14、23.12。經(jīng)穩(wěn)健估算法處理后峰度系數(shù)平均下降77.71%,速度分量v峰度系數(shù)較高,約為7.71,降幅為71.58%。經(jīng)三維相空間法處理后峰度系數(shù)平均下降84.05%,速度分量w峰度系數(shù)較高,約為6.11,降幅為73.59%。經(jīng)兩種方法處理后偏斜系數(shù)較原始數(shù)據(jù)偏斜系數(shù)均降低。
圖2 站點A水面下30 cm處流速數(shù)據(jù)Fig.2 Flow velocity data at 30 cm below the water surface at Station A
表1 站點A水面下30 cm處流速數(shù)據(jù)統(tǒng)計參數(shù)值Table 1 Statistical parameter values of flow velocity data at 30 cm below the surface of Station A
圖3 站點 A 水面下 30 cm 處穩(wěn)健估算法檢測結(jié)果Fig.3 The detection results of the robust estimation method at 30 cm below the water surface of Station A
圖4 站點 A 水面下 30 cm 處三維相空間法檢測結(jié)果Fig.4 The detection results of the three-dimensional phase space thresholding method at 30 cm below the water surface of Station A
離底20 cm處數(shù)據(jù)及處理結(jié)果如圖5所示。穩(wěn)健估算法在3個速度分量流速數(shù)據(jù)中檢測出野點個數(shù)分別為:52個、45個、167個,檢出率為1.62%、1.36%、3.95%。三維相空間法檢測出野點數(shù)分別為68個、57個、166個,檢出率1.24%、1.07%、3.92%。表2為站點A離底20 cm處數(shù)據(jù)統(tǒng)計參數(shù)值。原始數(shù)據(jù)3個速度分量的峰度系數(shù)分別約為28.52、18.55、18.83。兩種方法處理后數(shù)據(jù)峰度系數(shù)平均降幅均高于80%,分別為81.45%、84.07%。穩(wěn)健估算法與三維相空間法在速度分量w數(shù)據(jù)的峰度系數(shù)降幅分別為79.72%和73.63%。原始數(shù)據(jù)3個速度分量偏斜系數(shù)分別約為0.54、0.10、0.13。穩(wěn)健估算法和三維相空間法在速度分量v的偏斜系數(shù)均升高,分別上升50.01%和65.09%。
表2 站點A離底20 cm處流速數(shù)據(jù)統(tǒng)計參數(shù)值Table 2 Statistical parameter values of flow velocity data at 20 cm above the bottom of Station A
圖5 站點A離底20 cm處數(shù)據(jù)處理效果對比Fig.5 Comparison of data processing effects at 20 cm above the bottom of Station A
由水下30 cm數(shù)據(jù)處理結(jié)果可見,三維相空間法檢測出野點數(shù)顯著多于穩(wěn)健估算法,在3個速度分量的檢出率分別高于穩(wěn)健估算法9.12%、4.96%、14.88%。對于離底20 cm處的數(shù)據(jù),穩(wěn)健估算法檢測出野點多于三維相空間法,但在3個速度分量的檢出率僅高于三維相空間法0.38%、0.29%、0.03%。三維相空間法檢測率較低的主要原因是三維相空間法檢測閾值的計算基于平均值和標(biāo)準(zhǔn)偏差,兩者對野點值非常敏感,數(shù)據(jù)中野點超過5%時,野點的存在會顯著影響兩個參數(shù)的性能,導(dǎo)致檢測閾值增大,野點被視為有效數(shù)據(jù)而未被剔除[17]。離底20 cm處的數(shù)據(jù)中野點含量高于7%,因此對三維相空間法的檢測精度存在影響。這一問題可以通過迭代的方法改善,但在迭代過程中位于野點周圍速度數(shù)據(jù)的一階導(dǎo)數(shù) Δv和二階導(dǎo)數(shù) Δ2v可能超出閾值橢球邊界值,將野點附近部分真實數(shù)據(jù)判斷為野點[20],出現(xiàn)過處理情況。
經(jīng)兩種方法處理后數(shù)據(jù)和原始數(shù)據(jù)的峰度系數(shù)對比發(fā)現(xiàn),三維相空間峰度系數(shù)降幅均高于穩(wěn)健估算法。在離底20 cm處測量的流速數(shù)據(jù)中,穩(wěn)健估算法與三維相空間法峰度系數(shù)在速度分量w均較高,但穩(wěn)健估算法峰度系數(shù)低于三維相空間法。這是因為穩(wěn)健估算法是基于樣本的中位數(shù)和絕對偏差,不受平均值和標(biāo)準(zhǔn)偏差影響,只能有效檢測出與樣本平均值差異較大的野點,而速度分量w流速數(shù)據(jù)中的野點距離平均值較近。因此,穩(wěn)健估算法無法有效檢測這些野點,從而導(dǎo)致速度分量w數(shù)據(jù)的峰度系數(shù)較高。三維相空間法速度分量w流速數(shù)據(jù)峰度系數(shù)較高的主要原因是速度分量w流速數(shù)據(jù)中野點含量顯著多于速度分量u、v,三維相空間法檢測精度會隨污染程度增加而下降[21-22]。因此,速度分量w數(shù)據(jù)中部分野點未被有效剔除,從而導(dǎo)致速度分量w數(shù)據(jù)峰度系數(shù)偏高。
以速度分量v流速數(shù)據(jù)為例,穩(wěn)健估算法與三維相空間法處理后偏斜系數(shù)均升高,分別為0.16和0.17。兩種方法對于污染數(shù)據(jù)偏度的處理均與污染程度無關(guān)。穩(wěn)健估算法僅計算關(guān)于位置估計量的對稱統(tǒng)計量,不處理偏度[23]。偏斜系數(shù)升高可能是由于插值法產(chǎn)生的新數(shù)據(jù)值導(dǎo)致數(shù)據(jù)右偏。
綜上所述,三維相空間法綜合檢測效果優(yōu)于穩(wěn)健估算法。當(dāng)野點含量低于5%時,野點對三維相空間法檢測閾值的影響較小,三維相空間法通過迭代不斷收縮檢測閾值,能夠檢測出更多與真實數(shù)據(jù)相近的野點,檢測精度更高。但該方法的局限性是當(dāng)野點含量高于5%時,其檢測精度降低,且存在過處理現(xiàn)象。穩(wěn)健估算法能有效檢測出與樣本平均值差異較大的野點,但該方法不進(jìn)行迭代,僅檢測1次,因此無法有效檢測出與真實數(shù)據(jù)相近的野點。
本文以實測流速數(shù)據(jù)為例,通過定量化評估了穩(wěn)健估算法與三維相空間法的檢測效果。對比分析了兩種方法的峰度系數(shù)與偏斜系數(shù),結(jié)果表明,三維相空間法處理效果較好,其檢測準(zhǔn)確性高于穩(wěn)健估算法,但存在過處理現(xiàn)象。本研究對降低流速數(shù)據(jù)誤差,準(zhǔn)確定量研究水流對漁業(yè)裝備附著生物的附著量與種類影響有著重要的意義,也為后續(xù)開發(fā)一種檢測精度高且過處理現(xiàn)象少的后置處理算法提供了科學(xué)的參考。