羅一迪,蔣 華,王慧嬌,王 鑫
桂林電子科技大學(xué) 計(jì)算機(jī)與信息安全學(xué)院,廣西 桂林 541004
Argo是第一個實(shí)時的、高分辨率的全球立體海洋觀測網(wǎng),因其活躍性和規(guī)模,可以說是海洋觀測史上的一場革命[1]。自2000年實(shí)施以來,所獲得的溫度、鹽度剖面數(shù)據(jù)量比過去100年收集的總量還多。但是Argo浮標(biāo)易受到環(huán)境的影響,尤其是測量鹽度的傳感器,容易受到生物污染、生物殺傷劑泄露等原因的影響,造成鹽度測量產(chǎn)生誤差。而且由于Argo浮標(biāo)自身的隨機(jī)性和拋棄性,海洋工作者們很難對其傳感器進(jìn)行校正,也很難確定傳感器產(chǎn)生誤差的原因,所以很有可能出現(xiàn)數(shù),其中V2表示待測數(shù)值,V1、V3表示與V2相鄰的上下兩個剖面點(diǎn)數(shù)據(jù)。若測試鹽度,則當(dāng)壓強(qiáng)<500 dbar時,檢測值超過0.9 PSU,或者當(dāng)壓強(qiáng)≥500 dbar時,檢測值超過0.3 PSU,則待測值據(jù)誤差或錯誤。為了進(jìn)一步服務(wù)于科研和其他社會應(yīng)用,需要對于數(shù)據(jù)的質(zhì)量精度有一定的保證,所以Argo剖面數(shù)據(jù)的異常檢測就顯得尤為重要。
關(guān)于Argo剖面數(shù)據(jù)的異常檢測,有大量的學(xué)者做了研究工作。文獻(xiàn)[2]提出了一種利用傳統(tǒng)閾值剔除異常數(shù)據(jù)的方法,其所要求的剖面計(jì)算公式為:檢測值=標(biāo)記為異常。可以看出,該方法只是針對單一剖面數(shù)據(jù)進(jìn)行異常檢測,并且沒有考慮采樣點(diǎn)檢測深度間隔的變化。文獻(xiàn)[3]采用“三倍標(biāo)準(zhǔn)差”與傳統(tǒng)閾值判斷相結(jié)合的方法實(shí)現(xiàn)對Argo剖面數(shù)據(jù)的異常檢測,該方法結(jié)合了鄰近剖面數(shù)據(jù),彌補(bǔ)了傳統(tǒng)閾值判定方法的不足,但是該方法采用的是全局靜態(tài)閾值,當(dāng)閾值設(shè)置不合適時可能造成某些異常剖面點(diǎn)的誤判或者漏判。文獻(xiàn)[4]將多年的歷史溫鹽觀測數(shù)據(jù)(南森站和CTD資料)通過最小二乘法擬合得到某地區(qū)的溫鹽關(guān)系模型,并利用該模型對Argo剖面數(shù)據(jù)進(jìn)行質(zhì)量控制。但是由于溫鹽數(shù)據(jù)的非線性的特點(diǎn),采用最小二乘法無法很好地提取出數(shù)據(jù)特征,因此獲得的溫鹽關(guān)系模型精確度不高,導(dǎo)致異常檢測的可靠性也不高。因此,如何對于Argo剖面數(shù)據(jù)進(jìn)行有效的異常檢測,并且保證較高的精確度和可靠性,是一個重要的研究問題。
異常檢測[5](Anomaly Detection)就是識別出與歷史或者預(yù)期模式有顯著差別的過程,異常數(shù)據(jù)可能由于傳感器采集錯誤或者數(shù)據(jù)傳輸?shù)仍虍a(chǎn)生。對于異常檢測,國內(nèi)外學(xué)者已經(jīng)做了大量的研究。文獻(xiàn)[6]利用滑動窗口劃分畜禽物聯(lián)網(wǎng)數(shù)據(jù)流,并通過支持向量回歸模型實(shí)現(xiàn)數(shù)據(jù)流的異常檢測。文獻(xiàn)[7]將變壓器在線監(jiān)測數(shù)據(jù)流通過滑動窗口進(jìn)行篩選,再使用聚類模型實(shí)現(xiàn)了對變壓器狀態(tài)的異常檢測。文獻(xiàn)[8]利用滑動窗口和LN預(yù)測模型獲取水文數(shù)據(jù)的預(yù)測值,并通過對比觀測值與預(yù)測值,實(shí)現(xiàn)了對于水文數(shù)據(jù)的異常檢測。通過文獻(xiàn)[6-8]可知,利用滑動窗口可以全面有效地挖掘出時間序列的異常點(diǎn),而且具有較高的精度和可靠性。
ARMA是一種典型的、應(yīng)用最廣的時間序列模型。文獻(xiàn)[9]利用ARMA模型實(shí)現(xiàn)估計(jì)觀測噪聲方差的目的。文獻(xiàn)[10]通過ARMA模型可以有效地探測到地震電離層出現(xiàn)的異常擾動,并且具有較高的精度。文獻(xiàn)[11]利用最小二乘法與ARMA模型相結(jié)合的方法,實(shí)現(xiàn)了對于衛(wèi)星導(dǎo)航定位和航天器跟蹤中重要的極性參數(shù)的預(yù)測。文獻(xiàn)[12]使用ARMA模型預(yù)測在線電視劇的流行度,預(yù)測結(jié)果準(zhǔn)確性高,并且具有較高的參考價值。因此,使用ARMA模型可以有效地實(shí)現(xiàn)時間序列預(yù)測,并且具有較高的預(yù)測精確度,是一種理想的預(yù)測模型。
基于上述研究,本文采用滑動窗口(Sliding Window,SW)模型與自回歸移動平均(AutoRegressive Moving Average,ARMA)模型實(shí)現(xiàn)對于Argo剖面時間序列的預(yù)測,然后利用中心極限定理(Central Limit Theorem,CLT)獲得置信區(qū)間,對比待測剖面點(diǎn)的觀測值與置信區(qū)間之間的關(guān)系,實(shí)現(xiàn)剖面數(shù)據(jù)的異常檢測。
根據(jù)國際Argo計(jì)劃的要求,每個浮標(biāo)的循環(huán)測量周期是10天,意味著每10天浮標(biāo)上浮一次[13],在其循環(huán)周期內(nèi),浮標(biāo)測量0~2 000 m水深范圍內(nèi)的溫度、鹽度數(shù)據(jù)。因此,Argo浮標(biāo)剖面數(shù)據(jù)是包含溫度、鹽度等屬性的時間序列,可以表示為PN={p1,p2,…,pn},其中 pi=(oi,ti),表示ti時刻對應(yīng)的剖面觀測值是oi(1≤i≤n)。
本文的Argo剖面數(shù)據(jù)異常檢測算法的基本思想:首先利用滑動窗口劃分剖面時間序列,再建立ARMA預(yù)測模型,獲得剖面數(shù)據(jù)的預(yù)測值,然后利用中心極限定理計(jì)算置信區(qū)間,通過判斷觀測數(shù)據(jù)是否在置信區(qū)間內(nèi)來判斷待測剖面點(diǎn)pi是否異常。整個算法的具體描述如下:
算法Argo剖面數(shù)據(jù)異常檢測算法
輸入Argo剖面序列PN,k-近鄰剖面點(diǎn)序列的寬度k,置信度 p。
輸出Argo剖面標(biāo)記序列
步驟1初始化待測剖面點(diǎn) pi的k-最近鄰窗口ζi=
步驟2建立ARMA預(yù)測模型,輸入ζi作為參數(shù),計(jì)算獲得預(yù)測值i。
步驟3計(jì)算對應(yīng)的上界和下界
步驟4判定待測剖面點(diǎn)pi是否異常。若,則點(diǎn) pi為正常點(diǎn),令 flag=1,跳轉(zhuǎn)至步驟5;否則點(diǎn) pi為異常點(diǎn),令 flag=0,跳轉(zhuǎn)至步驟6。
步驟5后移一位滑動窗口,用 pi替代ζi={pi-2k,pi-2k+1,…,pi-1}中的 pi-1,獲得新的k-最近鄰窗口 ζi+1。
步驟6后移一位滑動窗口,用 pi替代ζi={pi-2k,pi-2k+1,…,pi-1}中的 pi-1,獲得新的k-最近鄰窗口 ζi+1,并以預(yù)測值i替換原有的觀測值 oi,即。
步驟7 若i<n,則i=i+1,跳至步驟2;否則,對PN的異常檢測結(jié)束,輸出
Argo剖面時間序列異常檢測算法的流程圖,如圖1所示。
現(xiàn)有的Argo剖面數(shù)據(jù)異常檢測算法中,多數(shù)是利用固定閾值進(jìn)行判定,但是剖面數(shù)據(jù)分布會隨著環(huán)境的變化而變化。若采用固定閾值進(jìn)行異常檢測,當(dāng)閾值設(shè)置過大時,會造成錯判,當(dāng)閾值設(shè)置過小時,會造成漏判,所以閾值的設(shè)置直接影響著異常檢測算法的精度和可靠性。因此本文引入滑動窗口模型,利用滑動窗口選擇鄰近的多個剖面點(diǎn)來計(jì)算預(yù)測值,從而可以確定不同的閾值。此外所有的剖面子序列都有可能存在異常數(shù)據(jù),而滑動窗口可以遍歷所有的剖面子序列。為了降低計(jì)算復(fù)雜度,本文依據(jù)k-最近鄰原則(k-Nearest Neighbor,KNN)建立滑動窗口,獲得k-近鄰剖面子序列,其定義如下:
圖1 Argo剖面時間序列異常檢測算法流程圖
定義1(k-近鄰剖面子序列)給定Argo剖面時間序列PN={p1,p2,…,pn}和序列中待測剖面點(diǎn) pi(i<n),pi的k近鄰剖面點(diǎn)序列為一個連續(xù)的長度為2k的剖面子序列,可表示為ζi={pi-2k,pi-2k+1,…,pi-1}。
滑動窗口寬度k決定了預(yù)測模型的輸入?yún)?shù)量,k越大,計(jì)算復(fù)雜度會相應(yīng)的增加。而國際Argo計(jì)劃希望獲取到的測量精度分別為海水溫度0.005 C和鹽度0.01(PSU/實(shí)用鹽標(biāo))[1],因此,在滿足精度要求的情況下,可以適當(dāng)調(diào)節(jié)滑動窗口寬度,從而可以降低算法的計(jì)算復(fù)雜度。
當(dāng)通過滑動窗口獲得待測剖面點(diǎn)的k-近鄰剖面點(diǎn)序列后,下一步便是通過剖面子序列獲得待測剖面點(diǎn)的預(yù)測值。本文采用可以有效地對時間序列進(jìn)行預(yù)測的自回歸移動平均模型(ARMA)。ARMA模型是針對平穩(wěn)的時間序列的預(yù)測模型,而在實(shí)際的海洋環(huán)境中,可能由于環(huán)境影響或者傳感器信號的擾動,所獲得的Argo剖面數(shù)據(jù)可能是非平穩(wěn)的,因此為了保證預(yù)測精度,在生成ARMA模型前需要判斷Argo剖面時間子序列進(jìn)行是否是平穩(wěn)時間序列。若不符合,需進(jìn)行差分計(jì)算轉(zhuǎn)換為平穩(wěn)時間序列,再建立ARMA模型。
本文依據(jù)最小二乘法(Least Squares,LS)原理估計(jì)模型系數(shù),并依據(jù)最小信息準(zhǔn)則[14](Akaike Information Criterion,AIC)確定模型階數(shù)。參數(shù)選擇通常選用的是AIC量最小的參數(shù)。AIC可以表示為:
其中,n為樣本大小,σ2為擬和殘差的平方和。
某個待測剖面點(diǎn)pi的k-近鄰剖面子序列為ζi={pi-2k,pi-2k+1,…,pi-1},在此為了方便描述,記作SM={p1,p2,…,pm},(m=2k),其剖面觀測值序列為OM={o1,o2,…,om},(1≤i≤m),則具體建模方法描述如下:
(3)確定剖面預(yù)測模型參數(shù)的最小二乘估計(jì)。對目標(biāo)函數(shù)Q(φ,θ)進(jìn)行極小化,得到參數(shù)的最小二乘估計(jì)其中目標(biāo)函數(shù) Q(φ,θ)表示為:最小二乘估計(jì)方法定義如下:
則將目標(biāo)函數(shù)Q(φ,θ)進(jìn)行改寫得到:
極小化目標(biāo)函數(shù)Q(φ,θ)得到參數(shù)的最小二乘估計(jì),依據(jù)方程組 (O′,ε′)T[O-(O′,ε′)β]=0 決定,得到解為:
剖面殘差序列的方差的最小二乘估計(jì)為:
(5)獲得剖面預(yù)測值。利用線性最小方差方法獲取剖面預(yù)測值,表示為:
及以前的剖面觀測值通過ARMA模型獲得的剖面預(yù)測值,φi(i=1,2,…p)為自回歸參數(shù),θj(j=1,2,…q)為移動平均參數(shù),m為經(jīng)過反標(biāo)準(zhǔn)化過程后獲得的實(shí)際剖面預(yù)測值。
對滑動窗口內(nèi)的剖面子序列的觀測數(shù)據(jù)進(jìn)行預(yù)測后,需要利用置信區(qū)間(Confidence Interval,CI)來判定下一時刻的剖面點(diǎn)觀測值是否為異常,置信區(qū)間是依據(jù)中心極限定理(Central Limit Theorem,CLT)來確定的,其計(jì)算如下:
對于給定的Argo剖面時間序列PN,若待測剖面點(diǎn)pi(i<n)的剖面觀測值oi沒有在閾值范圍內(nèi),則待測剖面點(diǎn) pi被判定為異常剖面點(diǎn),否則為正常剖面點(diǎn)。為了能夠更好地表示出剖面數(shù)據(jù)是否異常,用Argo剖面標(biāo)記序列來進(jìn)行表示,其定義如下:
定義2(Argo剖面標(biāo)記序列)完成異常檢測后,對PN中的每一個點(diǎn)增加一個屬性 flag,來標(biāo)記檢測結(jié)果。此時,所獲得的Argo剖面標(biāo)記序列可表示為,其中,當(dāng)檢測結(jié)果正常,令 flag=1,否則令 flag=0。
當(dāng)某一待測剖面點(diǎn) pi經(jīng)過異常檢測后,需要向后移動滑動窗口進(jìn)行下一個點(diǎn)的檢測。為了提高檢測的精度,在本文算法采用異常檢測緩解策略[17](Anomaly Detection and Mitigation Strategy)。
當(dāng)待測剖面點(diǎn)pi經(jīng)過檢測后,判定為正常剖面點(diǎn),則直接后移一位滑動窗口,更新k-最近鄰窗口ζi+1,進(jìn)行下一個點(diǎn)的檢測;若判定為異常剖面點(diǎn),更新滑動窗口后,需要使用預(yù)測值i替換原有的觀測值oi,獲得新的k-最近鄰窗口ζi+1,再進(jìn)行下一個點(diǎn)的異常檢測。圖2所示為異常檢測緩解策略示意圖。
圖2 異常檢測緩解策略示意圖
為了驗(yàn)證本文算法的效果,本章從預(yù)測精度和異常檢測效果兩個方面對本文所提算法進(jìn)行實(shí)驗(yàn)驗(yàn)證,并與同類經(jīng)典算法進(jìn)行對比,分析其優(yōu)劣性。
實(shí)驗(yàn)采用從中國Argo實(shí)時資料中心(http://www.argo.org.cn/)獲取的2016年全球Argo浮標(biāo)剖面數(shù)據(jù)進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)以.dat文件表示,在Argo剖面文件中包括浮標(biāo)號、數(shù)據(jù)采集的經(jīng)緯度、采集時間等基本信息和壓強(qiáng)、溫度、鹽度屬性信息,少數(shù)還包括葉綠素濃度、溶解氧等信息。本文的實(shí)驗(yàn)環(huán)境:CPU為Intel Core i3,2.3 GHz,4 GB內(nèi)存,操作系統(tǒng)為Windows 7,開發(fā)工具為MyEclipse2016,編程語言為Java。
原始的Argo剖面文件中除了包含多個主要的數(shù)據(jù)屬性外,還包含了大量的與剖面數(shù)據(jù)異常檢測無關(guān)的冗余數(shù)據(jù),因此無法直接檢測原始Argo剖面文件,需要對于數(shù)據(jù)進(jìn)行預(yù)處理,提取出所需要的屬性。而且Argo浮標(biāo)所觀測到的剖面數(shù)據(jù)具有明顯的地域性特點(diǎn),溫度、鹽度等數(shù)據(jù)的變化在不同的經(jīng)緯度下呈現(xiàn)不同的變化趨勢[15-16],因此不能將所有的數(shù)據(jù)進(jìn)行統(tǒng)一的處理,需根據(jù)經(jīng)緯度網(wǎng)格進(jìn)行劃分,再進(jìn)行數(shù)據(jù)異常檢測。本文算法將Argo剖面數(shù)據(jù)按照經(jīng)緯度網(wǎng)格3°×3°進(jìn)行劃分,再選取某一網(wǎng)格中的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。
本文實(shí)驗(yàn)采用鹽度屬性進(jìn)行驗(yàn)證,如圖3所示,為經(jīng)緯度為15°N~18°N,138°W~141°W范圍內(nèi)的鹽度剖面數(shù)據(jù)曲線,共有2 011個剖面點(diǎn)。從圖3可知,鹽度剖面具有周期性,數(shù)據(jù)整體平穩(wěn),但是也存在一些明顯的可疑點(diǎn)。
圖3 15°N~18°N,138°W~141°W鹽度剖面序列
在本文算法中,預(yù)測剖面數(shù)據(jù)是核心步驟,因此,為了檢測預(yù)測效果,本實(shí)驗(yàn)采用均方根誤差(Root Mean Square Error,RMSE)和相對均方根誤差(Relative Root Mean Square Error,RRMSE)來對于預(yù)測結(jié)果進(jìn)行量化評估。
文獻(xiàn)[17]中表明LN(Single-Layer Linear Network Predictor,單層線性網(wǎng)絡(luò)預(yù)測模型)預(yù)測模型可以獲得理想的預(yù)測效果,因此在表1中對比了在滑動窗口寬度k=8,k=10和k=12的條件下本文預(yù)測模型和LN預(yù)測模型的鹽度剖面預(yù)測誤差。從表1可以看出,本文預(yù)測模型的RMSE和RRMSE均小于LN預(yù)測模型,在本算法中具有較高的精確度,可獲得更好的預(yù)測效果。
表1 不同滑動窗口寬度下鹽度剖面預(yù)測誤差
表2所示的是本文預(yù)測模型在不同的滑動窗口寬度k下的鹽度剖面預(yù)測誤差。從表2可以看出,隨著滑動窗口寬度k的不斷增大,RMSE和RRMSE不斷地減小,因?yàn)殡S著輸入的預(yù)測參數(shù)的增加,預(yù)測結(jié)果會越準(zhǔn)確。
表2 不同滑動窗口寬度的鹽度剖面預(yù)測誤差
圖4所示為鹽度剖面序列的預(yù)測結(jié)果,從圖5可以看出,預(yù)測數(shù)據(jù)大都與原始觀測數(shù)據(jù)十分接近,只有部分?jǐn)?shù)據(jù)與觀測數(shù)據(jù)有較大的偏差,說明本預(yù)測模型的預(yù)測精度較高,可以有效地應(yīng)用于Argo時間序列的異常檢測中。
圖4 鹽度剖面序列的預(yù)測結(jié)果
從上節(jié)可以看出,本文算法采用的預(yù)測模型,可以獲得較好地預(yù)測結(jié)果,因此,在此預(yù)測基礎(chǔ)上,可以實(shí)現(xiàn)對于鹽度剖面序列的異常檢測?;瑒哟翱趯挾萲=10,置信度p=95%條件下的異常檢測結(jié)果,如圖5所示。
圖5 k=10,p=95%條件下的異常檢測結(jié)果
不同的滑動窗口寬度和置信區(qū)間下異常檢測的結(jié)果可能是不同的。為了能夠有效的評價本算法,在此將異常檢測結(jié)果分為4類,如表3所示。其中,TN和TP是希望出現(xiàn)的結(jié)果,而FN和FP是判定出現(xiàn)錯誤所出現(xiàn)的結(jié)果。
表3 檢測結(jié)果分類
不同參數(shù)下的異常檢測結(jié)果如表4所示。當(dāng)選擇滑動窗口寬度k=10,置信度 p=95%條件下,本文的異常檢測算法可以正確檢測出異常剖面點(diǎn)10個(TP=10),正常剖面點(diǎn)被正確判定出來的剖面點(diǎn)有1 994個(TN=1 994),但是有2個正常剖面點(diǎn)被錯誤的判定為異常剖面點(diǎn)(FP=2),最后,還有5個異常剖面點(diǎn)沒有被檢測出(FN=5)。
表4 不同參數(shù)對異常檢測的結(jié)果對比
通過對比表4的評估結(jié)果可以看出,本文的異常檢測算法的特異度很高,一直保持在99%以上,說明本算法可以很好地檢測出正常剖面點(diǎn)為正常。但是,當(dāng)置信度 p≥95%時,敏感度只有60%左右,說明當(dāng)置信區(qū)間范圍設(shè)置過大時,能夠真正判斷出異常剖面點(diǎn)的效果不是很好,而當(dāng)置信度設(shè)置在 p∈[80%,90%]范圍內(nèi)時,敏感度可以維持在80%以上,而且隨著滑動窗口寬度k的增加,敏感度呈上升趨勢。此外,本文算法的精確度一直維持在99%以上,說明本文算法可以準(zhǔn)確地判斷出正常剖面點(diǎn)或者異常剖面點(diǎn),其他的指標(biāo)也維持較高的水平。當(dāng)滑動窗口寬度k∈[10,20],置信度 p∈[80%,90%]時,敏感度可以達(dá)到85%以上,并且特異度可以維持在99%,準(zhǔn)確度在99%以上,說明本文的異常檢測算法具有較高的可靠性。
為了能夠更好地評估本文的異常檢測算法,將本文方法與其他的異常檢測方法在同一張“受試者工作特征”[18](Receiver Operating Characteristic,ROC)曲線上。在ROC曲線中,橫坐標(biāo)是“假正比率”(False Positive Rate,F(xiàn)PR),縱坐標(biāo)是“真正比率”(True Positive Rate,TPR),兩者的公式為:
在進(jìn)行算法比較時,當(dāng)一個算法的ROC曲線被另一個算法的ROC曲線完全“包住”,則可說明后者的性能優(yōu)于前者。從公式(12)可以看出,F(xiàn)PR就是“1-特異度”,而TPR就是“敏感度”。在異常檢測中,理想的是獲得高TPR,低FPR,意味著曲線越接近坐標(biāo)軸的左上角,算法的精確度越高,性能越好。
圖6所示的是本文的異常檢測算法與經(jīng)典的溫鹽關(guān)系模型的異常檢測方法[4]、基于“LN”預(yù)測模型的異常檢測方法[6]和k-近鄰方法[19]的ROC曲線對比圖。圖6表明,本文方法的異常檢測效果優(yōu)于其他異常檢測方法。溫鹽關(guān)系模型方法采用的是最小二乘法擬合歷史溫鹽數(shù)據(jù)獲得上下界來實(shí)現(xiàn)異常檢測,但是由于該模型的精確度不高導(dǎo)致異常檢測的效果是最不理想的。k-近鄰方法的效果雖然優(yōu)于溫鹽關(guān)系模型方法,但是相較于其他兩種方法,檢測效果一般。基于“LN”預(yù)測的方法與本文方法檢測效果較為接近,但是由于該方法的選取的預(yù)測模型應(yīng)用于Argo剖面數(shù)據(jù)集中,預(yù)測誤差較大,所以其檢測效果相較于本文方法略遜一籌。而本文方法的ROC曲線始終位于最上方,完全“包住”了其他3種方法,所以檢測效果最好,準(zhǔn)確性高。
圖6 不同方法的ROC曲線
本文針對Argo剖面數(shù)據(jù),提出了一種基于滑動窗口和ARMA的Argo剖面數(shù)據(jù)異常檢測算法,本文算法利用滑動窗口劃分剖面序列,結(jié)合ARMA模型獲取剖面預(yù)測數(shù)據(jù),并采用中心界限定理計(jì)算出動態(tài)閾值來實(shí)現(xiàn)異常檢測的方法。通過真實(shí)的全球Argo浮標(biāo)剖面數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證了本文方法的異常檢測準(zhǔn)確性和可靠性高,能夠有效地提高Argo浮標(biāo)剖面數(shù)據(jù)的數(shù)據(jù)質(zhì)量,具有較高的實(shí)用性。在此基礎(chǔ)上,下一步將研究多屬性下對于Argo剖面的異常檢測,為其他領(lǐng)域的研究提供更高質(zhì)量的Argo剖面數(shù)據(jù)集。