摘要 :風(fēng)資源分布信息在風(fēng)力發(fā)電、可持續(xù)發(fā)展等領(lǐng)域具有重要價值。以黑龍江西北部23個氣象站點在1989—2018年30年間的逐日平均風(fēng)速數(shù)據(jù)為基礎(chǔ),依據(jù)相關(guān)系數(shù)與推土機距離(EMD)為聚類指標(biāo)進行站點分類,并通過 F 檢驗確定最佳聚類。對待測點插值時選用適當(dāng)?shù)念悇e中的站點,與徑向基函數(shù)(RBF)插值法相結(jié)合,構(gòu)建基于風(fēng)速相關(guān)性的風(fēng)速插值模型,并使用均方誤差(MSE)和決定系數(shù)( R 2),與不同插值模型的插值精度進行評估比較。結(jié)果表明:在一定距離范圍內(nèi),不同站點風(fēng)速之間的相關(guān)性整體隨著距離的增大而減小,將構(gòu)建出的風(fēng)速插值模型與其他插值模型以及未分組的直接插值方法對比,得出本文所提方法的插值效果較好,插值精度得到提升,平均MSE降至0.157 6 m/s, R 2提升至0.903 9。研究對探索區(qū)域風(fēng)資源分布具有理論和實踐意義。
關(guān)鍵詞 :空間插值;徑向基函數(shù)插值;推土機距離;風(fēng)場
中圖分類號:O241.3"" 文獻標(biāo)志碼:A"" 文章編號:1004-0366(2025)01-0025-08
風(fēng)能作為一種可再生的清潔能源,具有諸多優(yōu)點:豐富、幾乎無限、廣泛、清潔和減輕溫室效應(yīng)。1973年世界石油危機后,在常規(guī)能源緊缺和全球生態(tài)環(huán)境惡化的雙重壓力下,風(fēng)能作為一種新型高效的清潔能源越來越受到重視,并得到了突飛猛進的發(fā)展,已成為最適于生產(chǎn)電力的能源之一[1]。風(fēng)速的三次方與風(fēng)能成正比[2],因此確定研究區(qū)域各處的風(fēng)速值對于合理利用風(fēng)能起到了重要作用。建立高密度的氣象觀測站是獲取區(qū)域風(fēng)速值的關(guān)鍵,但由于現(xiàn)實中人力、物力及地形等條件有限,氣象觀測站的布設(shè)受到很大限制。
在風(fēng)電運行時,監(jiān)測人員可以實時監(jiān)控已安裝氣象站點的風(fēng)速數(shù)據(jù),但對于未設(shè)置氣象站的區(qū)域,無法獲取具體的風(fēng)資源信息。因此,需通過已有觀測站點的實測風(fēng)速數(shù)據(jù),采用插值方法估計其他區(qū)域的風(fēng)速。為解決這一問題,國內(nèi)外學(xué)者提出了多種插值方法,常用的有反距離權(quán)重法、克里金插值法和徑向基函數(shù)插值法等。反距離權(quán)重法是一種經(jīng)典且被廣泛應(yīng)用的插值方法[3],該方法易于理解但準(zhǔn)確性有限。反距離權(quán)重法及其修正后方法已成功應(yīng)用于中國大陸[4]、地中海東部[5]和美國得克薩斯州[6]等地。克里金插值法使用半變異函數(shù)來量化區(qū)域變量的變異特征[7],其可以分析和處理數(shù)據(jù)中的趨勢和各向異性,普通克里金(OK)法是實踐中最常用的克里金法之一,但在觀測站點分布比較分散或觀測數(shù)據(jù)較少時,變異函數(shù)可能難以精準(zhǔn)擬合,影響最終插值精度。KRISHNA等[8]使用OK法生成了印度降雨空間變異性的地圖,其中使用協(xié)同克里金法來改善預(yù)測,且高程被列為相關(guān)變量。徑向基函數(shù)插值則基于徑向基函數(shù)來刻畫數(shù)據(jù)的局部化特征,該方法數(shù)值精度高,且不依賴網(wǎng)格拓撲[9]。DING等[10]對礦區(qū)土壤有毒元素進行了空間插值分析,對于大多數(shù)有毒元素,徑向基函數(shù)插值優(yōu)于普通克里金與反距離權(quán)重。但無論哪種插值方法,都受到已知站點的觀測值影響,如何選用合適的觀測站點數(shù)據(jù)仍是需要解決的問題。由此喬穎等[11]提出了一種對已知氣象站點進行系統(tǒng)聚類分組的方法,分別以相關(guān)系數(shù)與風(fēng)速均值之差作為聚類指標(biāo)將已知站點進行合理分組,進而對不同點選擇出恰當(dāng)?shù)牟逯嫡军c,但該分組方法得到的分組效果仍有待進一步提高,對組數(shù)的選取也未能給出更合理的解決。針對插值前的聚類模型,一方面可對聚類指標(biāo)進一步優(yōu)化,另一方面可引入統(tǒng)計檢驗的方法劃分組數(shù),通過檢驗確定最佳分組,由此可確定恰當(dāng)站點數(shù)據(jù)來對待測點進行插值,進而選擇適當(dāng)?shù)牟逯的P鸵蕴岣卟逯稻取?/p>
在風(fēng)能研究領(lǐng)域中,主要存在風(fēng)速觀測數(shù)據(jù)獲取困難、插值方法精度不足以及觀測站點選擇優(yōu)化不足等問題。由于資源和地形限制,氣象觀測站布設(shè)受限,導(dǎo)致風(fēng)速數(shù)據(jù)的空間分布不均;現(xiàn)有的插值方法如反距離權(quán)重法、克里金插值法和徑向基函數(shù)插值法在精度和計算復(fù)雜度上存在局限性;現(xiàn)有技術(shù)未能有效優(yōu)化觀測站點選擇,影響了數(shù)據(jù)質(zhì)量。為解決風(fēng)速數(shù)據(jù)獲取不足的問題并提高插值精度,本文提出了一種結(jié)合系統(tǒng)聚類與徑向基函數(shù)(RBF,radial basis functions)插值法的方法,優(yōu)化了觀測站點選擇。通過引入推土機距離(EMD,earth mover's distance)作為系統(tǒng)聚類的度量標(biāo)準(zhǔn),改進了風(fēng)速數(shù)據(jù)的空間分析,提升了插值精度。以黑龍江西北部1989—2018年間23個觀測站點的風(fēng)速數(shù)據(jù)為基礎(chǔ),利用各站點風(fēng)場之間的相關(guān)系數(shù)與EMD進行系統(tǒng)聚類,并將聚類結(jié)果與RBF插值法結(jié)合。隨后,將該方法與傳統(tǒng)反距離加權(quán)(IDW,inverse distance weighting)法插值結(jié)果進行對比分析,評估不同模型在風(fēng)場插值中的性能與精度,以期提出最優(yōu)的風(fēng)場空間插值模型,為區(qū)域風(fēng)資源分布的研究提供理論與實踐支持。
1 數(shù)據(jù)與方法
1.1 研究區(qū)域概況
黑龍江西北部區(qū)域包括大興安嶺地區(qū)、黑河市、齊齊哈爾市、大慶市、綏化市與伊春市,地跨大興安嶺與小興安嶺,位于121°11′~130°46′E,53°33′~46°55′N,北部與俄羅斯接壤,是亞洲與太平洋地區(qū)陸路通往俄羅斯遠東地區(qū)和歐洲大陸的重要通道。黑龍江西北、北部地勢高,地貌主要以山地、臺地為主,整個區(qū)域以寒溫帶與溫帶大陸性季風(fēng)氣候為主,氣候地域性差異大[12]。
1.2 "數(shù)據(jù)選取與分析
本文所用的基礎(chǔ)數(shù)據(jù)來自于NOAA數(shù)據(jù)中心的黑龍江西部區(qū)域23個氣象站點1989—2018年30年間逐日平均風(fēng)速資料(https://www.ncei.noaa.gov),站點所在經(jīng)緯度及編號如圖1所示。部分站點中的風(fēng)速數(shù)據(jù)存在缺失,采用EM插值的方法對缺失值進行填補。根據(jù)地理學(xué)第一定律,任何事物都與其他事物相關(guān),相近的事物關(guān)聯(lián)更緊密,即相關(guān)性隨距離的減少而增加。在對風(fēng)場的研究上,不同位置的風(fēng)速大小也符合這一規(guī)律,對23個站點兩兩之間相關(guān)系數(shù)進行分析,即得出相關(guān)系數(shù)與距離散點圖(見圖2)。
觀察23個站點兩兩之間的相關(guān)系數(shù)隨距離的變化關(guān)系發(fā)現(xiàn),不同位置風(fēng)速值之間的關(guān)系基本滿足上述規(guī)律。但隨著距離的增大且超出一定限度時,該規(guī)律表現(xiàn)得并不明顯,相關(guān)系數(shù)隨距離的增大而逐漸分散。
1.3 模型與方法
(1) 氣象站點分類 由于不同地理位置的氣象站點風(fēng)資源波動特點和數(shù)值大小存在差異,選用已知氣象站點對未知點風(fēng)速進行插值時,不同波動特征的氣象站點會對插值結(jié)果產(chǎn)生不同的影響。為提高插值精度,首先需根據(jù)風(fēng)速的波動特性和數(shù)值大小對氣象站點進行分類[11]。
本文選用最短距離聚類的方法對氣象站點進行分類[13]。對n個元素進行分類,定義第i元素與第j元素之間距離為dij,類GK與類GL之間距離為兩類中最近元素之間的距離,即
DKL= min i∈GK,j∈GLdij。 (1)
首先將每個元素視為一類,n個元素共有n類,構(gòu)造n類之間的距離矩陣D(0)=[dij]n×n,選擇D(0)中非對角線上的最小距離,設(shè)其為dKL,則將GK與GL合并為一個新類,記為GM,即GM=GK∪GL。然后計算新類GM與除GK、GL之外的任一類GJ(J∈{1,2,…,n}\{K,L})之間的距離,即
DMJ= min i∈GM,j∈GJdij= min { min i∈GK,j∈GLdij, min i∈GL,j∈GJdij}= min {DKL,DLJ},(2)
由此計算各類與新類之間的距離值,得到新的n-1階距離矩陣,記作D(1)。對D(1)重復(fù)上述操作直至達到預(yù)期類別數(shù)。
研究中站點分組依據(jù)為實測風(fēng)速的波動特性和數(shù)值大小的差異。考慮到這兩方面的影響,采用2個聚類指標(biāo)進行2次聚類分析。
① 第一次分類:站點間的相關(guān)系數(shù)。
首先,選取各站點風(fēng)速之間的相關(guān)系數(shù)作為第一次聚類的指標(biāo)進行分類。將兩站點x、y的風(fēng)速序列視為X、Y,相關(guān)系數(shù)公式為
rX,Y=1n∑ni=1(xi-μX)(yi-μY)σXσY, (3)
其中:X={xi,i=1,…,n};Y={yj,j=1,…,n};μX為X的均值,即μX=1n∑ni=1xi;μY為Y的均值,即μY=1n∑nj=1yj;σX、σY分別為X、Y的標(biāo)準(zhǔn)差,即
σX=∑ni=1(xi-μX)2n-1, σY=∑nj=1(yj-μY)2n-1。
以1減去相關(guān)系數(shù)的絕對值作為聚類指標(biāo),即dxy=1-rX,Y,則最短距離對應(yīng)于1減去相關(guān)系數(shù)絕對值最大值,將彼此之間相關(guān)系數(shù)絕對值較大的站點分為一類,最終實現(xiàn)站點風(fēng)速序列強相關(guān)性,即風(fēng)速的波動特點相似的分為一類。
但對實際站點數(shù)據(jù)進行分析發(fā)現(xiàn),站點之間的風(fēng)速波動特征相似,可能存在風(fēng)速數(shù)值上差異較大的情況。因此還需依據(jù)風(fēng)速數(shù)值大小差異對站點進行第二次分類。
② 第二次分類:站點風(fēng)速序列的風(fēng)速差。
研究采用推土機距離(EMD)來反映站點風(fēng)速序列的數(shù)值差異。EMD是由運輸問題產(chǎn)生的,假設(shè)在一個空間中存在若干已知質(zhì)量的土堆和若干已知容量的土坑,那么運輸問題的目標(biāo)是將土堆的土量運輸?shù)酵量拥目偝杀咀钚』?/p>
假定P={(p1,wp1),…,(pm,wpm)},其中pi∈Rd為土堆所在位置,wpi為土堆大小;Q={(q1,wq1),…,(qn,wqn)},其中qj∈Rd為土坑所在位置,wqj為土坑大小,則 EMD 為如下線性優(yōu)化問題[14]:
min ∑mi=1∑ni=1hijfij,
s.t. "fij≥0,
∑mi=1fij≤wpi, 1≤i≤m
∑nj=1fij≤wqj, 1≤j≤n
∑mi=1∑nj=1fij= min (∑mi=1wpi,∑nj=1wqj),
hij=|pi-qj|。 (4)
若將pi當(dāng)作站點x的風(fēng)速序列X中的第i天,wpi為其當(dāng)天的平均風(fēng)速;qj當(dāng)作站點y的風(fēng)速序列Y的第j天,wqj為其當(dāng)天的平均風(fēng)速;hij為i到j(luò)的時間差絕對值作為其權(quán)重。由式(4)得到滿足條件的最優(yōu)差值F=[fij],使總體風(fēng)速差∑mi=1∑nj=1hijfij達到最小,其中fij表示pi到qj的風(fēng)速差,對風(fēng)速之差取絕對值。 EMD 規(guī)格化定義為
EMD (x,y)=∑mi=1∑nj=1hijfij∑mi=1∑nj=1fij。 (5)
采用最短距離聚類的思想,以最小 EMD 為聚類指標(biāo),即dxy= EMD (x,y)。在聚類過程中根據(jù)實際劃定閾值,即將風(fēng)速數(shù)值差小于該閾值的站點分為一類,實現(xiàn)了將波動特點相似且風(fēng)速數(shù)值差較小的站點劃分稱為一類的最終目標(biāo)。
③ 最優(yōu)聚類數(shù)的確定。
本文采用最短距離聚類方法進行站點分類,并通過F檢驗確定最佳的聚類數(shù)。設(shè)F為尋求最佳聚類中的檢驗值,n為所有元素個數(shù),r為分類個數(shù),ni為第i類的元素個數(shù),m表示每個元素對應(yīng)的數(shù)據(jù)指標(biāo)長度,xjk表示類內(nèi)第j個元素的第k個數(shù)據(jù)指標(biāo),ik表示類i的均值,k表示整個數(shù)據(jù)集的均值,則有
F=∑ri=1ni∑mk=1(ik-k)2/(r-1)∑ri=1∑nij=1∑mk=1(xjk-ik)2/(n-r), (6)
式(6)表示服從自由度為(r-1,n-r)的F分布,其中:分子表示類與類之間的距離;分母表示類內(nèi)距離;F值越大,表示類間的差異越大,再分別與臨界值Fα(r-1,n-r)作差,如果Fgt;Fα,則類與類之間的差異顯著,將差異最大的一種分類作為最優(yōu)聚類。
(2) 插值方法 采用 RBF 插值法[15-16]來對未知點的風(fēng)速進行插值計算。 RBF 插值法通過徑向基函數(shù)對給定數(shù)據(jù)近似,從而估算某一點x處的函數(shù)值F=F(x)。在三維空間中已知N個節(jié)點S={(xi,yi),i=1,2,3,…,N},其中xi=[αi,βi,γi]為三維坐標(biāo)向量,yi為已知參考點的屬性值,滿足yi=F(xi),i=1,2,…,N。其核心在于構(gòu)造一個逼近函數(shù)f(x),使得f(xi)=yi,i =1,…,N成立。其計算公式如下:
f(x)=∑Ni=1λiφ(x-xi),x∈R3 (7)
其中:φ(x)是一個確定的實值函數(shù),即 RBF,在研究中選用的RBF 為多二次函數(shù)( multiquadric ),表達式為φ(x)=1+(εx)2;·表示歐氏距離;λi和xi分別為待定系數(shù)和 RBF 逼近的參考點(i =1,2,…,N);x為三維空間插值點。
將{xj,yj}Nj=1代入方程f(x)=∑Ni=1λiφ(x-xi),可得
φ11φ12…φ1Nφ21φ22…φ2NφN1φN2…φNNλ1λ2λN=y1y2yN, (8)
其中:φji=φ(xj-xi),i,j=1,2,…,N。將線性方程組(8)記為ΦΛ=,該方程組的第j行為
f(xj)=yj=λ1φ(xj-x1)+λ2φ(xj-x2)+…+λNφ(xj-xN)。 (9)
因此,得出 RBF 插值的系數(shù)Λ=Φ-1,根據(jù)系數(shù)即可確定所需的逼近函數(shù)f(x),進而由逼近函數(shù)確定未知點的屬性值,即得到未知點的插值結(jié)果。
在上文中已對已知測風(fēng)速站點進行了分類,即將波動特點相似且風(fēng)速差異較小的站點分為一類。因此,在進行插值計算時,應(yīng)優(yōu)先選擇與待測點在同一類的站點的實測風(fēng)速進行插值。但由于待解決的問題是對待測點的風(fēng)速進行探究,則無法對待測點進行準(zhǔn)確分類。根據(jù)1.2節(jié)中提出的規(guī)律,假設(shè)距離待測點最近的站點的風(fēng)場與待測點風(fēng)場最為相似。整體插值流程如圖3所示。
2 結(jié)果與分析
2.1 插值結(jié)果
研究區(qū)包含23個氣象站點數(shù)據(jù),為便于表示,依次對其進行1~23的編號,并對23個站點進行兩次分類。第一次分類以相關(guān)系數(shù)作為分類指標(biāo),依次計算將其劃分為2~22類的 F與F-Fα 的差值,計算結(jié)果見表1。由表1可知,當(dāng)分類數(shù)為2時差值最大,聚類結(jié)果最優(yōu),因此將其首先劃分為2類,分類結(jié)果見表2。表2中分類結(jié)果出現(xiàn)了分類不均的情況,類別2 的站點數(shù)量遠大于類別1,分類情況不夠合理,因此需對類別2再進行第二次分類。第二次分類以EMD作為分類指標(biāo)。對類別2 依次劃分為2~19類并分別計算,計算結(jié)果見表3。由表3可知,當(dāng)分類數(shù)為3時 F-Fα 的差值最大,為最優(yōu)聚類數(shù),因此將類別2劃分為3類。經(jīng)兩次分類最終將23個站點分為4類,分類結(jié)果見表4。
分類之后,采用RBF插值法對未知站點風(fēng)速序列進行插值計算,并將以上聚類模型與RBF插值結(jié)合的方法簡寫為CER。為便于比較分析,研究以站點3為例,將其作為待測點,用其余22個站點的實測風(fēng)速數(shù)據(jù),采用CER對其進行插值,得到站點3的估計風(fēng)速序列。為便于展示觀察,僅顯示2018年得到的插值結(jié)果與實測值的對比(見圖4)。
2.2 模型檢驗
(1) 聚類檢驗 對氣象站點進行分類時,以相關(guān)系數(shù)和EMD作為兩次聚類指標(biāo)完成聚類。首先對聚類效果進行檢驗,以CH系數(shù)(Calinski-Harabasz index)作為聚類結(jié)果評估指標(biāo),計算公式為
s(k)= tr (Bk) tr (Wk)·m-kk-1, (10)
其中:Bk為類別之間協(xié)方差矩陣;Wk為類別內(nèi)部數(shù)據(jù)的協(xié)方差矩陣;m為訓(xùn)練集總樣本數(shù);k為類別數(shù)。 CH 系數(shù)值越大則聚類效果越好。
為更顯著地對比聚類效果,分別采用相關(guān)系數(shù)、相關(guān)系數(shù)與曼哈頓距離、相關(guān)系數(shù)與風(fēng)速均值之差作為聚類指標(biāo),與本文提出的聚類模型進行對比。將這些聚類模型分別簡寫為C、CM、CA和CE,并依據(jù)上述結(jié)果將站點劃分為4組。4種聚類模型對比見表5。
表5顯示CE的CH系數(shù)最大,聚類效果最好;其次為CA與CM。僅用相關(guān)系數(shù)進行聚類得到的聚類效果最差,這一結(jié)果驗證了前文的假設(shè),即單純依據(jù)風(fēng)速相關(guān)性進行分類時,分類效果不理想。
(2) 插值結(jié)果檢驗 除RBF外,常用的空間插值方法有IDW法。IDW參考周圍已知點的值,并根據(jù)已知站點和未知的待測點之間的距離來計算權(quán)重,進而得到預(yù)測點的插值。IDW的數(shù)學(xué)表達式為
Z′=∑mi=1Zidni∑mi=11dni, (11)
其中:Z′為預(yù)測的風(fēng)速插值;i表示第i個已知點;Zi為已知點的實測風(fēng)速值;di代表第i個已知點和待測點之間的歐氏距離;n表示距離權(quán)重放大指數(shù)。
將聚類模型C、CM、CA和CE分別與插值方法RBF、IDW結(jié)合,構(gòu)建空間插值模型,將模型依次簡寫為CR、CMR、CAR、CER以及CI、CMI、CAI和CEI。采用的評估指標(biāo)為均方誤差(MSE,mean square error)和決定系數(shù)( R 2,coefficient of determination),這2個評估指標(biāo)的數(shù)學(xué)表達式分別為
MSE =1n∑ni=1(Zi-Z′i)2, (12)
R2=1-∑ni=1(Zi-Z′i)2∑ni=1(Zi-)2, (13)
其中:n為樣本數(shù)量;Zi表示第i個樣本的實測值;Z′i表示第i個樣本的預(yù)測值;為樣本實測值的均值。
圖5展示了以站點3為例,通過其余22個已知站點的風(fēng)速序列, 分別采用上述8種方法,以及不進行分類直接使用RBF、IDW插值方法得到的插值結(jié)果。
為便于觀察分析,圖5僅繪制了2018年第四季度站點3的預(yù)測風(fēng)速值與實測值對比。由圖5觀察可知,CER與實測值的整體擬合效果最好,插值出的預(yù)測值曲線與實測值曲線基本保持一致,只在少數(shù)時間段如10月上旬、11月中旬等峰值點處的擬合稍有誤差;CMR、CAR、CR與RBF次之,預(yù)測曲線的起伏增長趨勢與實測曲線基本相似,但在部分峰值點處與實測值也存在一定差距,且相對CER誤差略大;IDW、CI、CMI、CAI與CEI擬合效果相對較差,整體趨勢一致,但在10月下旬、11月中旬、12月中下旬等時間段存在相對較為明顯的預(yù)測誤差。
表6統(tǒng)計了不同插值模型對站點3插值結(jié)果的MSE和 R 2。
由表6可知,選用IDW的5種插值模型IDW、CI、CMI、CAI以及CEI的MSE在0.190 8~0.301 5 m/s之間波動, R 2在0.832 7~0.882 1之間波動,CEI的MSE小于IDW、CI、CMI、CAI的MSE,CEI的 R 2大于IDW、CI、CMI、CAI的 R 2。而選用RBF的5種插值模型RBF、CR、CMR、CAR以及CER的MSE在0.025 5~0.103 1 m/s之間波動,整體小于IDW、CI、CMI、CAI、CEI的MSE,RBF、CR、CMR、CAR以及CER的 R 2在0.930 8~0.982 9之間波動,整體也大于IDW、CI、CMI、CAI、CEI的 R 2,其中CER的MSE小于RBF、CR、CMR、CAR的MSE,CER的 R 2大于RBF、CR、CMR、CAR的 R 2??傮w比較來看,CER的MSE最小、 R 2最大,CMR與CAR次之,IDW的結(jié)果最差,分組后得到的插值精度基本高于未分組的情況。
為排除個別站點存在極端情況的可能,分別對23個站點采用上述10種方法進行插值,并將得到的MSE與 R 2求平均值,結(jié)果見表7。表7的結(jié)果與表6基本一致,CER的MSE最?。?.157 6 m/s)、 R 2最大(0.903 9),CER的插值效果最好。一方面說明三維層面的RBF插值效果優(yōu)于IDW,另一方面也表明本文提出的以相關(guān)系數(shù)與EMD為聚類指標(biāo)的聚類模型在風(fēng)速插值應(yīng)用中的效果較好。
3 結(jié)論
空間插值是對區(qū)域變量空間分布進行研究的重要方法之一,且在實際問題的解決中有著重要的應(yīng)用。本文以黑龍江省西北部區(qū)域為例,以23個氣象站點1989—2018年30年間的逐日平均風(fēng)速為數(shù)據(jù)源,選用相關(guān)系數(shù)與EMD作為聚類指標(biāo)對站點進行聚類分組,并與聚類指標(biāo)為相關(guān)系數(shù)、相關(guān)系數(shù)與曼哈頓距離、相關(guān)系數(shù)與風(fēng)速均值之差的聚類模型進行對比,將4種聚類模型與RBF、IDW兩種插值方法結(jié)合來比較插值精度。研究得出以下結(jié)論:
(1) 在一定距離范圍內(nèi),不同站點風(fēng)速之間的相關(guān)性整體隨距離的增大而減小,而距離超出一定范圍后此規(guī)律表現(xiàn)不明顯。
(2) 依據(jù)相關(guān)性的規(guī)律,研究對站點分組進行改進,聚類指標(biāo)選用相關(guān)系數(shù)與EMD對氣象站點進行分組后,根據(jù)待測點位置選擇適當(dāng)組別,并采用RBF插值法對待測點進行插值得到的結(jié)果,相較于其他方法精度更高、效果更好,其中CER的MSE最小、 R 2最大。
(3) 由研究結(jié)果可知,RBF插值法整體效果優(yōu)于IDW,一是RBF采用無網(wǎng)格化方法,數(shù)值精度較高,二是本文采用的RBF進行三維空間插值,而IDW僅在二維平面上對風(fēng)速進行插值,不同的地形環(huán)境會在很大程度上影響插值效果。
參考文獻:
[1]KOCAK K.Examination of persistence properties of wind speed records using detrended fluctuation analysis[J].Energy,2009,34(11):1980-1985.
[2]XIU C,WANG T,TIAN M, et al .Short-term prediction method of wind speed series based on fractal interpolation[J].Chaos Solitons amp; Fractals the Interdisciplinary Journal of Nonlinear Science amp; Nonequilibrium amp; Complex Phenomena,2014,68(2):89-97.
[3] LI J,HEAP A D.A review of comparative studies of spatial interpolation methods in environmental sciences:performance and impact factors[J].Ecological Informatics,2010,6(3):228-241.
[4] CHEN D L,OU T H,GONG L B, et al .Spatial interpolation of daily precipitation in China:1951—2005[J].Advances in Atmospheric Sciences,2010,27(6):1221-1232.
[5] KURTZMAN D,NAVON S,MORIN E.Improving interpolation of daily precipitation for hydrologic modelling:spatial patterns of preferred interpolators[J].Hydrological Processes,2009,23(23):3281-3291.
[6] KONG Y F,TONG W W.Spatial exploration and interpolation of the surface precipitation data[J].Geographical Research,2008,27(5):1097-1108.
[7] 白軍紅,余國營,張玉霞.濕地土壤養(yǎng)分的空間異質(zhì)性研究方法構(gòu)想[J].水土保持學(xué)報,2001(增刊1):68-71.
[8] KRISHNA Murthy B R,ABBAIAH G.Geostatistical analysis for estimation of mean rainfalls in Andhra Pradesh,India[J].International Journal of Geology,2007,1(3):35-51.
[9]GREGORY E.FASSHAUER.Meshfree approximation methods with Matlab[M].Singapore:World Scientific Publishing Company,2007.
[10] DING Q,WANG Y,ZHUANG D.Comparison of the common spatial interpolation methods used to analyze potentially toxic elements surrounding mining regions[J].Journal of Environmental Management,2018(212):23-31.
[11] 喬穎,李劍楠,陳釗.風(fēng)資源分布的實時估計方法研究[J].中國科技論文,2016,11(23):2633-2639.
[12] 戴長雷,王思聰,李治軍,等.黑龍江流域水文地理研究綜述[J].地理學(xué)報,2015,70(11):1823-1834.
[13] 沈其君.SAS統(tǒng)計分析[M].南京:東南大學(xué)出版社,2001.
[14] 李展,彭進業(yè),溫超.基于EMD 距離的多示例聚類[J].計算機科學(xué),2011,38(7):235-239.
[15] 于洋,衛(wèi)偉,陳利頂,等.黃土高原年均降水量空間插值及其方法比較[J].應(yīng)用生態(tài)學(xué)報,2015,26(4):999-1006.
[16] 段平,盛業(yè)華,張思陽,等.顧及異向性的局部徑向基函數(shù)三維空間插值[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2015,40(5):632-637.
A method for estimating wind resource distribution based on
interpolation by radial basis functions
LIU Wei,XIA Xue,LI Shuyue,WANG Yu,XU Zinuo
(School of Mathematics,Hohai University,Nanjing 210098,China)
Abstract
The distribution information of wind resources holds significant value in fields such as wind power generation and sustainable development.Based on the daily average wind speed data from 23 meteorological stations in northwest of Heilongjiang Province over a 30-year period (1989 to 2018),station classification was performed using the correlation coefficient and EMD as clustering indicators.The optimal clustering was determined through an "F -test.For interpolating measurement points,appropriate stations from different categories were selected and combined with radial basis function (RBF) interpolation to construct a wind speed interpolation model based on wind speed correlation.The interpolation accuracy was evaluated and compared using mean square error (MSE) and the coefficient of determination ( R 2) with different interpolation models.The results show that within a certain distance range,the correlation between wind speeds at different stations generally decreases as the distance increases.Compared with other interpolation models and ungrouped direct interpolation methods,the constructed wind speed interpolation model demonstrates better interpolation effect and improved accuracy.The average MSE decreases to 0.157 6 m/s and "R 2 increases to 0.903 9.
Key words
Spatial interpolation;Radial basis function interpolation;EMD;Wind field
(本文責(zé)編:毛鴻艷)