李亞麗,黃少平,鞠曉慧
(1.陜西省氣象信息中心,陜西 西安 710014;2.陜西省氣象局秦嶺和黃土高原生態(tài)環(huán)境氣象重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710016;3.江西省氣象信息中心,江西 南昌 330046;4.國(guó)家氣象信息中心,北京 100081)
氣象資料是大氣科學(xué)學(xué)科發(fā)展的基礎(chǔ),無(wú)論對(duì)天氣預(yù)報(bào)、科學(xué)研究、防災(zāi)減災(zāi),還是對(duì)全球氣候變化問(wèn)題等國(guó)家方針政策的制定,都至關(guān)重要。自古以來(lái),人們便對(duì)氣象信息及規(guī)律進(jìn)行觀測(cè)和記載,形成了寶貴的氣候資料,眾多科學(xué)家應(yīng)用這些龐大而系統(tǒng)的氣候資料開(kāi)展氣候研究,氣候資料的指導(dǎo)性激發(fā)了許多新發(fā)現(xiàn)和對(duì)機(jī)理的新認(rèn)識(shí)。科技的進(jìn)步推動(dòng)著氣象觀測(cè)的變革,在地面氣象觀測(cè)自動(dòng)化之前,全國(guó)2 400多個(gè)氣象站自20世紀(jì)60年代使用降水、風(fēng)、氣溫等各類(lèi)自記儀器進(jìn)行小時(shí)乃至分鐘尺度的氣象要素觀測(cè),共積累了40多年約2 000多萬(wàn)頁(yè)的風(fēng)自記紙。
圖像處理和模式識(shí)別技術(shù)的發(fā)展,為降水、風(fēng)等氣象要素自記紙?zhí)峁┝擞行У臄?shù)字化處理手段,高時(shí)空分辨率的氣候資料必將為探尋極端天氣事件成因以及理解氣候長(zhǎng)期變化趨勢(shì)原因提供有利條件。王伯民等人采用圖像掃描和曲線(xiàn)跟蹤技術(shù),研發(fā)降水自記紙彩色掃描數(shù)字化處理系統(tǒng),通過(guò)人機(jī)交互的方式提取全國(guó)降水自記紙曲線(xiàn)數(shù)據(jù),建立了中國(guó)地面氣象站長(zhǎng)序列、高質(zhì)量的分鐘和小時(shí)降水文件數(shù)據(jù)集,數(shù)據(jù)成果應(yīng)用于各地的暴雨強(qiáng)度公式的研制,城市內(nèi)澇防治等方面?;诨叶确e分投影的分段線(xiàn)性插值算法對(duì)風(fēng)速曲線(xiàn)進(jìn)行重構(gòu),基于方向?yàn)V波的風(fēng)向風(fēng)速自記紙數(shù)字化算法實(shí)現(xiàn)風(fēng)向風(fēng)速自記紙圖像的坐標(biāo)線(xiàn)以及風(fēng)向風(fēng)速曲線(xiàn)的提取和量化,為風(fēng)自記紙圖像的跡線(xiàn)識(shí)別與數(shù)據(jù)提取做出了有益的嘗試和探索。
隨著數(shù)字化技術(shù)的發(fā)展,通過(guò)計(jì)算圖像的某個(gè)特征值(梯度或灰度),然后依據(jù)給定的特征值控制閾值對(duì)圖像信息進(jìn)行處理,實(shí)現(xiàn)圖像目標(biāo)邊緣的精確定位成為數(shù)字圖像處理技術(shù)的主要內(nèi)容。Canny邊緣檢測(cè)法因其具有定位精度高、信噪比高以及單邊緣響應(yīng)等優(yōu)點(diǎn)得到了廣泛應(yīng)用。但傳統(tǒng)的Canny算子因高低閾值比例固定,且需要根據(jù)檢測(cè)圖像的具體情況手動(dòng)設(shè)置,在實(shí)際應(yīng)用中效率較低,難以實(shí)現(xiàn)自動(dòng)實(shí)時(shí)的檢測(cè)。由日本學(xué)者大津提出的最大類(lèi)間方差法(后簡(jiǎn)稱(chēng)Otsu算法)是一種自適應(yīng)的閾值確定方法,根據(jù)圖像的灰度特性,將圖像分成背景和目標(biāo)兩部分,通過(guò)遍歷尋找某一閾值使得背景和目標(biāo)之間的類(lèi)間方差達(dá)到最大值,即最佳分割閾值。將Otsu算法的思想應(yīng)用于Canny算子中,可實(shí)現(xiàn)Canny的高低閾值自適應(yīng)選取,從而實(shí)現(xiàn)圖像邊緣的自適應(yīng)提取,可以應(yīng)用于需要快速自動(dòng)提取圖像邊緣的場(chǎng)合。
該文介紹了應(yīng)用基于Otsu算法改進(jìn)的Canny邊緣檢測(cè)方法完成風(fēng)自記紙圖像的傾斜校正、坐標(biāo)線(xiàn)及風(fēng)速風(fēng)向跡線(xiàn)的識(shí)別和提取的算法,并根據(jù)《地面氣象觀測(cè)規(guī)范》和國(guó)標(biāo)《地面氣象觀測(cè)規(guī)范-風(fēng)向和風(fēng)速》中EL型電接風(fēng)儀器觀測(cè)原理和自記紙記錄整理要求,以及氣象行業(yè)標(biāo)準(zhǔn)《風(fēng)自記紙記錄數(shù)字化 EL型》中風(fēng)自記紙記錄提取的要求,設(shè)計(jì)研發(fā)的EL型電接風(fēng)自記紙跡線(xiàn)數(shù)據(jù)提取軟件系統(tǒng)的設(shè)計(jì)思路、處理流程和主要功能。該系統(tǒng)于2020年投入全國(guó)氣象部門(mén)應(yīng)用,目前已完成500多站EL型電接風(fēng)自記紙跡線(xiàn)數(shù)據(jù)的提取。并通過(guò)比較地面氣象月報(bào)表A/A6/A7文件中人工整理的小時(shí)和日最大風(fēng)速風(fēng)向(后文簡(jiǎn)稱(chēng)“原風(fēng)”)與利用EL型電接風(fēng)自記紙跡線(xiàn)數(shù)據(jù)提取軟件系統(tǒng)提取的風(fēng)向風(fēng)速數(shù)據(jù)(后文簡(jiǎn)稱(chēng)“新風(fēng)”),分析系統(tǒng)識(shí)別提取的風(fēng)數(shù)據(jù)的質(zhì)量和精度,以期為新風(fēng)記錄的使用、歷史長(zhǎng)序列分鐘/小時(shí)風(fēng)數(shù)據(jù)集的建立提供有價(jià)值的參考意見(jiàn)。
EL型電接風(fēng)自記紙(后文簡(jiǎn)稱(chēng)“風(fēng)自記紙”)是由橫縱坐標(biāo)線(xiàn)組成的網(wǎng)格圖,時(shí)間跨度1 480 min,每10 min一條豎線(xiàn)(風(fēng)向區(qū))或弧線(xiàn)(風(fēng)速區(qū))。一張紙上有4條風(fēng)向曲線(xiàn),每一條風(fēng)向曲線(xiàn)由一條風(fēng)向橫線(xiàn)作為判定風(fēng)向的參照線(xiàn),某一時(shí)刻風(fēng)向的判別由此時(shí)刻風(fēng)向豎線(xiàn)相對(duì)于風(fēng)向橫線(xiàn)的位置決定,分別用來(lái)判斷南/北、東北/西南、東/西、東南/西北,風(fēng)向記錄以方位為單位,按文獻(xiàn)[20]中表1的要求記錄對(duì)應(yīng)的風(fēng)向符號(hào)。風(fēng)速測(cè)量以m/s為單位,最小刻度范圍為1.0 m/s。
根據(jù)EL型電接風(fēng)向風(fēng)速計(jì)測(cè)量原理,風(fēng)速是按空氣行程200 m,風(fēng)速自記筆尖相應(yīng)跳動(dòng)1次來(lái)記錄的。如10 min內(nèi)跳動(dòng)1次,風(fēng)速為0.3 m/s(即200 m/600 s),跳動(dòng)2次,風(fēng)速為0.7 m/s(即400 m/600 s),跳動(dòng)3次在自記紙上移動(dòng)一格,表示10 min平均風(fēng)速1.0 m/s(即600 m/600 s)。因此,風(fēng)速保留1位小數(shù),小數(shù)位只能取0、3、7。靜風(fēng)時(shí),風(fēng)速跡線(xiàn)劃平線(xiàn),風(fēng)速記為0.0 m/s。每2.5 min記錄一次瞬時(shí)風(fēng)向。
EL型電接風(fēng)自記紙跡線(xiàn)數(shù)據(jù)提取軟件系統(tǒng)設(shè)計(jì)的基本思路:利用基于Otsu算法的Canny邊緣檢測(cè)方法對(duì)風(fēng)自記紙圖像文件進(jìn)行預(yù)處理、識(shí)別并自動(dòng)跟蹤風(fēng)向風(fēng)速網(wǎng)格和跡線(xiàn),提取出網(wǎng)格和跡線(xiàn)的坐標(biāo)點(diǎn)等參數(shù),形成跡線(xiàn)坐標(biāo)數(shù)據(jù)文件,依據(jù)《風(fēng)自記紙記錄數(shù)字化 EL型》中單位時(shí)間風(fēng)速風(fēng)向計(jì)算算法,將跡線(xiàn)坐標(biāo)數(shù)據(jù)轉(zhuǎn)換生成標(biāo)準(zhǔn)的風(fēng)分鐘/小時(shí)數(shù)據(jù)文件。
首先,完成包括輸入/出文件路徑配置、提取數(shù)據(jù)線(xiàn)型和顏色配置、提取節(jié)點(diǎn)稀疏閾值設(shè)定、跡線(xiàn)范圍等“系統(tǒng)設(shè)置”,通過(guò)“圖像管理”完成臺(tái)站信息管理;其次,在對(duì)文件名、文件可讀性以及連續(xù)性等進(jìn)行檢查和圖像傾斜變形校正、圖像增強(qiáng)等預(yù)處理的同時(shí),將掃描的風(fēng)自記紙圖像文件導(dǎo)入系統(tǒng);接著(圖1),通過(guò)批量自動(dòng)處理或單張?zhí)幚矸绞?,添加或打開(kāi)圖像文件,設(shè)置圖像網(wǎng)格和自記跡線(xiàn)開(kāi)始(結(jié)束)時(shí)間;識(shí)別并自動(dòng)提取風(fēng)向風(fēng)速網(wǎng)格和跡線(xiàn),通過(guò)人機(jī)交互方式回放檢查、修正完成風(fēng)自記紙記錄提取;最后,根據(jù)2.2章節(jié)中風(fēng)速風(fēng)向的計(jì)算算法,將提取到的跡線(xiàn)坐標(biāo)數(shù)據(jù)轉(zhuǎn)換生成分鐘、小時(shí)數(shù)據(jù);對(duì)數(shù)據(jù)進(jìn)行完整性、邏輯性檢查后轉(zhuǎn)換生成標(biāo)準(zhǔn)格式的分鐘/小時(shí)風(fēng)數(shù)據(jù)文件。
圖1 系統(tǒng)風(fēng)自記紙數(shù)字化處理流程
系統(tǒng)包括系統(tǒng)管理、圖像管理、曲線(xiàn)提取和數(shù)據(jù)轉(zhuǎn)換4個(gè)模塊,實(shí)現(xiàn)的功能主要包括臺(tái)站信息、圖像文件和A文件等導(dǎo)入和系統(tǒng)參數(shù)配置,圖像文件預(yù)處理,單張或批量處理的風(fēng)向風(fēng)速網(wǎng)格和跡線(xiàn)的識(shí)別提取,跡線(xiàn)識(shí)別效果的回放檢查,風(fēng)分鐘/小時(shí)數(shù)據(jù)文件轉(zhuǎn)換生成和數(shù)據(jù)質(zhì)量檢查等。同時(shí),通過(guò)調(diào)研全國(guó)風(fēng)自記紙的共性和特性,對(duì)存在的風(fēng)速跡線(xiàn)邁大(小)步(風(fēng)速筆尖正常跳動(dòng)1次跡線(xiàn)上升或下降超過(guò)(或不足)1/3格)、同一張紙內(nèi)風(fēng)速跡線(xiàn)不連續(xù)或時(shí)間重疊的跡線(xiàn)中斷等情況,提供操作便捷的人工編輯功能。
系統(tǒng)在對(duì)圖像進(jìn)行處理的過(guò)程中主要采用Canny邊緣檢測(cè)算法對(duì)圖像進(jìn)行邊緣檢測(cè);利用Otsu算法計(jì)算圖像分割的最佳閾值,以實(shí)現(xiàn)圖像邊緣的自適應(yīng)提??;通過(guò)Radon變換技術(shù)求解圖像的旋轉(zhuǎn)角度并對(duì)圖像進(jìn)行傾斜校正,這些圖像處理技術(shù)文中不再詳述。
2.1.1 圖像預(yù)處理
圖像預(yù)處理主要是對(duì)圖像進(jìn)行尺寸、分辨率調(diào)整,以及糾偏、去污等預(yù)處理。首先,將讀入的彩色風(fēng)自記圖片轉(zhuǎn)成灰度圖;然后使用Canny邊緣檢測(cè)方法提取灰度圖中畫(huà)面的邊緣,得到網(wǎng)格邊緣的二值圖;最后,通過(guò)Radon變換對(duì)二值圖進(jìn)行斜率計(jì)算,在(-3,3)的角度范圍內(nèi)旋轉(zhuǎn),進(jìn)行圖像校正并填充邊緣。
2.1.2 風(fēng)速風(fēng)向網(wǎng)格提取
以風(fēng)速網(wǎng)格提取為例:第一步,將風(fēng)自記紙圖片進(jìn)行顏色空間的轉(zhuǎn)換,從BGR轉(zhuǎn)到CMYK。轉(zhuǎn)換后,Y(Yellow)是包含了網(wǎng)格的灰度圖,K(blacK)是包含了跡線(xiàn)的灰度圖,用Y減K(Y-K)去除跡線(xiàn)的干擾,得到網(wǎng)格的灰度圖,提取灰度圖下部的40%為風(fēng)速區(qū)域的灰度圖。第二步,用Otsu算法對(duì)風(fēng)速區(qū)域的灰度圖進(jìn)行二值化,得到網(wǎng)格的二值圖,白點(diǎn)處為網(wǎng)格。第三步,設(shè)某行(列)白點(diǎn)數(shù)最大分別為maxR或maxL,統(tǒng)計(jì)每行(列)白點(diǎn)的數(shù)目。如果在某一行(列),它的白點(diǎn)數(shù)目大于maxR*0.5或maxL*0.5,且比臨近的行(列)的白點(diǎn)數(shù)目多,那么此行(列)可能就是風(fēng)速網(wǎng)格中的某條橫線(xiàn)(縱線(xiàn))所在的位置。第四步,根據(jù)風(fēng)自記紙的特征,對(duì)上面求出的橫線(xiàn)和縱線(xiàn)進(jìn)行過(guò)濾,去除不合理的網(wǎng)格橫線(xiàn)和縱線(xiàn)。當(dāng)橫線(xiàn)和縱線(xiàn)組成的矩形,寬度大于整個(gè)自記紙圖片的寬度的60%,高度大于整個(gè)圖片的20%,則風(fēng)速網(wǎng)格邊框提取成功。當(dāng)橫線(xiàn)為21條,弧線(xiàn)為148條時(shí),則風(fēng)速網(wǎng)格提取成功。當(dāng)風(fēng)速網(wǎng)格邊框與風(fēng)向網(wǎng)格邊框基本左右對(duì)齊,則自記紙網(wǎng)格邊框提取成功。
2.1.3 風(fēng)速風(fēng)向跡線(xiàn)提取
以風(fēng)速跡線(xiàn)提取為例:第一步,將風(fēng)自記紙圖片顏色空間從BGR轉(zhuǎn)換到CMYK,用K-(Y-K)去除網(wǎng)格的干擾,得到跡線(xiàn)的灰度圖,提取灰度圖下部的40%,得到風(fēng)速區(qū)域的灰度圖。第二步,用Otsu算法對(duì)風(fēng)速區(qū)域的灰度圖進(jìn)行二值化,得到風(fēng)速跡線(xiàn)的二值圖,白點(diǎn)處為跡線(xiàn)。第三步,針對(duì)風(fēng)速跡線(xiàn)的二值圖,首先去除噪音和不合理的線(xiàn)段;其次進(jìn)行兩次二值圖膨脹連接間距小的線(xiàn)段;然后連接距離小于r
的線(xiàn)段(r
為圖片的寬度/148),保留寬度大于s
的線(xiàn)段(s
為圖片的寬度/24),刪除其余的線(xiàn)段,得到最終的風(fēng)速跡線(xiàn)二值圖;最后采取張氏細(xì)化算法對(duì)風(fēng)速線(xiàn)二值圖進(jìn)行細(xì)化,對(duì)細(xì)化線(xiàn)進(jìn)行去毛刺處理。第四步,遍歷細(xì)化后的風(fēng)速線(xiàn),記錄坐標(biāo)點(diǎn)列表,然后針對(duì)坐標(biāo)點(diǎn)列表依次進(jìn)行稀疏化、單調(diào)性、峰值谷值等調(diào)整,得到最終的坐標(biāo)點(diǎn)列表。2.2.1 風(fēng) 速
因風(fēng)自記紙年代久遠(yuǎn),部分紙張風(fēng)速跡線(xiàn)模糊,試驗(yàn)表明,與按人工整理記錄的“數(shù)跳”方法比較,利用“高度差”所計(jì)算的風(fēng)速數(shù)據(jù)準(zhǔn)確性更高。因此,系統(tǒng)采用計(jì)算高度差的方法計(jì)算風(fēng)速,具體如下:通過(guò)風(fēng)速跡線(xiàn)與風(fēng)速網(wǎng)格求交,獲取每一時(shí)刻的交點(diǎn)坐標(biāo)。以10 min為單位時(shí)間,將每10 min的風(fēng)速細(xì)化跡線(xiàn)的縱坐標(biāo)位置求差,并取其絕對(duì)值,然后除以網(wǎng)格分辨率得到當(dāng)前時(shí)刻T
分鐘的10 min滑動(dòng)平均風(fēng)速值。即假設(shè)在時(shí)間t
時(shí),交點(diǎn)坐標(biāo)為(x
,y
),在t
前10 min的時(shí)刻t
交點(diǎn)的坐標(biāo)為(x
,y
)。設(shè)t
<t
<t
,且t
時(shí)刻對(duì)應(yīng)的交點(diǎn)為(x
,y
),那么高度差h
=max(|y
-y
(t
)|+|y
-y
(t
)|)。設(shè)風(fēng)速網(wǎng)格的高度為H
,則風(fēng)速網(wǎng)格的高度分辨率為w
=H
/20,于是風(fēng)速v
=h
/w
。若小數(shù)部分≥1/6且<1/2,小數(shù)位記為3;若小數(shù)部分≥1/2且<5/6,小數(shù)位記為7;其他情況為0。2.2.2 風(fēng) 向
與T
時(shí)刻風(fēng)速相對(duì)應(yīng)的10 min內(nèi),以風(fēng)自記紙上提取到的每一條風(fēng)向橫線(xiàn)為時(shí)間軸,以風(fēng)向豎線(xiàn)的時(shí)間間隔(2.5 min)為步長(zhǎng),對(duì)識(shí)別出的4條風(fēng)向橫線(xiàn)和多條風(fēng)向豎線(xiàn),挑取出現(xiàn)次數(shù)最多的風(fēng)向?yàn)楫?dāng)前時(shí)刻T
分鐘的風(fēng)向,T
分鐘的風(fēng)向?yàn)榘?p>T分鐘在內(nèi)的前10 min的最多風(fēng)向,其挑選方法與文獻(xiàn)[20]中挑取各正點(diǎn)10 min最多風(fēng)向的步驟相同。T
分鐘風(fēng)速為0.0 m/s時(shí),風(fēng)向?yàn)殪o風(fēng)。2.2.3 小時(shí)和日最大風(fēng)速風(fēng)向
以每小時(shí)整點(diǎn)00分的風(fēng)速風(fēng)向數(shù)據(jù)作為該小時(shí)的風(fēng)速風(fēng)向。以20時(shí)為日界,從每日20:01到次日20:00的分鐘風(fēng)速記錄中比較挑選出最大值作為該日日最大風(fēng)速,并以此風(fēng)速相對(duì)應(yīng)的風(fēng)向及時(shí)間作為日最大風(fēng)速的風(fēng)向及出現(xiàn)時(shí)間。當(dāng)日最大風(fēng)速出現(xiàn)兩次或以上相同時(shí),可任選其中一次的風(fēng)向和時(shí)間。日最大風(fēng)速可跨日、跨月、跨年挑取,但只能上跨。
隨機(jī)挑選榆林、呼中、茫崖、大同、無(wú)棣、林芝、萍鄉(xiāng)等7站約15 000張風(fēng)自記紙跡線(xiàn)提取數(shù)據(jù),將原風(fēng)記錄視為“真值”,計(jì)算新風(fēng)與原風(fēng)記錄的小時(shí)和日最大風(fēng)速的平均偏差、平均絕對(duì)偏差、均方根誤差及風(fēng)向相符率,對(duì)比分析兩者差異,評(píng)估提取數(shù)據(jù)的精度和質(zhì)量,對(duì)評(píng)估結(jié)果中差異較大的數(shù)據(jù)通過(guò)分類(lèi)比較、個(gè)例分析等方法,查找總結(jié)造成差異的可能原因。文中“偏差”和“絕對(duì)偏差”,均為新風(fēng)速減去原風(fēng)速值,并按16方位定量評(píng)價(jià)風(fēng)向相符率,當(dāng)兩風(fēng)向方位差在±一個(gè)方位以?xún)?nèi)時(shí),則認(rèn)為兩者相符。即:風(fēng)向相符率=風(fēng)向相符次數(shù)/對(duì)比總次數(shù)*100%。
通過(guò)新風(fēng)與原風(fēng)日最大風(fēng)與小時(shí)風(fēng)記錄對(duì)比(表1)分析發(fā)現(xiàn),平均來(lái)看,新日最大風(fēng)速大于原日最大風(fēng)速,平均偏差在0.01~0.33 m/s之間,平均絕對(duì)偏差在0.28~0.57 m/s之間,均方根誤差在0.43~0.96 m/s之間,風(fēng)向相符率為79.7%~89.6%。小時(shí)風(fēng)平均偏差在-0.08~0.01 m/s之間,平均絕對(duì)偏差0.13~0.22 m/s之間,均方根誤差在0.23~0.84 m/s之間,風(fēng)向相符率90.1%~99.9%。比較而言,新風(fēng)與原風(fēng)兩者之間差異小時(shí)風(fēng)明顯小于日最大風(fēng),風(fēng)速偏差更小,風(fēng)向相符率更高。
表1 日最大/小時(shí)風(fēng)速風(fēng)向?qū)Ρ?/p>以榆林站為例,設(shè)原風(fēng)速為
v
,分v
<3.0 m/s、3.0≤v
<7.0 m/s和v
≥7.0 m/s三個(gè)等級(jí)對(duì)比(表略)發(fā)現(xiàn),無(wú)論日最大風(fēng)還是小時(shí)風(fēng)均表現(xiàn)出隨著風(fēng)速本身的增大,新風(fēng)與原風(fēng)兩者間風(fēng)速偏差變大,而風(fēng)向相符率提高的現(xiàn)象。除原風(fēng)風(fēng)速由人工“數(shù)跳”、新風(fēng)利用“高度差”計(jì)算所得有所區(qū)別外,對(duì)于風(fēng)自記紙記錄,無(wú)論是早期人工整理還是現(xiàn)今使用跡線(xiàn)數(shù)據(jù)提取軟件系統(tǒng)自動(dòng)提取,均容易受到自記跡線(xiàn)模糊、粗細(xì)不均、中斷、墨跡污染等紙張質(zhì)量因素的影響。A文件中人工整理所得風(fēng)自記紙記錄因受觀測(cè)員個(gè)人視力、習(xí)慣、采樣時(shí)間不一致等影響,容易造成隨機(jī)誤差,而跡線(xiàn)數(shù)據(jù)提取軟件系統(tǒng)采用統(tǒng)一的技術(shù)標(biāo)準(zhǔn),計(jì)算精度高,系統(tǒng)誤差穩(wěn)定可控,數(shù)據(jù)的準(zhǔn)確性和可靠性更高,長(zhǎng)時(shí)間保存造成的紙張泛黃變色、潮濕或掃描變形對(duì)現(xiàn)今的跡線(xiàn)識(shí)別提取影響更大,這與文獻(xiàn)[23]中“讀取風(fēng)向錯(cuò)誤主要與圖像中跡線(xiàn)的清晰程度有較大的關(guān)系,圖像跡線(xiàn)越清晰軟件讀取正確率越高,且正確率優(yōu)于人工讀取”的結(jié)論一致。
1971~2004年榆林站新風(fēng)與原風(fēng)小時(shí)風(fēng)速的平均偏差和絕對(duì)偏差有隨時(shí)間逐漸變小的趨勢(shì)(見(jiàn)圖2),年平均偏差和絕對(duì)偏差分別在-0.19~0.0 m/s和0.12~0.23 m/s之間波動(dòng),20世紀(jì)70年代明顯大于1980年以后,直到2004年風(fēng)自記紙記錄僅作為臺(tái)站平行觀測(cè)記錄處理,偏差略有變大,也側(cè)面反映了紙張質(zhì)量、人工整理等因素對(duì)數(shù)據(jù)質(zhì)量的影響。
圖2 榆林站1971~2004年小時(shí)風(fēng)速的平均偏差、 絕對(duì)偏差和風(fēng)向相符率
該文簡(jiǎn)要介紹了EL型電接風(fēng)自記紙跡線(xiàn)數(shù)據(jù)提取軟件系統(tǒng)設(shè)計(jì)的基本思路、處理流程和主要功能,以及系統(tǒng)所采用的應(yīng)用Otsu算法改進(jìn)的Canny圖像邊緣檢測(cè)方法實(shí)現(xiàn)的跡線(xiàn)數(shù)據(jù)提取算法、風(fēng)向風(fēng)速數(shù)據(jù)計(jì)算算法,并通過(guò)比較A文件中人工整理的風(fēng)速風(fēng)向與利用軟件系統(tǒng)提取的風(fēng)數(shù)據(jù)之間的差異和分析差異原因,評(píng)估軟件提取數(shù)據(jù)的質(zhì)量和精度。應(yīng)用效果表明:系統(tǒng)對(duì)標(biāo)準(zhǔn)的EL型電接風(fēng)自記紙圖像識(shí)別率可達(dá)到100%,能夠滿(mǎn)足風(fēng)自記紙數(shù)字化對(duì)數(shù)據(jù)質(zhì)量和精度的要求。因?qū)Ρ确治鰯?shù)據(jù)樣本較少,尚不能全面代表風(fēng)自記紙跡線(xiàn)提取數(shù)據(jù)的質(zhì)量,有待在風(fēng)分鐘/小時(shí)標(biāo)準(zhǔn)數(shù)據(jù)集的制作過(guò)程中進(jìn)一步進(jìn)行質(zhì)量評(píng)估。