鄭忠明
摘 要 利用高斯模糊和差分金字塔生成圖像的方法增強數據,同等數量原始樣本條件下,提升了識別效率。采用異構計算支持FPGA板卡,對上述方法進行實現,進而形成了一套深度學習訓練樣本集生成系統(tǒng)。
關鍵詞 電力線巡檢;圖像識別;樣本增強
1背景
電力線巡檢應用中,采用直升機或者依托無人機攜帶光學攝像設備進行巡視已經得到普遍應用。在巡線過程中,檢測內容的尺度變化較大。例如,塔基完好程度是一個大尺度問題,而導線斷股等問題又是一個小尺度圖像的問題,如何在巡線中準確識別這些問題也是一個挑戰(zhàn)。另外,存在故障的節(jié)點畢竟是少數,很難得到大量圖片供深度學習訓練使用,采用數據增強豐富訓練集就成了一個必要的補充手段。所謂的數據增強( Data Augmentation )方法是指利用平移 、縮放、顏色等變躁,人工增大訓練集樣本的個數,從而獲得充足的訓練數據[1],使模型訓練的效果更好。典型的數據增強方法有翻轉(Flip),旋轉(Rotat ),縮放(Scale),隨機裁剪或補零(Random Crop or Pad),色彩抖動(Color jittering),加噪聲(Noise)等等。
2技術方案
2.1 基本思路
基于高斯金字塔和拉普拉斯金字塔進行數據增強的方法流程如下:
2.2 實現方法
以一個1024×1024的圖像為例,構建高斯金字塔。原則上,本方案設定128×128為最小輸入圖像。在電力巡線應用中,過小的圖像沒有工程意義。
第一組的第一層為原圖像,然后將圖像做一次高斯模糊,高斯平滑里有一個參數δ,δ值為1.6 。然后將δ乘一個比例系數k(k=1.2)作為新的平滑因子來平滑第一組第二層得到第三層,重復若干次,得到L層(L為6)他們分別對應的平滑參數為:0,δ,kδ,k2δ,k3δ, k4δ。
然后將最后一幅圖像做比例因子為2的降采樣得到第二組的第一層,然后對第二組的第一層做參數是δ的高斯平滑,對第二層做kδ的平滑得到第三層……這里一定注意:每組對應的平滑因子δ是一樣的。這樣反復形成了4組L層的高斯金字塔。
高斯金字塔構建成功后,將每一組相鄰的兩層相減就可以得到拉普拉斯金字塔。
3工程設計
在工程中,利用FPGA完整實現了上述基于高斯金字塔和拉普拉斯金字塔的數據增強算法。然后將FPGA與服務器集成,形成深度學習訓練集生成一體化設備。
通過使用PCI-E交換技術,主要計算放在各專用板卡上,數據在板卡間直接傳輸,減少對CPU的依賴。實現數據流的加速,而不是以CPU為核心的集中計算,減少通訊擁堵。
4結束語
在巡線過程中,檢測內容的尺度變化較大。例如,塔基完好程度是一個大尺度問題,而導線斷股等問題又是一個小尺度圖像的問題,如何在巡線中準確識別這些問題也是一個挑戰(zhàn)。高斯金字塔和拉普拉斯金字塔本身具有尺度特性,又對各種仿射變換適應能力強,可以明顯提升圖像興趣點識別的準確度。普適性的數據增強算法帶來的效果沒有本文方案的效果明顯。
參考文獻
[1] 周美麗,白宗文.基于Matlab的高斯模糊圖像去噪方法研究[J].電子設計工程,2014(19):167-168.