余聶芳
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過對生物神經(jīng)系統(tǒng)的模擬,憑借自適應(yīng)學(xué)習(xí)以及自動處理等功能,可達(dá)到預(yù)期目的。脫機(jī)手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對脫機(jī)手寫漢字進(jìn)行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進(jìn)行了改進(jìn),取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進(jìn) 脫機(jī)手寫漢字識別 誤差函數(shù)
中圖分類號:TP183 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識別;第二種是手寫漢字,分聯(lián)機(jī)手寫和脫機(jī)手寫兩類,前者準(zhǔn)確率較高,后者則偏低,是當(dāng)前的研究重點。作為模式識別的重要組成部分,漢字識別技術(shù)應(yīng)用廣泛,但由于涉及圖像處理、人工智能、計算機(jī)、數(shù)字信號處理等多種技術(shù),加上漢字的復(fù)雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來的,通過對生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡單元件連接構(gòu)成,具有非線性和容錯性,從能力特征來講,具有自適應(yīng)和自組織性。其優(yōu)勢主要體現(xiàn)在:能夠模仿人腦進(jìn)行聯(lián)想記憶;對存儲的信息進(jìn)行分類識別;能夠自動總結(jié)歸納經(jīng)驗。在長期的實踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語音處理、機(jī)器人研究、模式識別等諸多領(lǐng)域都有廣泛應(yīng)用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機(jī)器學(xué)習(xí)能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進(jìn)行反向傳遞、修正誤差,通過結(jié)構(gòu)和權(quán)值將頗為復(fù)雜的非線性映射關(guān)系表達(dá)出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進(jìn)系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進(jìn)行處理,主要是加權(quán)求和、激勵函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過內(nèi)部逐層處理,傳到輸出層,將實際的輸出值和預(yù)期值相比,若超過了規(guī)定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應(yīng)的權(quán)值進(jìn)行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識別中的實際應(yīng)用
2.1 缺陷
(1)站在數(shù)學(xué)的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線性優(yōu)化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進(jìn)行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復(fù)雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點
在確定訓(xùn)練集之后,輸入層和輸出層的結(jié)點數(shù)目也相應(yīng)的確定下來,然而中間層及選取層內(nèi)結(jié)點時,缺乏足夠的理論作指導(dǎo),中間層的結(jié)點數(shù)直接影響著網(wǎng)絡(luò)的學(xué)習(xí)效率和復(fù)雜程度,因此,在選取中間層變得結(jié)點時,也應(yīng)做一定的改進(jìn),積極建立相關(guān)的指導(dǎo)理論。
3 結(jié)語
針對脫機(jī)手寫漢字識別技術(shù)存在的難度,可運用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實際應(yīng)用中,收斂速度過慢以及局部最小點問題對BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵函數(shù)、誤差函數(shù)等方面對其算法加以改進(jìn),以達(dá)到提升脫機(jī)手寫漢字識別速度和精確度的目的。
參考文獻(xiàn)
[1] 張中.漢字識別技術(shù)綜述[J].語言文學(xué)應(yīng)用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及其在手寫體漢字識別中的應(yīng)用[J].江西師范大學(xué)學(xué)報,2009,33(5):598-603.endprint
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過對生物神經(jīng)系統(tǒng)的模擬,憑借自適應(yīng)學(xué)習(xí)以及自動處理等功能,可達(dá)到預(yù)期目的。脫機(jī)手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對脫機(jī)手寫漢字進(jìn)行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進(jìn)行了改進(jìn),取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進(jìn) 脫機(jī)手寫漢字識別 誤差函數(shù)
中圖分類號:TP183 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識別;第二種是手寫漢字,分聯(lián)機(jī)手寫和脫機(jī)手寫兩類,前者準(zhǔn)確率較高,后者則偏低,是當(dāng)前的研究重點。作為模式識別的重要組成部分,漢字識別技術(shù)應(yīng)用廣泛,但由于涉及圖像處理、人工智能、計算機(jī)、數(shù)字信號處理等多種技術(shù),加上漢字的復(fù)雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來的,通過對生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡單元件連接構(gòu)成,具有非線性和容錯性,從能力特征來講,具有自適應(yīng)和自組織性。其優(yōu)勢主要體現(xiàn)在:能夠模仿人腦進(jìn)行聯(lián)想記憶;對存儲的信息進(jìn)行分類識別;能夠自動總結(jié)歸納經(jīng)驗。在長期的實踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語音處理、機(jī)器人研究、模式識別等諸多領(lǐng)域都有廣泛應(yīng)用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機(jī)器學(xué)習(xí)能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進(jìn)行反向傳遞、修正誤差,通過結(jié)構(gòu)和權(quán)值將頗為復(fù)雜的非線性映射關(guān)系表達(dá)出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進(jìn)系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進(jìn)行處理,主要是加權(quán)求和、激勵函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過內(nèi)部逐層處理,傳到輸出層,將實際的輸出值和預(yù)期值相比,若超過了規(guī)定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應(yīng)的權(quán)值進(jìn)行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識別中的實際應(yīng)用
2.1 缺陷
(1)站在數(shù)學(xué)的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線性優(yōu)化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進(jìn)行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復(fù)雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點
在確定訓(xùn)練集之后,輸入層和輸出層的結(jié)點數(shù)目也相應(yīng)的確定下來,然而中間層及選取層內(nèi)結(jié)點時,缺乏足夠的理論作指導(dǎo),中間層的結(jié)點數(shù)直接影響著網(wǎng)絡(luò)的學(xué)習(xí)效率和復(fù)雜程度,因此,在選取中間層變得結(jié)點時,也應(yīng)做一定的改進(jìn),積極建立相關(guān)的指導(dǎo)理論。
3 結(jié)語
針對脫機(jī)手寫漢字識別技術(shù)存在的難度,可運用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實際應(yīng)用中,收斂速度過慢以及局部最小點問題對BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵函數(shù)、誤差函數(shù)等方面對其算法加以改進(jìn),以達(dá)到提升脫機(jī)手寫漢字識別速度和精確度的目的。
參考文獻(xiàn)
[1] 張中.漢字識別技術(shù)綜述[J].語言文學(xué)應(yīng)用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及其在手寫體漢字識別中的應(yīng)用[J].江西師范大學(xué)學(xué)報,2009,33(5):598-603.endprint
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過對生物神經(jīng)系統(tǒng)的模擬,憑借自適應(yīng)學(xué)習(xí)以及自動處理等功能,可達(dá)到預(yù)期目的。脫機(jī)手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對脫機(jī)手寫漢字進(jìn)行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進(jìn)行了改進(jìn),取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進(jìn) 脫機(jī)手寫漢字識別 誤差函數(shù)
中圖分類號:TP183 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識別;第二種是手寫漢字,分聯(lián)機(jī)手寫和脫機(jī)手寫兩類,前者準(zhǔn)確率較高,后者則偏低,是當(dāng)前的研究重點。作為模式識別的重要組成部分,漢字識別技術(shù)應(yīng)用廣泛,但由于涉及圖像處理、人工智能、計算機(jī)、數(shù)字信號處理等多種技術(shù),加上漢字的復(fù)雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來的,通過對生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡單元件連接構(gòu)成,具有非線性和容錯性,從能力特征來講,具有自適應(yīng)和自組織性。其優(yōu)勢主要體現(xiàn)在:能夠模仿人腦進(jìn)行聯(lián)想記憶;對存儲的信息進(jìn)行分類識別;能夠自動總結(jié)歸納經(jīng)驗。在長期的實踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語音處理、機(jī)器人研究、模式識別等諸多領(lǐng)域都有廣泛應(yīng)用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機(jī)器學(xué)習(xí)能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進(jìn)行反向傳遞、修正誤差,通過結(jié)構(gòu)和權(quán)值將頗為復(fù)雜的非線性映射關(guān)系表達(dá)出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進(jìn)系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進(jìn)行處理,主要是加權(quán)求和、激勵函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過內(nèi)部逐層處理,傳到輸出層,將實際的輸出值和預(yù)期值相比,若超過了規(guī)定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應(yīng)的權(quán)值進(jìn)行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識別中的實際應(yīng)用
2.1 缺陷
(1)站在數(shù)學(xué)的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線性優(yōu)化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進(jìn)行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復(fù)雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點
在確定訓(xùn)練集之后,輸入層和輸出層的結(jié)點數(shù)目也相應(yīng)的確定下來,然而中間層及選取層內(nèi)結(jié)點時,缺乏足夠的理論作指導(dǎo),中間層的結(jié)點數(shù)直接影響著網(wǎng)絡(luò)的學(xué)習(xí)效率和復(fù)雜程度,因此,在選取中間層變得結(jié)點時,也應(yīng)做一定的改進(jìn),積極建立相關(guān)的指導(dǎo)理論。
3 結(jié)語
針對脫機(jī)手寫漢字識別技術(shù)存在的難度,可運用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實際應(yīng)用中,收斂速度過慢以及局部最小點問題對BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵函數(shù)、誤差函數(shù)等方面對其算法加以改進(jìn),以達(dá)到提升脫機(jī)手寫漢字識別速度和精確度的目的。
參考文獻(xiàn)
[1] 張中.漢字識別技術(shù)綜述[J].語言文學(xué)應(yīng)用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進(jìn)及其在手寫體漢字識別中的應(yīng)用[J].江西師范大學(xué)學(xué)報,2009,33(5):598-603.endprint