熊曉倩
摘 要:隨著科學(xué)技術(shù)的迅猛發(fā)展,信息技術(shù)水平顯著提升,人工智能誕生并且在社會(huì)多個(gè)領(lǐng)域得到廣泛應(yīng)用,對(duì)人們的生產(chǎn)生活都產(chǎn)生了較大的影響。在信息化時(shí)代背景下,人工智能機(jī)器作為智能化技術(shù)的產(chǎn)物,憑借自身獨(dú)特的特性得到人們高度關(guān)注。本文將對(duì)目前人工智能語(yǔ)言識(shí)別系統(tǒng)的研究現(xiàn)狀進(jìn)行分析,并對(duì)語(yǔ)言識(shí)別方式加以闡述。
關(guān)鍵詞:人工智能 語(yǔ)音識(shí)別方法 裝置系統(tǒng)
中圖分類(lèi)號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)01(c)-0017-02
隨著科學(xué)技術(shù)的不斷進(jìn)步,人類(lèi)已經(jīng)進(jìn)入到“智能時(shí)代”,機(jī)器學(xué)習(xí)屬于智能化領(lǐng)域中一個(gè)重點(diǎn)內(nèi)容?,F(xiàn)階段,人類(lèi)在語(yǔ)音識(shí)別、網(wǎng)絡(luò)搜索等方面都獲得了一定的成就。在人工智能的支持下,能夠?qū)崿F(xiàn)深度問(wèn)答、自動(dòng)駕駛等技術(shù)的使用,并且在發(fā)展過(guò)程中,已經(jīng)超出了人類(lèi)智能操作功能。在此背景下,應(yīng)在人工智能基礎(chǔ)上,加強(qiáng)對(duì)語(yǔ)言識(shí)別方式、裝置以及系統(tǒng)等研究。
1 目前人工智能語(yǔ)言識(shí)別系統(tǒng)的研究現(xiàn)狀
1956年,人工智能技術(shù)被發(fā)明出來(lái),引領(lǐng)科學(xué)界開(kāi)始了一場(chǎng)關(guān)于機(jī)器模擬智能的相關(guān)研討浪潮,而人工智能也作為一門(mén)新興學(xué)科,在社會(huì)多個(gè)領(lǐng)域中得到廣泛應(yīng)用,促進(jìn)著社會(huì)經(jīng)濟(jì)的進(jìn)步與發(fā)展,尤其是在語(yǔ)言識(shí)別系統(tǒng)的建設(shè)方面。
1.1 在理論研究方面
目前,隨著科學(xué)技術(shù)的迅猛發(fā)展,以往傳統(tǒng)的語(yǔ)音識(shí)別模式已經(jīng)難以符合當(dāng)代需求,雖然以往諸多智能設(shè)備中,都能夠安裝了語(yǔ)音識(shí)別軟件,可以實(shí)現(xiàn)人機(jī)對(duì)話功能,但在算法以及其他方面,語(yǔ)音識(shí)別技術(shù)的發(fā)展已經(jīng)進(jìn)入了瓶頸期,難以得到很大的突破。深度學(xué)習(xí)模型則能夠?qū)θ祟?lèi)大腦的學(xué)習(xí)和感知外界信息進(jìn)行模擬,在理論研究層面較為豐富和完善。但是,在實(shí)際運(yùn)用的過(guò)程中缺乏代表性產(chǎn)品。為了能夠真正實(shí)現(xiàn)理論與實(shí)踐的有機(jī)結(jié)合,使人們的現(xiàn)代化需求得到切實(shí)滿(mǎn)足,在日后對(duì)此方面的研究過(guò)程中,應(yīng)加強(qiáng)對(duì)語(yǔ)音信號(hào)產(chǎn)生、傳播等多個(gè)方面進(jìn)行綜合分析,進(jìn)而使此項(xiàng)技術(shù)得到全面發(fā)展。
1.2 在應(yīng)用研究方面
近年來(lái),互聯(lián)網(wǎng)得到了顯著的發(fā)展和壯大,使得我國(guó)社會(huì)開(kāi)始從信息時(shí)代邁進(jìn)智能時(shí)代,對(duì)于語(yǔ)言識(shí)別技術(shù)的研究將與時(shí)代的發(fā)展潮流充分符合,使人們能夠從眾多渠道和角度中獲得原始語(yǔ)音信息。以往對(duì)此方面的研究都只是單純地停留在算法方面,使得數(shù)據(jù)信息的作用難以得到充分發(fā)揮。深度學(xué)習(xí)理論將能夠?qū)崿F(xiàn)云計(jì)算與數(shù)據(jù)信息的有機(jī)結(jié)合,進(jìn)而對(duì)數(shù)據(jù)信息進(jìn)行直接識(shí)別,充分滿(mǎn)足了人員對(duì)語(yǔ)言數(shù)據(jù)的應(yīng)用需求,也使得語(yǔ)言識(shí)別系統(tǒng)得到更加良好的發(fā)展[1]。
2 人工智能基礎(chǔ)上的語(yǔ)音識(shí)別方法
2.1 語(yǔ)音拾取及特征提取
在對(duì)語(yǔ)音數(shù)據(jù)的拾取方面主要包括采樣和端點(diǎn)檢測(cè),其中,采樣主要是指通過(guò)聲卡的作用對(duì)語(yǔ)音信息進(jìn)行收集,然后將其轉(zhuǎn)變?yōu)閿?shù)字化的形式。而端點(diǎn)檢測(cè)主要是對(duì)語(yǔ)音的起點(diǎn)和終點(diǎn)進(jìn)行確定,屬于預(yù)處理中的關(guān)鍵內(nèi)容。在對(duì)語(yǔ)音信息進(jìn)行端點(diǎn)檢測(cè)時(shí),最常用的算法方式為能量與過(guò)零率相結(jié)合的方式。另外,在語(yǔ)音識(shí)別的過(guò)程中,一個(gè)十分重要的問(wèn)題就是特征的選擇,良好準(zhǔn)確地對(duì)特征進(jìn)行選取,能夠使語(yǔ)言之間產(chǎn)生區(qū)別,進(jìn)而對(duì)有用語(yǔ)音進(jìn)行采集,將無(wú)用信息進(jìn)行屏蔽。
2.2 模擬訓(xùn)練與語(yǔ)音識(shí)別
在此環(huán)節(jié)中主要包括兩個(gè)部分:第一,訓(xùn)練,即選取一種恰當(dāng)?shù)淖R(shí)別方式,采用訓(xùn)練以及聚類(lèi)的方式獲得該漢字的語(yǔ)言參數(shù),并且將其作為參考加以存儲(chǔ)。在識(shí)別系統(tǒng)中,應(yīng)對(duì)所有系統(tǒng)需要識(shí)別的漢字信息進(jìn)行存儲(chǔ),進(jìn)而構(gòu)成一個(gè)參考模板庫(kù)。第二,識(shí)別,將帶識(shí)別文字與參考數(shù)據(jù)庫(kù)中的模板進(jìn)行對(duì)比分析之后,以最為相近的字為所識(shí)別漢字,主要包括以下3種方式。
(1)將訓(xùn)練語(yǔ)言所提取的結(jié)果作為模板進(jìn)行直接存儲(chǔ),在進(jìn)行識(shí)別的過(guò)程中,將語(yǔ)音信號(hào)輸入到語(yǔ)音識(shí)別系統(tǒng)當(dāng)中,其將會(huì)對(duì)漢字的特征進(jìn)行提取,得到一個(gè)待識(shí)別字的向量數(shù)列,將該序列與模板進(jìn)行逐一的對(duì)比,按照特定的計(jì)分或者距離計(jì)算出該模板的計(jì)分或者距離,并且選擇出一個(gè)計(jì)分或者距離最小的漢字作為識(shí)別字。在對(duì)距離進(jìn)行計(jì)算的過(guò)程中,應(yīng)注意到訓(xùn)練模板中同一詞的瞬時(shí)速度之間的差距,因此,應(yīng)采用時(shí)域內(nèi)彈性匹配概念的方式,對(duì)待識(shí)別的信號(hào)以及模板信號(hào)進(jìn)行計(jì)算。
(2)對(duì)于每個(gè)待識(shí)別漢字來(lái)說(shuō),其存儲(chǔ)方式并不是以特征向量為主,而是采用態(tài)圖的方式來(lái)實(shí)現(xiàn)。例如:aij代表由i態(tài)向j態(tài)轉(zhuǎn)移的概率,而bi則代表i態(tài)輸出的各特征概率,在具體學(xué)習(xí)的過(guò)程中,將會(huì)依照各訓(xùn)練語(yǔ)音特征對(duì)aij和bi進(jìn)行估算,標(biāo)準(zhǔn)是在給定訓(xùn)練序列中,由原始態(tài)向最終態(tài)之間的轉(zhuǎn)變,所得到的輸出概率和為最大。當(dāng)aij和bi的數(shù)值固定時(shí),每一訓(xùn)練都能夠得到相對(duì)應(yīng)的輸出概率,可以利用最優(yōu)路由求法的方式進(jìn)行解決,也可以根據(jù)實(shí)際情況,在最優(yōu)路由的情況下,對(duì)計(jì)分算法進(jìn)行設(shè)計(jì)。在此背景下,學(xué)習(xí)的主要意義是為了能夠?qū)Ω鲬B(tài)模型中的aij和bi進(jìn)行計(jì)算。在具體識(shí)別的過(guò)程中,通過(guò)計(jì)分求法的方式,對(duì)待識(shí)別漢字利用態(tài)圖模型的方式進(jìn)行計(jì)算,獲得其輸出概率。然后,所得計(jì)分最大的態(tài)圖即為所識(shí)別到的漢字,這種方式被稱(chēng)之為是隱Markov模型。
(3)為了能夠使語(yǔ)音動(dòng)態(tài)與時(shí)間之間進(jìn)行良好的匹配,可以將語(yǔ)音特征序列采用適當(dāng)?shù)姆绞竭M(jìn)行劃分,劃分成N段,并且對(duì)其中任意區(qū)域特征的平均值進(jìn)行求取,進(jìn)而得出n個(gè)具有特征矢量,可以將其當(dāng)作模板進(jìn)行存儲(chǔ)。在具體識(shí)別的過(guò)程中,可以根據(jù)本文中第二點(diǎn)的方式對(duì)時(shí)間和動(dòng)態(tài)進(jìn)行匹配,然后以特定的距離為標(biāo)準(zhǔn),距離最小的漢字即為所識(shí)別到的漢字[2]。
3 人工智能基礎(chǔ)上的語(yǔ)音識(shí)別發(fā)展前景
從語(yǔ)音識(shí)別的方式上來(lái)看,主要的識(shí)別方式為語(yǔ)音識(shí)別、特征識(shí)別等,事實(shí)證明,在人工智能基礎(chǔ)上進(jìn)行的語(yǔ)言識(shí)別,能夠?yàn)槿藗兊墓ぷ骱蜕钐峁┹^大的便利,解決生產(chǎn)生活中遇到的諸多問(wèn)題。在語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)中,涉及的范圍十分廣泛,其中包括語(yǔ)音學(xué)、心理學(xué)以及數(shù)理統(tǒng)計(jì)等多方面知識(shí),對(duì)研究人員的綜合素質(zhì)具有十分嚴(yán)格的要求,因此,在對(duì)此方面技術(shù)進(jìn)行研究時(shí),需要掌握多方面知識(shí),才能夠更加良好、高效地完成此項(xiàng)工作。
在人工智能研究中,深度學(xué)習(xí)在多個(gè)領(lǐng)域中得到了廣泛的應(yīng)用,其中包括圖像、語(yǔ)言、文本等方面;在未來(lái)的發(fā)展中,語(yǔ)言識(shí)別將為人機(jī)結(jié)合的發(fā)展提供重大推動(dòng)力,使智能系統(tǒng)的使用者獲得更加舒適的體驗(yàn)。將上述兩種技術(shù)相融合具有兩方面優(yōu)勢(shì):一方面,通過(guò)語(yǔ)言系統(tǒng)能夠收集到大量訓(xùn)練數(shù)據(jù),使魯棒性得到顯著增強(qiáng),能夠在更深層的網(wǎng)絡(luò)中得以應(yīng)用。另一方面,深度網(wǎng)絡(luò)能夠更加促進(jìn)語(yǔ)音識(shí)別系統(tǒng)的精準(zhǔn)度,使系統(tǒng)能夠有效擺脫外界噪音的干擾和影響,使語(yǔ)音識(shí)別的準(zhǔn)確度得到有效提升[3]。
4 結(jié)語(yǔ)
綜上所述,隨著社會(huì)技術(shù)的不斷發(fā)展,機(jī)器學(xué)習(xí)成為人工智能中的重點(diǎn)問(wèn)題,并且在網(wǎng)絡(luò)搜索、語(yǔ)言識(shí)別等多個(gè)領(lǐng)域中得到廣泛應(yīng)用,極大地促進(jìn)了社會(huì)的高效、可持續(xù)發(fā)展。在日后的發(fā)展中,相關(guān)專(zhuān)家和學(xué)者應(yīng)進(jìn)一步加強(qiáng)對(duì)人工智能技術(shù)的研究,使其在語(yǔ)音識(shí)別系統(tǒng)中的作用得到更大的發(fā)揮,促進(jìn)語(yǔ)言識(shí)別系統(tǒng)的更新和優(yōu)化。
參考文獻(xiàn)
[1] 馮琬婷.基于文字識(shí)別視角分析人工智能機(jī)器學(xué)習(xí)中的文字識(shí)別方法[J].電子技術(shù)與軟件工程,2017(13):253.
[2] 端木海臣.文字識(shí)別視域下的人工智能機(jī)器學(xué)習(xí)的文字識(shí)別方法研究[J].電腦編程技巧與維護(hù),2017(12):82-84.
[3] 黃鑫.基于人工智能機(jī)器學(xué)習(xí)的文字識(shí)別方法研究[J].通訊世界,2016(13):234.