国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基音

  • 連續(xù)漢語語音的自動切分研究*
    技術、相干分析和基音周期軌跡檢測等方法對連續(xù)漢語語音進行切分。另一類是基于模型的切分方法,該方法需要輸入人工切分好的數(shù)據(jù),對模型進行訓練。張揚[3]等提出了一種基于時間長度的音節(jié)切分方法,利用高斯函數(shù)擬合音節(jié)的長度對音節(jié)進行切分。本文綜合利用端點檢測、語譜圖分析、基音周期軌跡檢測等技術研究了漢語連續(xù)語音的自動切分。研究了一種連續(xù)語音多級切分方法,計算流程如圖1。圖1 連續(xù)語音多級切分計算過程2 語音特征參數(shù)提取語音信號是一種短時信號,在短時間內可看作平穩(wěn)信

    計算機與數(shù)字工程 2023年4期2023-08-02

  • 基于基音周期軌跡的連續(xù)漢語語音切分技術研究*
    。2.2 倒譜與基音周期譜倒譜的本質是頻譜的頻譜,能夠反映頻域中的變化特性,得到每一幀信號的基音周期與基音峰,是語音信號分析的重要特征[13]。將第n 幀語音信號的短時譜Xn(ω)代入式(3),可以得到這一幀信號的倒譜cn。式中IFFT代表傅里葉逆變換。為了觀測基音周期隨時間的變化,將每一幀的倒譜幅度轉化為灰度,按照時間順序進行拼接,即可得到基音周期譜,記為T。圖2 為“那年正月新春”語音數(shù)據(jù)的基音周期譜圖與對應的時域波形。圖2 “那年正月新春”基音周期譜

    計算機與數(shù)字工程 2023年1期2023-05-12

  • 嬰兒啼哭監(jiān)測及安撫系統(tǒng)
    克風;端點檢測;基音頻率;啼哭監(jiān)測照顧嬰兒是一項辛苦的工作,嬰兒往往會因為環(huán)境的輕微的變化而產(chǎn)生啼哭行為,需要父母去安撫,這耗費了父母的大量精力,影響了父母正常的工作和生活。隨著語音識別技術的迅速發(fā)展,語音識別已經(jīng)成為各類邊緣嵌入式電子系統(tǒng)的重要感知手段。針對嬰兒領域的產(chǎn)品也是層出不窮,其中包括針對嬰兒啼哭聲識別的產(chǎn)品。隨著人機交互、語音識別、嵌入式等技術在智能家居領域的快速應用,出現(xiàn)了一系列高度智能化、便捷化的商業(yè)產(chǎn)品,諸如掃地機器人、小米音箱、智能門鎖

    電子產(chǎn)品世界 2023年3期2023-03-22

  • 這就是為什么管風琴看上去能夠違反聲音規(guī)則的原因
    ,它將管樂器音管基音的波長與管長聯(lián)系到一起。通常情況下,音管越長,它的基音就會越低。但是這個等式在實踐中不成立。1根音管發(fā)出的基音總要比根據(jù)亥姆霍茲公式所建議的管長情況要低。修復這個問題需要為等式加入“末端修正”。在那些兩端未封閉的管樂器中,諸如長笛與那些風琴,末端修復量是音管半徑的0.6倍。為什么會這樣,沒有人能夠說得清。這種情況在2010年得到了突破。樂器的生產(chǎn)及修復者伯恩哈特·埃德克斯(Bernhardt Edskes)在調整一臺管風琴時發(fā)現(xiàn)音管鍍金

    中國科技教育 2022年7期2022-11-22

  • 基于改進線性預測基音頻率的語音情感識別系統(tǒng)
    方法,即線性預測基音頻率特征提取方法,利用模型相同的LPC美爾倒頻譜系數(shù)(LPC Mel cepstral coefficients,LPCMCC)[5]特征提取方法來改進,從而改善噪聲干擾下所出現(xiàn)的情感分類模糊化問題,并設計基于改進特征的語音情感識別系統(tǒng),測試此改進特征在實際生活中的應用價值。1 線性預測基音頻率1.1 線性預測分析基于人的發(fā)音器官特點和語音產(chǎn)生的機理,構成了語音信號生成的數(shù)學模型[6]。而線性預測模型則是將數(shù)學模型進行簡化處理,并提出了

    科學技術與工程 2022年26期2022-11-01

  • 對鋼琴調律 若干基本問題的分析(下)
    列的頻率都是與其基音頻率成整倍數(shù)的。樂音及其泛音列是音樂中一個極為重要的自然現(xiàn)象,正是由于泛音列的存在,產(chǎn)生了一系列音樂理論,泛音列(古代西方稱諧音列)是許多音樂理論的核心原理。在鋼琴上,由于鋼琴弦比較粗、硬,因而在發(fā)音過程中,會產(chǎn)生泛音偏離⑤。所謂泛音偏離是指在鋼琴的泛音列中,其泛音的頻率不與基音成整倍數(shù),而是偏離(偏高)的。例如,A2的泛音列,理想的話應該為基音110Hz,上面的泛音分別與其成整倍數(shù),為220Hz、330Hz、440Hz、550Hz、6

    樂器 2022年5期2022-05-29

  • 基于計算聽覺場景分析的單通道語音分離方法*
    模型,該模型采用基音特性和幅度調制特性分別處理低頻和高頻區(qū)域,分離結果的高頻區(qū)域得到了改善,分離效果得到了提高[5~6]。2010 年,Guoning Hu 和Deliang Wang 提出了用于基音估計和濁音分離的算法,即tandem 算法,該算法迭代的進行基音估計和二值模估計,可以準確地獲得基音和目標語音的二值模[7~8]。2013年,基于tan-dem 算法,Guoning Hu 和Deliang Wang 提出了一種無監(jiān)督的語音分離系統(tǒng),該算法在完

    計算機與數(shù)字工程 2022年3期2022-04-07

  • 基于主體-延伸法的基音周期檢測改進算法
    48)0 引 言基音周期是現(xiàn)代語音信號處理領域的一個重要參數(shù),準確地提取和估算基音周期,是保證語音信號在人機交流中更有效地產(chǎn)生、傳輸、存儲、獲取和應用的一個重要過程[1-2]。基音周期檢測在語音識別[3-4]、復雜時頻域交換的語音分析與合成[5-6]、低碼頻率語音編碼[7]、噪聲環(huán)境下的語音識別[8]、聽覺障礙的殘疾人語言指導[9]等多個領域有著廣泛地應用。不同應用領域下的基音周期檢測算法會直接影響到語音識別的識別率、合成語音是否真實再現(xiàn)原始語音信號、語音

    西安工程大學學報 2022年1期2022-03-17

  • 基于計算聽覺場分析的單聲道的雙人語音濁音分離*
    u和Wang檢測基音的方法不同[9],考慮到語音的濁音部分具有準周期性,其頻譜分布有規(guī)律,體現(xiàn)在倒譜域存在明顯的峰值,本文利用倒譜域的峰值信息獲取基音周期,再通過基音周期獲取基音頻率,之后依據(jù)濁音信號的諧波頻率為基音頻率的整數(shù)倍這一規(guī)律進行諧波拾取。重構時,對所得的頻率信息進行反傅里葉變換,由于幀移的存在,還將同一基音周期軌跡段內的所有幀按語音幀的起始位置對齊后進行疊加,并按參與疊加的語音幀個數(shù)取均值,其重構過程如圖2所示,最后所得信號即是要分離的單人語音

    計算機與數(shù)字工程 2021年4期2021-10-09

  • 車輛音頻信號的時域特征方法分析研究
    基于自相關函數(shù)的基音周期估計進行研究,同時對車輛音頻信號進行短時能量提取和基音周期的估計。1 車輛音頻信號的時域特征提取方法■1.1 短時能量音頻信號的短時能量反映了聲音幅度的變化[4]。音頻信號的短時能量的定義為:這個表示式也可以寫為:■1.2 短時自相關分析定義音頻信號xn(m)的短時自相關函數(shù)Rn(k)如下:這里K 是最大的延遲點數(shù)。■1.3 基于自相關函數(shù)的基音周期估計基音周期檢測技術的主要方法有時域的自相關函數(shù)法、倒譜法、時頻結合的混合法及其衍生

    電子制作 2021年7期2021-06-17

  • 基于變步長LMS減噪的基音檢測改進算法
    引 言目前常用的基音檢測[1]方法中,ACF法[2]易出現(xiàn)基音半頻、倍頻錯誤,AMDF法[3]常會出現(xiàn)均值下降的現(xiàn)象,倒譜法[4]的檢測誤差受噪聲影響較大。針對上述方法在噪聲環(huán)境下的檢測精度不夠理想的問題,近年來許多學者提出了改進的基音檢測算法。潘崢嶸等[5]提出了將經(jīng)過經(jīng)驗模式分解的AMDF與ACF進行加權的基音檢測算法,有效減少了半頻、倍頻的錯誤,但其算法較為復雜。徐昕等[6]提出通過基于聽覺掩蔽的多頻帶譜減法對帶噪語音進行減噪,再利用多門限法判決清濁

    計算機工程與設計 2020年10期2020-11-03

  • 漢語連續(xù)語音切分技術研究?
    通過對語譜圖以及基音周期軌跡的分析,研究了一種音節(jié)切分的算法,能夠有效提高漢語語音切分的準確率。2 端點檢測技術語音的端點檢測是指從一段原始信號中準確地找出語音信號的起始點和結束點[6]。它的目的是為了使有用的語音信號和無用的無聲段與噪聲信號相分離,增加后續(xù)語音處理的有效性[7]。目前廣泛采用的端點檢測方法是雙門限端點檢測技術[8]。本文基于對傳統(tǒng)雙門限檢測法理論的研究,研究了一種多閾值檢測方法,有效提高了端點檢測的準確率。2.1 雙門限端點檢測雙門限端點

    計算機與數(shù)字工程 2020年8期2020-10-14

  • 春風常化雨 潤物細無聲
    提出以“人”的“基音”為“向心力”來構建“人教”、“教人”、“為人教”的“三維一體”教學結構形態(tài)。關鍵詞:人教;教人;為人教;基音;三維一體;結構形態(tài)文學家說“文學即人學”,那么音樂家會問;“音樂藝術是什么?”稍加思考就可得出“音樂亦即人學”的同樣答案,縱觀歷史橫看中外哪一部音樂作品不是寫人的、人寫的、為人寫的,由此而知高中音樂欣賞教學中以“人”為“基音”是“有本之樹、有源之水”。筆者在此借鑒“基音”、“泛音”構成一個完整的樂音音響,建構一個理論體系來闡述

    山東青年 2020年6期2020-07-27

  • 一種醫(yī)用聲覺報警信號輸出算法及應用
    用程序,實現(xiàn)輸出基音頻率為500 Hz 的正弦音頻信號及其2~5 次泛音信號。1 算法推導為了實現(xiàn)式(3)中的正弦信號,基于二階無限脈沖響應(IIR)[14]數(shù)字濾波器原理,建立如式(4)所示的正弦信號遞歸算式。式中第(n?1)和第(n?2)步的計算結果分別乘以系數(shù)“p”和“q”后作為第n 步的輸入。根據(jù)sin(A±B)= sinAcosB±cosAsinB 三角和差定理,將式(4)右邊展開:令a[n]、a[n?1]、a[n?2]滿足:得到:給定基音頻率f

    電子科技大學學報 2020年2期2020-04-06

  • 基于DNN與基音周期的說話人識別
    的影響,采用基于基音周期的說話人匹配的輔助確認模式,通過建立注冊人的基音庫,利用DTW算法對測試人的基音周期進行個性匹配,輔助基于DNN說話人識別的主線識別。1.1 特征參數(shù)提取1.1.1 Fbank參數(shù)提取相比于MFCC特征,對數(shù)梅爾濾波器組特征更接近于原始特征信息,有利于DNN學習模型獲取更具代表性的信息。所以本文直接采用對數(shù)梅爾濾波器組特征(Fbank)作為DNN的輸入[11-12],圖1是Fbank參數(shù)提取原理框圖。圖1 Fbank參數(shù)提取過程1.

    計算機與現(xiàn)代化 2020年1期2020-02-07

  • 基于多分類支持向量機和主體延伸法的基音檢測算法
    00)0 引 言基音周期是語音信號的一個重要特征參數(shù),能否準確地估計基音周期的大小在語音識別和分離、說話人識別及跟蹤等語音處理應用中有著至關重要的作用?;驒z測的典型方法包括自相關函數(shù)法、倒譜法、小波變換法、線性預測法,以及在此基礎上衍生的多種算法[1-3],這些算法可以在無噪聲或高信噪比環(huán)境下檢測出被測語音的基音周期。但是,隨著信噪比的降低,基音的線索會受到極大的干擾,導致算法在低信噪比境下不再適用。因此,低信噪比環(huán)境下的基音估計問題成為近年來該領域的熱

    現(xiàn)代電子技術 2019年22期2019-11-20

  • 一種藏語連續(xù)語音聲學特征參數(shù)提取算法研究*
    頻率參數(shù)包括語音基音頻率、共振峰、MFCC梅爾倒譜系數(shù)(Mel Frequency Cepstral Coefficents)參數(shù)等。在孤立詞語音信號中單獨的字或詞的語音信號的音強、時長、能量分布等特征比較容易觀察和分析,但是日常生活和實際的社會環(huán)境中使用的都是連續(xù)的語音句子,這些句子根據(jù)說話人的說話風格,語速、背景,情緒有很大的差異,因而藏語孤立字和詞的聲學參數(shù)特征提取已經(jīng)不能滿足藏語語音大數(shù)據(jù)智能化的需求,本論文在Matlab環(huán)境下對藏語連續(xù)語音數(shù)據(jù)提

    通信技術 2019年8期2019-09-03

  • 基于計算聽覺場景分析的單通道信噪分離方法?
    ,在這些方法中,基音周期都作為分離和組合的重要依據(jù),因而待分離目標語音基音周期的精度對分離效果具有決定性影響。然而,目標語音的基音周期常常受到噪聲的影響,尤其是在信噪比較低的情況下影響更明顯[11],因此,如何得到魯棒性的基音周期估計是一大難點,受到研究人員的廣泛關注[12]。本文在提高基音周期準確性的基礎上,研究了一條新的思路,先以語音信號的短時穩(wěn)定性為依據(jù)利用傅里葉變換將其轉到頻域,每一時段內按濁音的諧波特性,以基音周期為依據(jù)進行同時組合,同一說話人時

    計算機與數(shù)字工程 2019年5期2019-06-01

  • 閉管音頻在洞簫制作中的運用
    度。各音孔發(fā)出的基音也稱“第一諧音”。一般的聲音都是由發(fā)音體發(fā)出的一系列頻率、振幅各不相同的振動復合而成的,這些振動中有一個頻率最低的振動,由它發(fā)出的音就是基音。此外,開管和閉管二者產(chǎn)生的諧音列情況也不一樣:開管能產(chǎn)生與基音成整數(shù)倍的諧音列,而閉管只能產(chǎn)生與基音成奇數(shù)倍的諧音列,即:如果設基音的頻率為n,開管的諧音列為1n、2n、3n、4n……;閉管則為1n、3n、5n、7n……。二、同一點位上開管與閉管音頻的對應關系洞簫是一端通透的開管,其發(fā)出的諧音列與

    樂器 2019年3期2019-04-10

  • 基于數(shù)學模型分析的小提琴諧音能量分布特性研究
    音,整弦振動產(chǎn)生基音,部分振動產(chǎn)生泛音,基音和泛音統(tǒng)稱為諧音.其中,基音為1號諧音,第一泛音為2號諧音……以此類推.諧音的分布情況,是一件樂器所發(fā)出聲音的質量一個的重要參考方面[1].研究諧音,對于研究樂器的音色有十分重要的作用[2],例如人耳可以根據(jù)諧音的不同來識別樂器或者是人聲.因此,研究樂器諧音的數(shù)量、能量以及分布,對于調查樂器的質量、聲音的音色以及指導樂器的制造等方面,有積極的作用.傳統(tǒng)分析樂器諧音的方法,多通過不同的硬件如頻譜分析儀,或者軟件如G

    復旦學報(自然科學版) 2018年3期2018-07-26

  • 基于Hilbert?Huang變換的語音合成基音標注搜索新算法
    語音合成系統(tǒng)中,基音標注的準確性是一個非常重要的因素。針對傳統(tǒng)的短時自相關函數(shù)和小波算法準確性不高和沒有自適應性的缺點,提出一種基于Hilbert?Huang變換的基音標注方法。該算法通過Hilbert?Huang變換分析語音,具有自適應性,根據(jù)自身情況選擇基函數(shù),分解過程滿足條件自動停止。采用文中自適應算法對整段非平穩(wěn)語音信號進行基音標注,其中濁音段、過渡段采用Hilbert?Huang變換進行標注,清音段、非語音段用相近基音周期插值。實驗證明,相比自相

    現(xiàn)代電子技術 2018年12期2018-06-12

  • 基于小波減噪的基音檢測改進算法
    241000)基音檢測是指對語音信號基因周期或頻率的這一特征的檢測[1]699,在語音識別、語音編碼、語音合成等語音應用方面具有非常重要的作用[2]223。目前基音檢測存在的主要問題是,當受噪聲影響時,帶噪語音信號的信噪比急劇下降,從而導致基音檢測準確度降低[3-4]163。針對此問題,目前國內外采用的方法主要有兩類:直接法和間接法。其中,直接法是指對帶噪語音信號直接利用相關算法進行基音檢測;如文獻[2]223提出一種新的基于經(jīng)驗模式分解的平均幅度函數(shù)與

    安徽理工大學學報(自然科學版) 2018年2期2018-05-25

  • 結合EMD與DWT-ACF的語音基音周期檢測改進算法
    243002)基音周期檢測是語音信號處理中的重要步驟之一,它在語音識別、語音情感識別、語音合成以及語音編碼中有著廣泛的應用[1]。于是,精準的基音周期檢測就具有非常重要的意義。目前的基音周期檢測方法有自相關函數(shù)法(Auto Correlation Function,ACF)[2]、平均幅度差函數(shù)法(Average Magnitude Difference Function,AMDF)[3]、倒譜法[4]、線性預測系數(shù)(Linear Prediction

    噪聲與振動控制 2018年2期2018-05-11

  • 基于自相關函數(shù)的鋼琴樂音改進識別算法
    鋼琴樂音信號是由基音及泛音共同組成的,而決定其音高的是基音,因此基音周期的檢測是鋼琴音符識別的關鍵所在[1-2]。基音周期的檢測的方法主要包括頻域識別和時域識別,短時自相關法是一種經(jīng)典的時域檢測算法,它計算簡單,應用廣泛,但是該算法會發(fā)生基音倍頻或半頻錯誤。在此基礎上,在計算自相關函數(shù)前進行三電平中心削波運算是一種經(jīng)典的改進算法[3-5]。由于該運算去除了各個音符能量相對集中在中心區(qū)域的部分,保留了在峰值附近的能量,因而可以減少計算量,加快運算速度,同時,

    武漢工程大學學報 2018年2期2018-05-03

  • 基于Android平臺的聽曲繪譜研究及其實現(xiàn)
    計樂音的頻率,即基音周期。國內有很多學者在基音周期的提取方面進行了研究。高戈等提出了一種基音周期估計算法,以實現(xiàn)甚低碼率下的透明質量語音編碼[2]。黃海亮等利用人工神經(jīng)網(wǎng)絡和動態(tài)規(guī)劃算法提出了一種高精度的基音提取方案[3]。徐國慶等提出了一種音樂識別方法,為實現(xiàn)自動作曲系統(tǒng)提供了較高的識別精度[4]。成新民等通過線性變換等方法將求取“最小谷值點”轉換為求取最大值,實現(xiàn)了精確的基音檢測[5]。翟景瞳等基于自相關處理和快速傅里葉變換(FFT)提出了一種的改進的

    電子世界 2018年7期2018-04-26

  • 泛音率與德彪西的和聲思維
    。如果以“C”為基音,其泛音列應為C→c→g→c1→e1→g1→bb1→c2→d2→e2→#f2→g2→a2→bb2→b2→c3。泛音率中的音并不是每個人都能聽到,但是它確實存在。一個八度中有十二個半音,而以某個音為基音所產(chǎn)生的泛音中并沒有完全產(chǎn)生所有的十二個半音,比如以“C”為基音所產(chǎn)生的泛音列中就缺少了十二個半音中的#C(bD)、#D(bE)、F、#G(bA)四個音,在德彪西的和聲思維中這四個音就屬于“調外體系”。德彪西認為泛音與基音之間的距離越近,兩

    黃河之聲 2017年9期2017-07-31

  • 基于改進小波變換的語音基音周期檢測
    進小波變換的語音基音周期檢測吳興銓1,2,周金治1,2(1.西南科技大學信息工程學院,四川 綿陽 621010;2.西南科技大學特殊環(huán)境機器人技術四川省重點實驗室,四川 綿陽 621010)基音在許多方面都有比較廣泛的應用,比如語音編碼、語音識別、語音轉換、音樂檢索以及發(fā)聲系統(tǒng)疾病診斷等。針對目前很多小波變換方法在測量基音周期時存在的準確度低、復雜度高、魯棒性差等缺點,以及在帶噪語音環(huán)境下,特別是在非平穩(wěn)噪聲下比較難判斷語音基音周期的問題,提出了一種基于改

    自動化儀表 2017年6期2017-06-23

  • 淺談中國美聲怎樣沖出圍城
    、聲音的氣質以及基音擺放三個方面。1.后背唱法:之前沒人提及此方法,偶爾有人說起也是輕描淡寫的幾句,筆者通過反復研究發(fā)現(xiàn)了這一唱法。唱法要領1:在靈活的掌握了胸腹式唱法后,一定要用意念將其唱法引導轉向后背,也就是所謂的后背唱法。方法是:每次吸氣都到達后背,在發(fā)聲的一剎那有翻起動作,也就是后背長了一對翅膀,時刻有要飛翔的沖動。水平達到一定程度后,也就盡量不動用可控肌肉(上腹),人是可以自由控制身體前面這些部位,只要可以控制,就一定或多或少帶來緊張感;人們平日

    黃河之聲 2017年16期2017-01-28

  • 基于Android語音信號處理教學平臺的設計
    等。2 語音信號基音檢測技術基音周期是語音信號處理中的一個非常重要的參數(shù),能夠準確地檢測出基音周期對語音信號的分析、合成、編碼以及識別,具有重要的意義[1]。短時自相關函數(shù)法和倒譜分析法是基音周期估計較為常用的方法。本節(jié)基于SEPH系統(tǒng),探討在基音檢測教學中如何利用語音分析技術對實際的語音信號進行分析與檢測。2.1 基于倒譜分析法的基音檢測語音信號的倒譜分析是估計語音生成模型的有效方法,通常用于語音編碼、合成、識別等方面[2]。根據(jù)語音產(chǎn)生理論,語音信號s

    實驗科學與技術 2016年5期2016-11-12

  • 改進LVAMDF及綜合多因素基音檢測算法
    DF及綜合多因素基音檢測算法薛帥強,陳波,陳菲(西南科技大學 計算機科學與技術學院,四川 綿陽621010)在對語音信號靜音、清音、濁音劃分的基礎上,針對語音信號周期特征明顯段分布隨機性問題,提出改進的變長度平均幅度差函數(shù)LVAMDF及綜合多因素基音檢測算法,該算法對語音信號進行周期特征明顯段和周期特征不明顯段的聚類劃分,同時,獲取周期特征明顯語音段的所有基音周期的起止端點,針對少數(shù)基音周期劃分倍頻或半頻問題,提出識別、修正方法,其識別、修正率極高;在對大

    計算機測量與控制 2016年4期2016-10-31

  • 基于MATLAB的說話人識別系統(tǒng)設計與實現(xiàn)
    )借助語音增強、基音頻率分析和共振峰分析,設計了簡單的說話人識別系統(tǒng).在識別過程中以平均基音頻率、共振峰峰值位置作為兩種評價標準,交互印證,最終實現(xiàn)了說話人的身份辨認.基音頻率;共振峰;說話人識別;MATLAB0引言人類語音信號可對受眾提供多重信息:首先可通過字、詞來傳遞消息,其次可將說話人的感情、性別等信息傳遞出來,同時在語音信號里也暗含了說話人的身份信息[1-4].語音識別的目的在于識別說話人所表達出來的詞匯,而說話人識別的功能是通過提取、表征并識別語

    石家莊學院學報 2016年3期2016-09-03

  • 基于卷積神經(jīng)網(wǎng)絡的魯棒性基音檢測方法
    神經(jīng)網(wǎng)絡的魯棒性基音檢測方法張暉1蘇紅1張學良1高光來1在語音信號中,基音是一個重要參數(shù),且有重要用途.然而,檢測噪聲環(huán)境中語音的基音卻是一項難度較大的工作.由于卷積神經(jīng)網(wǎng)絡(Convolutional neural network,CNN)具有平移不變性,能夠很好地刻畫語譜圖中的諧波結構,因此我們提出使用CNN來完成這項工作.具體地,我們使用CNN來選取候選基音,再用動態(tài)規(guī)劃方法(Dynamic programming,DP)進行基音追蹤,生成連續(xù)的基音

    自動化學報 2016年6期2016-08-22

  • 一種基音周期檢測中減小中值平滑誤差的方法
    10007)一種基音周期檢測中減小中值平滑誤差的方法馬 英, 陳 超, 陳善繼(青海民族大學 物理與電子信息工程學院,青海 西寧 810007)在語音信號處理中,常用的基音檢測算法對于純凈語音信號的檢測效果較好;然而,實際的語音信號都會受到背景噪音的影響,使得常用的檢測算法不能達到最優(yōu)化,為提高檢測基音周期的準確性,可以在基音檢測后處理中采用多種平滑技術,但大多情況下后處理基音周期估值仍然產(chǎn)生很大的誤差,為此文章針對語音信號基音周期估值的中值平滑處理中,可

    新疆師范大學學報(自然科學版) 2016年2期2016-07-31

  • 淺析歌唱發(fā)聲的三要素
    唱;發(fā)聲;氣息;基音;共鳴一、發(fā)聲的原理喉頭與聲帶是發(fā)出聲音的主要器官,喉頭位于頸前部的最突出的部位而聲帶藏在喉頭里,聲帶由兩片薄膜組成,它們的韌性很強并左右并排。聲帶在放松時它的形態(tài)自然張開的,而發(fā)聲時,由于空氣產(chǎn)生的阻力使兩片聲帶自然閉合。@由于每個人的聲帶、各部分器官的構造不同,每個人的發(fā)聲習慣不同,所以,每個人的聲音是不同的。二、發(fā)聲的三要素氣息、基音、共鳴是發(fā)出聲音的三個重要要素,是保證能正常發(fā)聲的三個條件,想要形成整體歌唱,它們之間的關系必須是

    北方音樂 2016年2期2016-02-05

  • 基于語音基音頻率特征對人性別識別的研究
     尹巧萍基于語音基音頻率特征對人性別識別的研究江蘇孫海林尹巧萍本文利用基音頻率作為語音特征,研究了文本無關說話人性別判別的方法。根據(jù)所計算出的不同性別說話人的語音基音頻率累積密度函數(shù)之間的差異,識別出文本無關說話人的性別,實驗結果顯示該方法能夠有效地識別不同說話人的性別。語音基音頻率說話人性別識別一、引言(研究背景)隨著科學技術的飛速發(fā)展,通過對語音信號進行分析處理,進而提取語音特征參數(shù)來識別說話人身份已經(jīng)成為可能。根據(jù)語音特征來識別說話人的身份,具有不會

    作文教學研究 2015年5期2015-11-29

  • 基于AMR-WB基音周期的帶寬節(jié)省方法
    基于AMR-WB基音周期的帶寬節(jié)省方法滕 達1,2,馮浩楠1(1.中國鐵道科學研究院 通信信號研究所,北京 100081;2.中國鐵道科學研究院 研究生部,北京 100081)移動網(wǎng)絡擁塞會影響數(shù)據(jù)通信的質量和穩(wěn)定性,為節(jié)省網(wǎng)絡高峰時段的網(wǎng)絡帶寬,本文在不改變硬件和協(xié)議的條件下,將信息隱藏的思想應用于語音編碼,在編碼階段對語音信號進行壓縮處理,經(jīng)計算可以節(jié)省約12%的帶寬,從而起到緩解網(wǎng)絡擁塞的作用。基音周期;AMR-WB;帶寬隨著手機、平板電腦等移動類電

    鐵路計算機應用 2015年1期2015-06-28

  • 基音周期檢測的希爾伯特-黃變換方法
    脈沖串的周期稱為基音周期。基音周期是語音信號處理中最重要的參數(shù)之一,準確地檢測基音周期對于高質量的語音合成、語音編碼、語音識別及說話人識別有重要意義。近年來,人們從語音信號的時域特性、頻域特性、時頻混合特性出發(fā),提出了許多基音檢測方法,最具有代表性的是自相關法(Autocorrelation Function,ACF)[1]、平均幅度差法(Average Magnitude Difference Function,AMDF)[2]、倒譜法[3]、小波變換法

    計算機工程與應用 2015年1期2015-04-14

  • 語種識別中的幾種特征參數(shù)
    共振峰(F1)、基音頻率(F0)、短時能量(En)、韻律節(jié)奏等6種聲學特征參數(shù)及其派生參數(shù)。2 特征參數(shù)2.1 美爾頻率倒譜系數(shù)美爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC)[1]考慮了人耳的感知頻率以及音強時具有的非線性特性,被認為具有良好的語音識別性能和抗噪聲能力,現(xiàn)在已被廣泛的應用于語種識別和說話人識別中。2.2 線性預測倒譜系數(shù)(LPCC)線性預測倒譜參數(shù)(LPCC)已被廣泛地應用在語音識別上[

    電子世界 2015年20期2015-03-25

  • Matlab在語音信號處理教學中的應用
    ;線性預測編碼;基音檢測;共振峰檢測語音信號處理是利用數(shù)字信號處理技術對語音信號進行分析和處理的一門學科,涉及語音學、信息論、隨機過程、模式識別等許多學科領域。語音信號處理課程不僅是與通信技術和信息處理技術發(fā)展密切相關的一門專業(yè)基礎課程,而且是一門理論性強、實用廣、難度大的交叉學科課程[1-2]。工科電子類專業(yè)語音信號處理課程的主要內容包括語音信號處理的基本知識、語音信號的各種分析和處理技術(時域頻域分析、同態(tài)處理、線性預測分析、矢量量化)、語音信號處理及

    實驗科學與技術 2015年6期2015-02-27

  • G.718音頻編碼器核心層的一種低延時編碼方案
    析和量化以及開環(huán)基音搜索過程。1.1 G.718編碼器信號分類為了在8Kbps時獲得最好的語音編碼性能,首先進行VAD(Voice Activitity Detection)檢測判斷語音信號是否為活動語音信號,非活動語音信號如果采用DTX(Discontinuous Transmission)可以按照 CNG(Comfort Noise Generator)進行編碼。對于非活動語音不采用DTX方式時和活動語音,核心層將信號分成清音(unvoiced)、濁音

    長春理工大學學報(自然科學版) 2014年6期2014-12-07

  • 基于趨勢分析的AMDF基音檢測改進算法
    210023)基音作為語音信號處理的重要特征參數(shù),指人在發(fā)濁音時氣流通過聲門使聲帶張弛振蕩的振動頻率(或周期),廣泛用于語音編碼、語音合成、語音增強及語音識別等。因此能準確檢測基音意義極其重要。經(jīng)典的基音檢測算法有自相關函數(shù)法[1]、平均幅度差函數(shù) 法 (Average Magnitude Difference Function,AMDF)[2]、倒譜法[3]及小波變換法[4]等。盡管已有諸多算法及其改進算法,但準確、可信的基音檢測算法研究仍為具有挑戰(zhàn)性

    振動與沖擊 2014年20期2014-09-19

  • 基于短時平均幅度差函數(shù)的帶噪語音端點檢測算法
    是要進行語音信號基音周期的提取.提出了一種改進的方法,用短時平均幅度差函數(shù)代替自相關函數(shù),節(jié)約了計算量;利用濁音與噪聲平均幅度差函數(shù)的區(qū)別省去了基音周期的計算,同時也避免了誤差帶來的問題.傳統(tǒng)算法與改進算法的仿真比較表明,改進算法的檢測曲線噪聲容限大,所以在低信噪比下也表現(xiàn)出了較強的穩(wěn)定性.端點檢測;自相關函數(shù);短時平均幅度差函數(shù);基音周期語音端點檢測是在復雜的應用環(huán)境下,在信號流中找出語音信號的起始點和結束點,它是數(shù)字語音處理的重要環(huán)節(jié)[1].在通信系統(tǒng)

    河南工程學院學報(自然科學版) 2014年3期2014-08-31

  • 和弦的產(chǎn)生及音響結構形態(tài)
    是對位音程的兩個基音音響,還有這兩個基音內含的兩個諧音列,相互之間諧振而產(chǎn)生的上、下兩個結合音列的音響。正是這些隱含的結合音音響,當聽覺要求它們從后臺再現(xiàn)到前臺時,就相繼產(chǎn)生了各種和弦形式。以往有關和弦的產(chǎn)生和功能屬性等方面的認知,是歐洲音樂實踐和創(chuàng)作中逐漸形成理論的基礎,它們也僅是由創(chuàng)作經(jīng)驗感悟產(chǎn)生的結果,它應隸屬于主觀評價的一些方面。我們現(xiàn)在已可從上、下兩個結合音列的音響分析中,找到它客觀音響形態(tài)結構的理論科學依據(jù)。關鍵詞:復調;和聲;純律;和弦;諧音

    黃鐘 2014年2期2014-08-08

  • 一種改進的基音周期提取算法
    。稱濁音的周期為基音周期,在時域波形里反映為峰值點和峰值點之間的距離。基音周期的提取在語音合成、語音識別、語音編碼等領域有著廣泛的應用。由于語音信號變化的復雜性,迄今為止,并未找到一個完善的適用于不同環(huán)境和要求,不同講話者的可靠準確的檢測基音周期的辦法[1]。現(xiàn)有的基音周期的檢測算法大致可以分為三類[2]:波形估計法、相關處理法以及變換法。波形估計法[3]直接通過語音時域上的波形分析周期峰值,算法簡單,硬件實現(xiàn)容易,但語音信號幅度或頻率快速變化時,精度下降

    數(shù)據(jù)采集與處理 2014年2期2014-07-25

  • 高噪聲環(huán)境下的基音頻率檢測方法研究
    )高噪聲環(huán)境下的基音頻率檢測方法研究劉何來,張正炳,楊順遼 (長江大學電子信息學院,湖北 荊州 434023)聲道特性及噪聲給基音檢測帶來了嚴重的影響,針對這一問題,將線性預測殘差信號作為去除聲道影響的激勵信號的近似,再結合自相關函數(shù)法檢測基音頻率的高抗噪性,探討了用線性預測殘差信號的低通自相關函數(shù)法檢測基音頻率。用理論模型驗證了該方法的可行性,并就實際信號處理情況和倒譜法及自相關函數(shù)法進行了比較。結果表明,該方法有效的減少了聲道特性的影響,在高噪聲環(huán)境下

    長江大學學報(自科版) 2013年1期2013-10-26

  • 基于壓縮感知觀測序列的語音信號基音周期提取*
    測序列中直接提取基音周期的技術。1 壓縮感知的數(shù)學模型設N維信號 X∈RN×1由某組正交變換基表示成如下形式:其中 θi=〈X,Φi〉,即式中,Φ∈N×N的正交變換矩陣,若θ是K稀疏的,即θ中非零元素個數(shù)為K(K<<N),則可以采用另一個與Φ不相關的矩陣Ψ∈RM×N(M<N)對θ進行壓縮觀測,得到觀測序列Ψ稱為投影矩陣,令ΨΦT=Θ,則稱Θ為觀測矩陣。當Θ滿足RIP特性,可以在接收端從M=O( Klg(N))個觀測值中以高概率重構原始信號,方法為解凸優(yōu)化問

    電訊技術 2013年10期2013-08-08

  • 同態(tài)解卷處理在基音檢測中的應用
    3同態(tài)解卷處理在基音檢測中的應用楊順遼長江大學電子信息學院,湖北荊州 4340231 引言人類語音分為濁音和清音,其中發(fā)濁音時氣流通過聲門使得聲帶產(chǎn)生張弛震蕩式振動,從而產(chǎn)生準周期氣流脈沖,該氣流脈沖激勵聲道就產(chǎn)生濁音。這種聲帶振動的頻率稱為基頻,相應的周期就稱為基音周期。基音周期具有時變性和準周期性,其大小與聲帶、發(fā)音習慣、發(fā)音者年齡、性別和發(fā)音時的情感有關[1]。基音周期的估計稱為基音檢測,是語音處理中一個重要參數(shù),基音檢測是語音處理中的關鍵環(huán)節(jié)和難點

    計算機工程與應用 2013年24期2013-07-20

  • 低復雜度的基音檢測算法
    071051)基音周期是描述濁音激勵源的一個基本特征,其倒數(shù)稱為基音頻率.基音頻率的不同軌跡就是聲調,在漢語中聲調承擔著構字辯意的作用,因此基音檢測是漢語語言處理的關鍵環(huán)節(jié).自相關函數(shù)法(ACF)[1]和平均幅度差函數(shù)法(AMDF)[2]是基音檢測的經(jīng)典算法,但準確性不高,容易產(chǎn)生倍、半基音,在平滑過程中不僅增加了處理時間和算法復雜度,還可能引入新的誤差[3-4].小波變換是近年來的研究熱點,具有良好的時頻局部分析能力,但受聲道響應的影響較大,計算量大.

    河北大學學報(自然科學版) 2013年5期2013-03-01

  • 基頻提取算法的研究與評價
    谷值點也不一定是基音周期所在點,在這種情況下,若以全局最低谷點作為基音周期計算點,就會產(chǎn)生嚴重的檢測錯誤[2]。語音的音頻提取有廣泛的應用。它促進了韻律學研究的發(fā)展;在語音識別中被用來識別原始的詞匯;一些音樂的應用也需要基頻提取,比如多媒體內容元數(shù)據(jù)的抽取,被用在自動評分和實時交互系統(tǒng)等等應用上。但是大部分算法在可靠性上存在一定的缺陷和錯誤率,下面我們著重比較最近幾年主要的幾種基頻提取算法,具有篇幅有限,我們選用測試集51mike.com中許志安的《為什么

    微型電腦應用 2012年9期2012-10-20

  • 一種基于MELP模型600bps聲碼器的設計
    分析、增益計算、基音估計和多帶分析方法從語音信號中提取線性預測系數(shù)、增益均值、增益差值、基音周期和子帶清濁判決等參數(shù),然后通過量化進入信道。圖1 編碼過程譯碼過程(見圖2)是通過將脈沖信號和噪聲信號根據(jù)子帶清濁判決結果,將其疊加在一起作為激勵信號,然后通過自適應譜增強、LPC合成濾波、增益校正、脈沖整形濾波處理,從而充分反映了語音信號的本質特征,極大地提高了合成語音的質量。圖2 譯碼過程2.1 線譜對(LSF)參數(shù)量化在基于線性預測的語音編碼算法中,線性預

    電子與封裝 2012年10期2012-05-31

  • 舞蹈機器人中音樂基音頻率的提取
    音高與音樂信號的基音頻率是一一對應的關系,因此,音樂的基音頻率是音樂信號特征參數(shù)識別中及其重要的參數(shù)之一。音樂信號的基音頻率提取的質量對音樂的音高、節(jié)奏、旋律和情感等特征參數(shù)的提取具有重要的意義,將會直接影響到音樂信號特征參數(shù)提取的效果。作為音樂識別領域內重要的研究內容之一,目前常用的音樂信號基音頻率的提取方法主要有自相關函數(shù)法(ACF)[1]、平均幅度差函數(shù)法(AMDF)[2]、倒譜法(CEP)和小波變換法[3]等,而單純的利用自相關函數(shù)法或者平均幅度差

    電子設計工程 2011年13期2011-05-21

  • 多帶激勵MBE譜幅度估計與參數(shù)編解碼方案研究
    函數(shù)w(n)即為基音細搜索窗(寬度取為221個樣點的哈明窗)。設加窗語音信號為sw(n),則sw(n)=w(n)×s(n)。用Sw(w)表示sw(n)的傅立葉變換,可以看成是系統(tǒng)函數(shù)Hw(w)同激勵信號譜Ew(w)的乘積,即:而重建語音信號可以寫成:1.1 譜幅度估計多帶激勵編碼過程都涉及3種參數(shù)的提取,它們是基音頻率,按基音頻率各次諧波分成頻帶后每個頻帶的譜包絡參數(shù)以及每個頻帶的V/U判決信息。統(tǒng)一提取這3個參數(shù)所涉及的計算量相當大,目前在實際應用中難以

    電子設計工程 2011年16期2011-03-28

  • 語音信號的自相關基音周期檢測
    200090)基音周期的估計稱為基音周期檢測,基音周期檢測的最終目的是得到與聲音振動頻率吻合較好的基音周期變化軌跡曲線.在語音信號的處理中只有準確捕獲語音信號參數(shù),才能高效地識別語音.而在這些語音信號參數(shù)中,基音周期提取的精確性和效率直接影響到合成語音能否真實快速地再現(xiàn)原始語音信號.本文在基音周期檢測一般方法的基礎上,對自相關運算過程加以修改,并給出使用該種方法對兩段語音信號進行基音周期檢測的結果.1 語音信號基音周期檢測一般過程語音信號基音周期檢測的一

    上海電力大學學報 2011年3期2011-02-26

  • 談談笛子的泛音
    我們能聽到的只是基音。實際上此時除了基音而外,其間還夾有若干分音;這些分音就構成了該樂器的音色。當手指虛按在弦的1/n點時,該分音就被增強激發(fā)出來,而基音卻被抑制,從而使我們只能聽到比該分音減一的泛音。當泛音被激發(fā)以后,由于基音同其余的分音同時都被抑制,因此泛音的音色純凈卻十分單調。這弦樂器上的泛音,也被人們稱作“笛音”。這“笛音”的稱謂,是否有其道理呢?弦樂器可以通過第一把位、第二把位……,用縮短弦長的方法獲得不同頻率的音高。那么管樂器能否也通過多多開挖

    劇影月報 2010年6期2010-11-16

  • 一種高效的基音估計算法
    06)一種高效的基音估計算法高 悅,陳硯圃,閔 剛,杜 佳(西安通信學院 基礎部,陜西 西安 710106)分析已有的一些基音估計算法,對比其優(yōu)缺點,提出一種可大大提高計算速度的高效基音估計算法。該算法是利用平均幅度差(MAMDF)法提取若干個可能峰值點,再利用計算精度較高的循環(huán)平均幅度差(CAMDF)法對這幾個點進行驗證,選取數(shù)值最小的點作為基音周期。由于只對幾個點求CAMDF函數(shù),因此運算量大大減小。基音周期;基音估計;平均幅度差(AMDF);改進的平

    電子設計工程 2010年1期2010-09-27

  • 一種新的語音通信抗分組丟失方法—分布式子幀交織描述
    應碼書(ACB)基音延遲;Pi,2表示第二子幀的自適應碼書基音延遲;FCBi,1表示第一子幀的固定碼書(FCB)位置和符號,F(xiàn)CBi,2表示第二子幀的固定碼書(FCB)位置和符號;Gi,1表示第一子幀的ACB和FCB增益;Gi,2表示第二子幀的ACB和FCB增益。(2)MD-G.729編碼器一般的編碼器結構如圖3(a)所示。如上所述,MD-G.729通過在G.729中的兩個相鄰幀應用DSI,生成兩個速率相同的平衡描述。與第II部分介紹的DSI不同的是:當只

    通信技術 2010年6期2010-08-06

  • 一種基于數(shù)學形態(tài)學的語音基音軌跡平滑的改進算法
    430073)基音的檢測提取一直是一個被廣泛研究的課題,并提出了各種各樣的基音檢測算法.然而由于濁音信號的周期性表征極其復雜,無論采用哪一種基音檢測算法都可能產(chǎn)生基音檢測錯誤,加之噪音干擾,使求得的基音周期軌跡中有一個或幾個基音周期估值偏離了正常軌跡(通常是偏離到正常值的2倍或1/2),這種偏離點稱為“野點”.這些脈沖噪聲類似于圖像中的椒鹽噪聲,故可以采取平滑技術加以糾正.目前比較常用的基音平滑方法主要有中值濾波算法和線性平滑算法以及它們的組合.它們有一

    武漢理工大學學報(交通科學與工程版) 2010年5期2010-07-09

  • MELP聲碼器的算法研究及實現(xiàn)
    做以下處理:1.基音分析:首先經(jīng)過1KHz的巴特沃思低通濾波器,用歸一化互相關法進行基音粗估,得到整數(shù)基音值T,然后進行分數(shù)基音分析,采用內插方法,求得分數(shù)基音估計的小數(shù)部分,此時分數(shù)基音值P為整數(shù)基音T與分數(shù)基音小數(shù)部分之和。采用6階巴特沃思帶通濾波器將一幀語音信號分為五個帶,分別是[0,500Hz],[500,1000Hz],[1000,2000Hz],[2000,3000Hz],[3000,4000Hz]五個頻帶,利用[0,500Hz]子帶信號與殘差

    新媒體研究 2009年23期2009-07-01