說話人識別是語音識別的一種特殊方式,其目的不是識別語音內(nèi)容,而是識別說話人是誰,即從語音信號中提取個人特征。采用矢量量化(VQ)可避免困難的語音分段問題和時間歸整問題,且作為一種數(shù)據(jù)壓縮手段可大大減少系統(tǒng)所需的數(shù)據(jù)存儲量。本文提出了識別特征選取采用復倒譜特征參數(shù)和對應用VQ的說話人識別系統(tǒng)改進的一種方法。當用于訓練的數(shù)據(jù)量較小時,復倒譜特征可以得到比較穩(wěn)定的識別性能。VQ的改進方法避免了說話人識別系統(tǒng)的訓練時間與使用時間相差過長從而導致系統(tǒng)的性能明顯下降以及若利用自相關函數(shù)帶來的大量運算。
標簽:
識別
方式
語音識別
上傳時間:
2015-09-04
上傳用戶:xwd2010