數字語音處理及MATLAB模擬 (第3版)

張雪英

  • 出版商: 電子工業
  • 出版日期: 2025-05-01
  • 售價: $359
  • 語言: 簡體中文
  • 頁數: 316
  • ISBN: 7121501538
  • ISBN-13: 9787121501531
  • 相關分類: Matlab
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書系統地闡述語音信號處理的原理、方法、技術和應用,同時給出部分內容對應的MATLAB程序。全書共14章,第1~7章是基本理論部分,包括緒論、語音信號的數字模型、語音信號短時時域分析、語音信號短時頻域分析、語音信號倒譜分析、語音信號線性預測分析和矢量量化;第8~14章是應用部分,包括語音編碼原理及應用、語音識別原理及應用、神經網絡原理及應用、語音合成原理及應用、語音情感識別原理及應用、語音增強原理及應用、語音質量評價和可懂度評價。本書內容全面,重點突出,原理闡述深入淺出,註重理論與實際應用的結合,可讀性強。

目錄大綱

第1章 緒論 1
1.1 語音信號處理的發展 1
1.1.1 語音合成 1
1.1.2 語音編碼 2
1.1.3 語音識別 4
1.2 語音信號處理的應用 7
1.3 語音信號處理的過程 8
1.4 MATLAB在數字語音信號處理中的應用 9
習題1 10
第2章 語音信號的數字模型 11
2.1 語音的發聲機理 11
2.1.1 人的發聲器官 11
2.1.2 語音生成 12
2.2 語音的聽覺機理 13
2.2.1 聽覺器官 13
2.2.2 聽覺掩蔽效應 14
2.2.3 臨界帶寬與頻率群 15
2.2.4 耳蝸的信號處理機制 16
2.2.5 語音信號聽覺模型 17
2.3 語音信號的數字模型 18
2.3.1 激勵模型 18
2.3.2 聲道模型 20
2.3.3 輻射模型 22
2.3.4 數字模型 22
2.3.5 模型局限性 23
習題2 23
第3章 語音信號短時時域分析 24
3.1 語音信號的預處理 24
3.1.1 語音信號的預加重處理 24
3.1.2 語音信號的加窗處理 26
3.2 短時平均能量 29
3.3 短時平均幅度 32
3.4 短時平均過零率 34
3.5 短時自相關分析 36
3.5.1 短時自相關函數 36
3.5.2 語音信號的短時自相關函數 36
3.5.3 修正的短時自相關函數 41
3.5.4 短時平均幅度差函數 44
3.6 基於能量和過零率的語音端點檢測 45
3.7 基音周期估值 47
3.7.1 基於短時自相關法的基音周期估值 47
3.7.2 基於短時平均幅度差函數法的基音周期估值 51
3.7.3 基音周期估值的後處理 53
3.7.4 基音周期估值後處理的MATLAB實現 54
習題3 57
第4章 語音信號短時頻域分析 59
4.1 傅里葉變換的解釋 59
4.1.1 短時傅里葉變換 59
4.1.2 窗函數的作用 60
4.2 濾波器的解釋 65
4.2.1 短時傅里葉變換的濾波器實現形式一 65
4.2.2 短時傅里葉變換的濾波器實現形式二 66
4.3 短時合成的兩種方法 67
4.3.1 短時合成的濾波器組相加法原理 67
4.3.2 短時合成的濾波器組相加法的MATLAB實現 69
4.3.3 短時合成的疊接相加法原理及其MATLAB實現 75
習題4 78
第5章 語音信號倒譜分析 80
5.1 復倒譜和倒譜的定義及性質 80
5.1.1 定義 80
5.1.2 復倒譜的性質 80
5.2 語音信號倒譜分析及應用 83
5.2.1 語音信號倒譜分析原理 83
5.2.2 語音信號倒譜應用 85
5.3 Mel頻率倒譜參數 91
5.3.1 Mel頻率濾波器組 91
5.3.2 MFCC提取 93
5.3.3 MFCC提取的MATLAB實現 94
習題5 95
第6章 語音信號線性預測分析 97
6.1 LPC的基本原理 97
6.1.1 LPC的實現方法 97
6.1.2 語音信號模型和LPC之間的關系 99
6.1.3 模型增益G的確定 100
6.2 LPC系數的解法 101
6.2.1 自相關法 101
6.2.2 協方差法 102
6.2.3 自相關法的MATLAB實現 103
6.3 線譜對(LSP)分析 104
6.3.1 LSP的定義和特點 105
6.3.2 LPC系數到LSP系數的轉換及MATLAB實現 108
6.3.3 LSP系數到LPC系數的轉換及MATLAB實現 111
6.4 LPC的幾種推演參數 113
6.4.1 反射系數 113
6.4.2 對數面積比(LAR)系數 113
6.4.3 預測器多項式的根 114
6.4.4 預測誤差濾波器的沖激響應及其自相關函數 114
6.5 LPC的兩個應用實例 114
6.5.1 LPC倒譜及MATLAB實現 115
6.5.2 LPC基音周期檢測及MATLAB實現 117
習題6 124
第7章 矢量量化 126
7.1 矢量量化基本原理 127
7.1.1 矢量量化的定義 127
7.1.2 失真測度 128
7.1.3 矢量量化器 129
7.2 最佳矢量量化器 130
7.3 矢量量化器的設計算法及MATLAB實現 131
7.3.1 LBG算法 131
7.3.2 初始碼書的選取與空胞腔的處理 133
7.3.3 已知訓練序列的LBG算法的MATLAB實現 134
7.3.4 樹形搜索矢量量化器 136
習題7 139
第8章 語音編碼原理及應用 140
8.1 語音編碼的分類及特性 140
8.1.1 波形編碼 140
8.1.2 參數編碼 141
8.1.3 混合編碼 141
8.2 語音編碼性能的評價指標 141
8.2.1 編碼速率 141
8.2.2 編碼語音質量評價 142
8.2.3 編解碼延時 142
8.2.4 算法復雜度 142
8.3 語音信號波形編碼 143
8.3.1 脈沖編碼調制(PCM) 143
8.3.2 自適應預測編碼(APC) 147
8.3.3 G.721標準及算法實現 149
8.4 語音信號參數編碼 161
8.4.1 LPC聲碼器原理 161
8.4.2 LPC-10聲碼器 162
8.5 語音信號混合編碼 165
8.5.1 合成分析技術和感覺加權濾波器 165
8.5.2 激勵模型的演變 167
8.5.3 G.728標準簡介 167
8.6 語音信號寬帶變速率編碼 168
習題8 169
第9章 語音識別原理及應用 170
9.1 語音識別系統概述 170
9.1.1 語音信號預處理 170
9.1.2 語音識別特徵提取 171
9.1.3 語音訓練識別網絡 172
9.2 支持向量機在語音識別中的應用 175
9.2.1 支持向量機分類原理 175
9.2.2 支持向量機的模型參數選擇問題 180
9.2.3 支持向量機用於語音識別的MATLAB實現 181
習題9 185
第10章 神經網絡原理及應用 186
10.1 人工神經網絡 186
10.1.1 神經元 186
10.1.2 神經網絡的分類 187
10.2 深度神經網絡 188
10.2.1 深度學習 188
10.2.2 捲積神經網絡 189
10.2.3 長短時記憶(LSTM)網絡 190
10.3 神經網絡在語音信號處理中的應用 191
10.3.1 RBF網絡在語音識別中的應用及MATLAB實現 191
10.3.2 SOFM網絡在語音編碼中的應用及MATLAB實現 197
10.3.3 深度神經網絡在語音識別中的應用 200
習題10 202
第11章 語音合成原理及應用 203
11.1 語音合成系統概述 203
11.1.1 文本分析 204
11.1.2 韻律控制 206
11.1.3 語音合成方法 206
11.2 傳統語音合成 207
11.2.1 共振峰合成 208
11.2.2 線性預測分析合成 210
11.2.3 基音同步疊加 212
11.2.4 統計參數語音合成 219
11.3 基於深度學習的端到端語音合成 223
11.3.1 基於WaveNet的語音合成 223
11.3.2 基於FastSpeech的語音合成 225
習題11 226
第12章 語音情感識別原理及應用 227
12.1 情感的劃分 227
12.1.1 離散情感劃分 227
12.1.2 情感維度空間 228
12.1.3 其他情感模型 231
12.2 情感語音數據庫 232
12.2.1 情感語音數據庫建立原則與方法 232
12.2.2 常用情感語音數據庫 233
12.3 語音情感特徵及識別模型的應用 234
12.3.1 傳統語音情感特徵 234
12.3.2 基於經驗模態分解的特徵 238
12.3.3 語音情感的非線性特徵 242
12.3.4 深度神經網絡在語音情感識別中的應用 249
習題12 251
第13章 語音增強原理及應用 252
13.1 語音特性和數據庫 252
13.1.1 語音和噪聲的主要特性 252
13.1.2 語音和噪聲數據庫 253
13.2 語音增強算法的分類 254
13.2.1 無監督語音增強算法 254
13.2.2 有監督語音增強算法 255
13.3 傳統語音增強算法及MATLAB實現 257
13.3.1 譜減法 257
13.3.2 維納濾波法 260
13.3.3 最小均方誤差法 263
13.4 基於深度學習的語音增強算法 266
13.4.1 基於捲積神經網絡的語音增強 267
13.4.2 基於長短期記憶網絡的語音增強 273
13.4.3 基於生成對抗網絡的語音增強 275
習題13 278
第14章 語音質量評價和可懂度評價 279
14.1 語音質量與可懂度 279
14.2 語音質量的主觀評價方法 279
14.3 語音可懂度的主觀評價方法 281
14.4 語音質量客觀評價方法 283
14.4.1 時域和頻域分段信噪比方法及MATLAB實現 283
14.4.2 基於LPC客觀評價方法及MATLAB實現 287
14.4.3 語音質量的感知(PESQ)評價方法及MATLAB實現 290
14.5 語音可懂度客觀評價方法 294
14.5.1 頻域加權分段信噪比評價方法及MATLAB實現 294
14.5.2 歸一化協方差(NCM)評價方法及MATLAB實現 298
習題14 301
參考文獻 302