語音信號處理 第4版

魏昕 趙力

  • 出版商: 機械工業
  • 出版日期: 2024-08-29
  • 定價: $420
  • 售價: 8.5$357
  • 語言: 簡體中文
  • ISBN: 7111760522
  • ISBN-13: 9787111760528
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書介紹了語音信號處理的基礎、原理、方法和應用,以及該學科領域近年來取得的一些新的研究成果和技術。全書共分13章,內容包括:緒論、語音信號處理的基礎知識、語音信號處理的常用算法、語音信號分析、語音信號特征提取技術、語音增強、語音識別、說話人識別、語音編碼、語音合成與轉換、語音信號情感處理、聲源定位、多模態語音信號處理。 本書可作為高等院校的教材或教學參考書,同時也可供語音信號處理等領域的工程技術人員參考。

作者簡介

魏昕,南京郵電大學通信與信息工程學院教授、博士生導師,江蘇高校“青藍工程”中青年學術帶頭人。2009年博士畢業於東南大學,師從趙力教授。主要從事多媒體通信與信息處理、教育信息化、智慧建築等方面的研究工作。近年來主持國家自然科學基金面上項目、江蘇省自然科學基金、江蘇省高等教育教學改革重中之重研究課題等;在IEEE TCOM/JSAC/TMM/TCSVT/WCM、Computers & Education、通信學報、電子學報等國內外核心期刊上發表SCI、SSCI學術論文70余篇,出版Springer英文學術專著2本;擔任中國通信學會通信理論與信號處理專委會委員以及多個電子信息領域國際學術會議分論壇主席;獲得中國通信學會自然科學一等獎、華夏建設科學技術一等獎、 IEEE Transactions on Multimedia Best Paper Award等多項學術獎勵;獲得授權中國發明專利30余項、美國發明專利2項,其中8項已實現成果轉化。 趙力,東南大學信息科學與工程學院教授、博士生導師。1998年博士畢業於日本京都理工大學,師從原日本音響學會會長新美康永教授,現為中國聲學學會理事會理事、中國神經心理學會理事、南京多媒體學會理事、東南大學信息處理與應用工程研究中心負責人。主要從事語音信號處理、自然語言處理、聲頻和視頻信號處理、情感信息處理等方面的研究工作。在語音和聲頻信號檢測、漢語連續語音識別、說話人和環境自適應方法、語音會話系統、語言翻譯系統、聲場景分析、語音信號中的情感信息處理等方面取得了一系列研究成果,曾為數十家企業完成音視頻處理系統設計。已培養博、碩士研究生三百余名;在IEEE TASLP/TIP/TNN、Pattern Recognition、日本音響學會志、電子學報、聲學學報等國內外核心學術期刊發表SCI論文300余篇;主持或參與完成多項國家973項目、國家863項目、國家科技部重點研發計劃、國家自然科學基金重點項目/面上項目、教育部重點科技攻關項目。獲得江蘇省科技進步二等獎3次、教育部科學技術二等獎2次、江蘇省教育廳優秀課程群教學一等獎等。

目錄大綱

前言
第1章緒論
第2章語音信號處理的基礎知識
2.1語音發音及感知系統
2.2語音信號生成的數學模型
2.3語音基本概念與參數
2.4語音信號的數字化和預處理
2.5語音信號處理的應用
2.6思考與覆習題
第3章語音信號處理的常用算法
3.1矢量量化
3.2隱馬爾可夫模型
3.3深度學習
3.4思考與覆習題
第4章語音信號分析
4.1概述
4.2語音分幀
4.3語音信號的時域分析
4.4語音信號的頻域分析
4.5語音信號的倒譜分析
4.6語音信號的線性預測分析
4.7語音信號的小波分析
4.8思考與覆習題
第5章語音信號特征提取技術
5.1概述
5.2端點檢測
5.3基音周期估計
5.4共振峰估計
5.5思考與覆習題
第6章語音增強
6.1概述
6.2語音特性、人耳感知特性及噪聲特性
6.3濾波器法
6.4相關特征法
6.5非線性處理法
6.6減譜法與維納濾波法
6.7基於深度學習的語音增強
6.8思考與覆習題
第7章語音識別
7.1概述
7.2語音識別原理和識別系統的組成
7.3孤立字(詞)識別系統
7.4連續語音識別系統
7.5語音識別系統的性能評測
7.6思考與覆習題
第8章說話人識別
8.1概述
8.2說話人識別方法和系統結構
8.3基於矢量量化的說話人識別系統
8.4基於動態時間規整的說話人確認系統
8.5基於高斯混合模型(GMM)的說話人識別系統
8.6基於深度學習的說話人識別
8.7尚需進一步探索的研究課題
8.8思考與覆習題
第9章語音編碼
9.1概述
9.2語音編碼的評價指標
9.3語音信號的波形編碼
9.4語音信號的參數編碼
9.5語音信號的混合編碼
9.6基於深度學習的語音編碼
9.7思考與覆習題
第10章語音合成與轉換
10.1概述
10.2語音合成算法
10.3基於深度學習的語音合成
10.4常用的語音轉換方法
10.5語音轉換的研究方向
10.6思考與覆習題
第11章語音信號情感處理
11.1概述
11.2情感理論與情感誘發實驗
11.3情感的聲學特征分析
11.4實用語音情感識別算法
11.5基於深度學習的語音情感識別
11.6應用與展望
11.7思考與覆習題
第12章聲源定位
12.1概述
12.2雙耳聽覺定位原理及方法
12.4基於傳聲器陣列的聲源定位
12.5總結與展望
12.6思考與覆習題
第13章多模態語音信號處理
13.1概述
13.2視覺信息輔助的語音增強
13.3視覺信息輔助的語音合成
13.4視覺信息輔助的語音識別
13.5多模態融合的語音情感信息處理
13.6總結與展望
13.7思考與覆習題
附錄漢英名詞術語對照
參考文獻