Text to Speech Synthesis : New Paradigms and Advances
暫譯: 語音合成:新範式與進展
Shrikanth Narayanan, Abeer Alwan
- 出版商: Prentice Hall
- 出版日期: 2004-08-03
- 售價: $3,280
- 貴賓價: 9.5 折 $3,116
- 語言: 英文
- 頁數: 288
- 裝訂: Hardcover
- ISBN: 013145661X
- ISBN-13: 9780131456617
已絕版
買這商品的人也買了...
-
$580$568 -
$980$833 -
$650$514 -
$1,176Database Management Systems, 3/e (IE-Paperback)
-
$1,770$1,682 -
$780$741 -
$1,470Speech Coding Algorithms: Foundation and Evolution of Standardized Coders (Hardcover)
-
$990$782 -
$620$608 -
$400$380 -
$1,805UML Distilled: A Brief Guide to the Standard Object Modeling Language, 3/e (Paperback)
-
$1,600$1,568 -
$480$408 -
$680$612 -
$480$379 -
$720$684 -
$1,121Digital Speech: Coding for Low Bit Rate Communication Systems, 2/e (IE-Paperback)
-
$890$703 -
$650$553 -
$650$507 -
$450$383 -
$990$842 -
$650$507 -
$450$383 -
$600$480
相關主題
商品描述
Description:
Recent advances in speech synthesis will enable the development of high-quality natural voice systems with broad application in education, business, entertainment, and medicine. Text to Speech Synthesis is the first book to comprehensively document these new research trends and paradigms, balancing coverage of research and applications. It brings together seminal research by leaders in the field, drawn from both academic and industrial laboratories worldwide.
The authors and editors offer broad coverage of several key areas, including new unit selection approaches, speech representations and modeling, data-driven synthesis schemes, and expressive speech synthesis.
Coverage includes:
- Unit Selection Methods: Reducing discontinuities at synthesis time in corpus-based speech processing, voice quality variation, and join costs
- Hidden Markov Model (HMM)-Based Synthesis: Advanced uses of speech recognition technology, HMM-based multilingual speech synthesis, and new prosody control techniques
- Expressive Speech Synthesis: Challenges, questions, and avenues of research, including diphone transplantation and minimization of pitch modification
- Speech Representation and Models: A new articulatory modeling paradigm for controlling synthesis quality
This is an essential resource for all researchers working in speech synthesis and related areas such as multimedia signal processing, linguistics, and spoken user interfaces. It will also be valuable to any engineer, developer, or manager who must evaluate the latest speech technologies or integrate them into practical applications.
Table of Contents:
Preface.
Foreword.
1. Reducing Discontinuities at Synthesis Time for Corpus-Based Speech Synthesis.
Baris Bozkurt, Thierry Dutoit, Romain Prudon, Christophe D'Alessandro and Vincent Pagel.
Introduction.
Shift-Only F0 Smoothing.
Improving Quality of MBROLA Synthesis.
Evaluation.
Discussions and Conclusion.
Bibliography.
2. Voice Quality Variation in a Long-Term Recording of a Single Speaker Speech Corpus.
Hisashi Kawai and Minoru Tsuzaki.
Introduction.
Perceptual Experiment.
Factors of Voice Quality Variation.
Candidates of Acoustic Correlates.
Prediction of Voice Quality Difference Scores.
Summary.
Bibliography.
3. Join Cost for Unit Selection Speech Synthesis.
Jithendra Vepa and Simon King.
Introduction.
Previous Work.
Spectral Distances.
Perceptual Listening Tests.
Results and Discussion.
Conclusions.
Bibliography.
4. Articulatory Modeling: A Role in Concatenative Text to Speech Synthesis.
M. Mohan Sondhi and Daniel J. Sinder.
Introduction.
Articulatory Modeling.
Rule-Based Control of the Parameters.
Concatenative Articulatory Synthesis.
Concluding Remarks.
Bibliography.
5. Minimizing The Amount of Pitch Modification in Speech Synthesis.
Esther Klabbers, Jan van Santen and Johan Wouters.
Introduction.
Speech Corpus Analysis.
Text Corpus Analysis.
Perceptual Experiment.
Conclusion.
Bibliography.
6. The Use of Speech Recognition Technology in Speech Synthesis.
Mari Ostendorf and Ivan Bulyko.
Introduction.
Speech Recognition.
ASR in Synthesis.
Limitations.
Speculations.
Bibliography.
7. An HMM-Based Approach to Multilingual Speech Synthesis.
Keiichi Tokuda, Heiga Zen and Alan W. Black.
Introduction.
HMM-Based Speech Synthesis System.
F0 Pattern Modeling by HMM.
Speech-Parameter Generation from an HMM.
Implementation on Festival Architecture.
Discussion.
Conclusion.
Bibliography.
8. Prosody Control For HMM-Based Japanese TTS.
Koji Iwano, Masahiro Yamada, Taro Togawa and Sadaoki Furui.
Introduction.
Outline of HMM-Based TTS System.
Prosody Generation Using the Quantification Theory (Type 1).
Speech-Rate-Variable Synthesis Method.
Conclusions.
Bibliography.
9. Synthesizing Expressive Speech Overview: Challenges, and Open Questions.
Murtaza Bulut, Shrikanth Narayanan and Lewis Johnson.
Introduction.
Theories of Emotion.
Dimensions of Emotional Space.
Speech Synthesis Methods.
Emotional Speech Data Collection.
Experimental Evaluation of Expressive Speech.
Presentation of Results From Case Studies.
Conclusion.
Open Questions and Future Directions.
Bibliography.
10. Unit Selection Synthesis of Prosody: Evaluation Using Diphone Transplantation.
Romain Prudon, Christophe D'Alessandro and Philippe Boula de Mareüil.
Introduction.
Computing Prosody by Selection.
Comparative Evaluation.
Results.
Conclusion.
Bibliography.
11. Toward Expressive Synthetic Speech.
Ellen Eide, Raimo Bakis, Wael Hamza and John F. Pitrelli.
Introduction.
A Pilot Study For Generating Expressive Speech.
Generating Expressive Speech with Limited Resources.
Rule-Based Methods for Generating Expressive Speech.
Use of an Expressive TTS System.
Assessing Performance.
Conclusions.
Bibliography.
Footnotes.
Copyright Forms.
References.
Index.
商品描述(中文翻譯)
**描述:**
最近在語音合成方面的進展將使高品質自然語音系統的開發成為可能,並在教育、商業、娛樂和醫療等領域廣泛應用。《文本轉語音合成》是第一本全面記錄這些新研究趨勢和範式的書籍,平衡了研究和應用的覆蓋範圍。它匯集了來自全球學術界和工業實驗室的領域領導者的開創性研究。
作者和編輯提供了幾個關鍵領域的廣泛覆蓋,包括新的單元選擇方法、語音表示和建模、數據驅動的合成方案以及表現性語音合成。
涵蓋內容包括:
- **單元選擇方法:** 減少基於語料的語音處理中合成時的不連續性、語音質量變化和連接成本
- **隱馬爾可夫模型(HMM)基礎的合成:** 語音識別技術的先進應用、基於HMM的多語言語音合成和新的韻律控制技術
- **表現性語音合成:** 挑戰、問題和研究方向,包括雙音節移植和音高修改的最小化
- **語音表示和模型:** 控制合成質量的新發音建模範式
這是所有從事語音合成及相關領域(如多媒體信號處理、語言學和語音用戶界面)研究者的重要資源。對於任何必須評估最新語音技術或將其整合到實際應用中的工程師、開發者或經理來說,這本書也將非常有價值。
**目錄:**
前言。
序言。
1. 減少基於語料的語音合成中的合成時不連續性。
Baris Bozkurt, Thierry Dutoit, Romain Prudon, Christophe D'Alessandro 和 Vincent Pagel。
引言。
僅移位的F0平滑。
改善MBROLA合成的質量。
評估。
討論與結論。
參考文獻。
2. 單一說話者語音語料的長期錄音中的語音質量變化。
Hisashi Kawai 和 Minoru Tsuzaki。
引言。
感知實驗。
語音質量變化的因素。
聲學相關的候選者。
語音質量差異分數的預測。
總結。
參考文獻。
3. 單元選擇語音合成的連接成本。
Jithendra Vepa 和 Simon King。
引言。
先前的工作。
頻譜距離。
感知聆聽測試。
結果與討論。
結論。
參考文獻。
4. 發音建模:在連接式文本到語音合成中的角色。
M. Mohan Sondhi 和 Daniel J. Sinder。
引言。
發音建模。
基於規則的參數控制。
連接式發音合成。
結語。
參考文獻。
5. 最小化語音合成中的音高修改量。
Esther Klabbers, Jan van Santen 和 Johan Wouters。
引言。
語音語料分析。
文本語料分析。
感知實驗。
結論。
參考文獻。
6. 語音識別技術在語音合成中的應用。
Mari Ostendorf 和 Ivan Bulyko。
引言。
語音識別。
合成中的ASR。
限制。
推測。
參考文獻。
7. 基於HMM的多語言語音合成方法。
Keiichi Tokuda, Heiga Zen 和 Alan W. Black。
引言。
基於HMM的語音合成系統。
HMM的F0模式建模。
從HMM生成語音參數。
在Festival架構上的實現。
討論。
結論。
參考文獻。
8. 基於HMM的日語TTS的韻律控制。
Koji Iwano, Masahiro Yamada, Taro Togawa 和 Sadaoki Furui。
引言。
基於HMM的TTS系統概述。
使用量化理論(類型1)的韻律生成。
語音速率可變合成方法。
結論。
參考文獻。
9. 合成表現性語音概述:挑戰與未解問題。
Murtaza Bulut, Shrikanth Narayanan 和 Lewis Johnson。
引言。
情感理論。
情感空間的維度。
語音合成方法。
情感語音數據收集。
表現性語音的實驗評估。
案例研究結果的呈現。
結論。
未解問題與未來方向。
參考文獻。
10. 韻律的單元選擇合成:使用雙音節移植的評估。
Romain Prudon, Christophe D'Alessandro 和 Philippe Boula de Mareüil。
引言。
通過選擇計算韻律。
比較評估。
結果。
結論。
參考文獻。
11. 朝向表現性合成語音。
Ellen Eide, Raimo Bakis, Wael Hamza 和 John F. Pitrelli。
引言。
生成表現性語音的初步研究。
使用有限資源生成表現性語音。
生成表現性語音的基於規則的方法。
使用表現性TTS系統。
性能評估。
結論。
參考文獻。
註腳。
版權表格。
參考資料。
索引。