機器翻譯:基礎與模型

肖桐,朱靖波

買這商品的人也買了...

相關主題

商品描述

利用機器翻譯技術實現不同語言之間的自由交流始終是最令人期待的計算機應用之一。
本書全面回顧了近30年來機器翻譯的技術發展歷程,遵循機器翻譯技術的發展脈絡,
對基於統計和基於端到端深度學習的機器翻譯關鍵技術及原理進行了深入解析,
力求做到簡潔明瞭、全面透徹、圖文結合。
此外,本書著重介紹了近年來機器翻譯領域的科研熱點,
旨在幫助讀者全面瞭解機器翻譯的前沿研究進展和關鍵技術。
本書可供計算機相關專業高年級本科生及研究生學習使用,
也可作為自然語言處理,特別是機器翻譯相關研究人員的案邊手冊。

作者簡介

肖桐

博士,東北大學教授、博士生導師,東北大學計算機學院人工智能係系主任,
東北大學自然語言處理實驗室主任,小牛翻譯(NiuTrans)聯合創始人。
於東北大學計算機專業獲得博士學位。
2006-2009年赴日本富士施樂、微軟亞洲研究院訪問學習,
並於2013一2014年赴英國劍橋大學開展博士後研究。
主要研究領域包括自然語言處理、機器學習等。
在國內外相關領域高水平會議及期刊上發表學術論文70餘篇。
作為項目技術負責人,成功研發了NiuTrans、NiuTensor等開源系統,
在WMT、CCMT/CWMT、NTCIR等國內外評測中多次獲得冠軍。
2014年獲得中國中文信息學會首屆優秀博士論文提名獎,
2016年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎”一等獎。
任ACL、EMNLP、TACL等國際著名會議及期刊的領域主席和常駐審稿人。

目錄大綱

目錄
第1部分 機器翻譯基礎
1 機器翻譯簡介
1.1 機器翻譯的概念
1.2 機器翻譯簡史
1.2.1 人工翻譯
1.2.2 機器翻譯的萌芽
1.2.3 機器翻譯的受挫
1.2.4 機器翻譯的快速成長
1.2.5 機器翻譯的爆發
1.3 機器翻譯現狀及挑戰
1.4 基於規則的機器翻譯方法
1.4.1 規則的定義
1.4.2 轉換法
1.4.3 基於中間語言的方法
1.4.4 基於規則的方法的優缺點
1.5 數據驅動的機器翻譯方法
1.5.1 基於實例的機器翻譯
1.5.2 統計機器翻譯
1.5.3 神經機器翻譯
1.5.4 對比分析
1.6 推薦學習資源
1.6.1 經典書籍
1.6.2 相關學術會議
2 統計語言建模基礎
2.1 概率論基礎
2.1.1 隨機變量和概率
2.1.2 聯合概率、條件概率和邊緣概率
2.1.3 鍊式法則
2.1.4 貝葉斯法則
2.1.5 KL距離和熵
2.2 擲骰子遊戲
2.3 n-gram語言模型
2.3.1 建模
2.3.2 參數估計和平滑算法
2.3.3 語言模型的評價
2.4 預測與搜索
2.4.1 搜索問題的建模
2.4.2 經典搜索
2.4 -3局部搜索
2.5 小結及拓展閱讀
3 詞法分析和語法分析基礎
3.1 問題概述
3.2 中文分詞
3.2.1 基於詞典的分詞方法
3.2.2 基於統計的分詞方法
3.3 命名實體識別
3.3.1 序列標註任務
3.3.2 基於特徵的統計學習
3.3.3 基於概率圖模型的方法
3.3.4 基於分類器的方法
3.4 句法分析
3.4.1 句法樹
3.4.2 上下文無關文法
……
第2部分 統計機器翻譯
第3部分 神經機器翻譯
第4部分 機器翻譯前沿
隨筆
後記
附錄A
附錄B
附錄C
參考文獻
索引