自然語言處理實戰:演算法卷

陳繼生

相關主題

商品描述

本書深入探討了NLP的核心演算法和實際應用,從基礎理論到高階技術,較為全面地展示了NLP領域的前沿發展。
書中主要內容涉及文字預處理演算法、特徵提取、文本分類與情感分析演算法、語言生成演算法、
語意分析與理解演算法、機器翻譯演算法,以及三個NLP實戰案例(智慧客服系統、文字摘要係統、消費者投訴處理模型)。
透過清晰的解釋、實用的範例和實戰項目,讀者可在掌握NLP演算法的同時獲得實際專案開發的經驗。
透過對本書的學習,讀者將有系統地了解NLP領域的理論和實踐,培養對自然語言處理的深刻理解及解決實際問題的能力。
這本書旨在成為NLP領域實踐者和學習者的權威指南。

目錄大綱

第1章 人工智慧與自然語言處理基礎
1.1 人工智慧
1.1.1 人工智慧的發展歷程
1.1.2 人工智慧的研究領域
1.2 機器學習與深度學習
1.2.1 機器學習
1.2.2 深度學習
1.2.3 機器學習和深度學習的區別
1.3 什麼是自然語言處理
1.4 自然語言處理的挑戰與機遇
1.4.1 挑戰
1.4.2 機遇
第2章 文字預處理演算法
2.1 分詞
2.1.1 分詞的重要性和基本原理
2.1.2 基於空格的分詞
2.1.3 基於標點符號的分詞
2.2 詞幹化與詞形還原
2.2.1 詞幹化與詞形還原的區別
2.2.2 詞幹化演算法
2.2.3 詞形還原演算法
2.3 去除停用詞
2.3.1 什麼是停用詞
2.3.2 基於詞彙列表的停用詞去除
2.3.3 基於詞頻的停用詞去除
2.3.4 使用TF-IDF演算法去除停用詞
2.3.5 利用機器學習方法去除停用詞
2.4 資料清洗與處理
2.4.1 處理缺失值
2.4.2 異常值檢測與處理
2.4.3 處理重複數據
第3章 特徵提取
3.1 特徵的類型
3.2 特徵選擇
3.2.1 特徵選擇的必要性
3.2.2 特徵選擇的方法
3.3 特徵抽取
3.3.1 特徵抽取的概念
3.3.2 主成分分析
3.3.3 獨立成分分析
3.3.4 自動編碼器
3.4 嵌入
3.4.1 嵌入的重要應用場景
3.4.2 PyTorch嵌入層的特徵提取
3.4.3 TensorFlow嵌入層的特徵提取
3.4.4 Word2Vec模型
3.4.5 GloVe模型
3.5 詞袋模型
3.5.1 詞袋模型的實現步驟與具體範例
3.5.2 詞袋模型的限制與改進
3.6 TF-IDF
3.6.1 TF-IDF關鍵概念與計算方式
3.6.2 使用TF-IDF擷取文字特徵
第4章 文本分類與情感分析演算法
4.1 樸素貝葉斯分類器
4.1.1 樸素貝葉斯分類器的基本原理與應用場景範例
4.1.2 應用場景範例:垃圾郵件過濾
4.2 支持向量機
4.2.1 支持向量機的核心思想與主要原理
4.2.2 線性SVM與非線性SVM
4.3 隨機森林演算法
4.3.1 隨機森林演算法的主要原理與應用場景
4.3.2 隨機森林演算法應用:垃圾郵件分類器
4.4 卷積神經網絡
4.4.1 卷積神經網路的發展背景
4.4.2 卷積神經網路的結構
4.4.3 卷積神經網路實戰案例
4.5 循環神經網絡
4.5.1 循環神經網路介紹
4.5.2 文本分類
4.5.3 循環神經網路實戰案例1:使用PyTorch開發歌詞生成器模型
4.5.4 循環神經網路實戰案例2:使用TensorFlow製作情緒分析模型
4.6 遞歸神經網絡
4.6.1 遞歸神經網路介紹
4.6.2 RvNN
第5章 語言生成演算法
5.1 基於規則的生成演算法
5.1.1 基於規則的生成演算法的優缺點
5.1.2 基於規則的生成演算法在自然語言處理中的應用場景
5.2 基於統計的生成演算法
5.2.1 基於統計的生成演算法介紹
5.2.2 常見基於統計的生成模型
5.2.3 N-gram模型
5.2.4 隱馬可夫模型
5.2.5 最大熵模型
5.3 基於神經網路的生成模型
5.3.1 常見的神經網路為基礎的生成模型
5.3.2 神經網路生成的基本原理
5.3.3 生成對抗網絡
5.4 注意力機制
5.4.1 注意力機制介紹
5.4.2 注意力機制的變體
5.4.3 注意力機制解決什麼問題
5.5 序列到序列模型
5.5.1 Seq2Seq模型介紹
5.5.2 Seq2Seq編碼器-解碼器結構
5.5.3 使用Seq2Seq模型實作翻譯系統
第6章 語意分析與理解演算法
6.1 詞義表示
6.2 語意相似度計算
6.2.1 語意相似度的重要性
6.2.2 詞彙語意相似度計算方法
6.2.3 文本語意相似度計算方法
6.3 命名實體識別
6.3.1 命名實體辨識介紹
6.3.2 基於規則的NER方法
6.3.3 基於機器學習的NER方法
6.4 語意角色標註
6.4.1 語意角色標註介紹
6.4.2 基於深度學習的SRL方法
6.5 依存分析
6.5.1 依存分析介紹
6.5.2 依存分析的基本步驟
6.5.3 依存分析的方法
6.5.4 依存分析在自然語言處理的應用
6.6 語法樹生成
6.6.1 文法樹介紹
6.6.2 語法樹生成的基本原理
6.6.3 生成語法樹的方法
6.6.4 基於上下文無關文法的語法樹生成
6.7 知識圖譜與圖資料分析
6.7.1 知識圖譜的特點
6.7.2 知識圖譜的建構方法
6.7.3 圖表資料分析的基本原理
6.7.4 圖資料分析的應用場景
第7章 機器翻譯演算法
7.1 常見的機器翻譯演算法
7.2 統計機器翻譯
7.2.1 統計機器翻譯的實作步驟
7.2.2 常見的SMT模型
7.2.3 SMT的訓練和解碼
7.3 神經機器翻譯
7.3.1 NMT模型的一般工作流程
7.3.2 NMT的應用領域
7.3.3 NMT的訓練和解碼
7.3.4 基於NMT的簡易翻譯系統
7.4 跨語言情緒分析
7.4.1 跨語言情緒分析介紹