自然語言處理的 Python 實踐 Practical Natural Language Processing with Python: With Case Studies from Industries Using Text Data at Scale

Mathangi Sri 譯 吳偉國

買這商品的人也買了...

相關主題

商品描述

《自然語言處理的Python實踐》通過5章內容深入解讀了自然語言處理(NLP)的文本數據處理方法和行業實際應用。
其中討論了文本數據的根本問題所在和在文本數據中如何提取信息、提取哪種信息等,
同時通過第2~5章,重點講解了客戶服務行業、在線評論、銀行與金融服務及保險行業、
虛擬助手四大NLP重點領域的實際應用方法,其中詳細解讀了意圖挖掘、基於ML的監督學習、
情感分析與挖掘、Word2Vec、CBOW、LSTM、
編碼器-解碼器模型框架和當今NLP領域解決問題效果最好的BERT模型等關鍵技術方法。
內容全面,案例真實。
本書案例均直接深入到各行業,讀者在閱讀學習過程中,
能通過書中相應的代碼和案例思路,真正解決實際工作中遇到的問題。

本書適合各個行業自然語言處理方向的技術人員閱讀學習,
也適合開設自然語言處理課程的院校師生及計算機專業教學參考使用。

作者簡介

吳偉國,無黨派人士。
哈爾濱工業大學教授,博士生導師,機電控制及自動化學科工學博士,日本國立名古屋大學微系統工學博士後研究員。
長期從事工業機器人、仿生仿人機器人及智能運動控制、人工智能、人工情感等方面研究。
作為項目負責人先後主持完成國家自然科學基金、國家863計劃、
國家重點實驗室、歸國留學基金項目以及參與完成各類項目共10餘項。
主持“十三五”國家重點研發計劃項目課題、國家自然科學基金重點課題子課題各1項。
發表學術論文80餘篇,參編“十一五”國家級規劃教材1部,著有國家出版基金項目資助著作3部,
以第1發明人獲發明專利權20項,獲部級科技進步一、二等獎各1項。

目錄大綱

第1章數據類型001
1.1 搜索002
1.2 評論003
1.3 社交媒體中的帖子/博客005
1.4 聊天數據006
1.4.1 私人聊天006
1.4.2 商務聊天和語音通話數據007
1.5 SMS(短信)數據008
1.6 內容數據009
1.7 IVR(交互式語音應答)話語數據010
1.8 數據中的有用信息010

第2章NLP在客戶服務中的應用013
2.1 語音通話014
2.2 聊天015
2.3 票證數據016
2.4 郵件數據016
2.5 客戶需求018
2.5.1 意圖挖掘018
2.5.2 意圖理解的熱門詞彙019
2.5.3 詞云021
2.5.4 主題分類規則024
2.6 基於機器學習的監督學習028
2.6.1 獲取人工標記的數據028
2.6.2 分詞030
2.6.3 文檔詞條矩陣031
2.6.4 數據標準化035
2.7 替換某些模式036
2.8 識別並標註問題所在的行040
2.9 熱門客戶查詢041
2.10 熱門客戶滿意度(CSAT)驅動器043
2.11 熱門淨值(NPS)驅動器045
2.12 深入了解銷售對話050
2.12.1 銷售對話中的熱門產品050
2.12.2 未交易的原因051
2.12.3 調查評論分析052
2.12.4 挖掘語音記錄052

第3章NLP在在線評論中的應用059
3.1 情感分析060
3.2 情感挖掘061
3.3 方法1:基於詞典的方法062
3.4 方法2:基於規則的方法066
3.4.1 觀察結果1 066
3.4.2 觀察結果2 067
3.4.3 觀察結果3 067
3.4.4 觀察結果4 068
3.4.5 總體得分069
3.4.6 處理觀察結果070
3.4.7 情緒分析庫085
3.5 方法3:基於機器學習的方法(神經網絡) 086
3.5.1 語料庫的特徵087
3.5.2 構建神經網絡091
3.5.3 加以完善093
3.6 屬性提取093
3.6.1 步驟1:使用正則表達式進行規範化095
3.6.2 步驟2:提取名詞形式097
3.6.3 步驟3:創建映射文件098
3.6.4 步驟4:將每個評論映射到屬性100
3.6.5 步驟5:品牌分析101

第4章NLP在銀行、金融服務和保險業(BFSI)的應用109
4.1 NLP之於風險控制110
4.1.1 方法1:使用現有的庫111
4.1.2 方法2:提取名詞短語113
4.1.3 方法3:訓練自己的模型115
4.1.4 模型應用142
4.2 NLP在銀行、金融服務和保險業的其他應用案例157
4.2.1 短信數據157
4.2.2 銀行業的自然語言生成158

第5章NLP在虛擬助手中的應用163
5.1 網絡機器人(Bot程序)種類164
5.2 經典方法165
5.2.1 LSTM概述169
5.2.2 LSTM的應用173
5.2.3 時間分佈層174
5.3 生成響應法178
5.3.1 編碼器-解碼器模型框架179
5.3.2 數據集180
5.3.3 框架的實現180
5.3.4 編碼器-解碼器模型框架的訓練189
5.3.5 編碼器輸出192
5.3.6 解碼器輸入192
5.3.7 預處理195
5.3.8 雙向LSTM 200
5.4 BERT(基於轉換器的雙向編碼表徵) 202
5.4.1 語言模型和微調202
5.4.2 BERT概述203
5.4.3 微調BERT以構建分類器208
5.5 構建網上對話機器人的更多細微差別211
5.5.1 單輪對話和多輪對話的比較211
5.5.2 多語言網上機器人213