NLTK 基礎教程 — 用 NLTK 和 Python 庫構建機器學習應用 (NLTK Essentials)
哈登尼亞
- 出版商: 人民郵電
- 出版日期: 2017-06-01
- 定價: $294
- 售價: 8.5 折 $250
- 語言: 簡體中文
- 頁數: 153
- 裝訂: 平裝
- ISBN: 7115452571
- ISBN-13: 9787115452573
-
相關分類:
Machine Learning
- 此書翻譯自: NLTK Essentials
立即出貨 (庫存=1)
買這商品的人也買了...
-
$1,200$1,140 -
$830$747 -
$560Python 自然語言處理 (Natural Language Processing with Python)
-
$475多語自然語言處理:從原理到實踐 (Multilingual Natural Language Processing Applications: From Theory to Practice)
-
$1,617Deep Learning (Hardcover)
-
$500NLP 漢語自然語言處理原理與實踐
-
$360$281 -
$403Tensorflow:實戰Google深度學習框架
-
$403面向機器學習的自然語言標註 (Natural language annotation for macbhine learning)
-
$403TensorFlow技術解析與實戰
-
$403深度學習原理與TensorFlow實踐
-
$356深入淺出深度學習:原理剖析與Python實踐
-
$958深度學習
-
$580$458 -
$301精通 Python 自然語言處理 (Mastering Natural Language Processing with Python)
-
$505情感分析 : 挖掘觀點、情感和情緒 (Sentiment Analysis: Mining Opinions, Sentiments, and Emotions)
-
$301自然語言處理技術入門與實戰
-
$690$587 -
$403$379 -
$1,010自然語言處理綜論, 2/e (Speech and Language Processing, 2/e)
-
$352基於深度學習的自然語言處理/智能科學與技術叢書
-
$420$328 -
$704Python 和 NLTK 自然語言處理 (Natural Language Processing: Python and NLTK)
-
$620$465 -
$880$695
相關主題
商品描述
NLTK 庫是當前自然語言處理(NLP)領域ZUI為流行、使用ZUI為廣泛的庫之一, 同時Python語言經過一段時間的發展也已逐漸成為主流的編程語言之一。本書主要介紹如何通過NLTK庫與一些Python庫的結合從而實現複雜的NLP任務和機器學習應用。全書共分為10章。第1章對NLP進行了簡單介紹。第2章、第3章和第4章主要介紹一些通用的預處理技術、專屬於NLP領域的預處理技術以及命名實體識別技術等。第5章之後的內容側重於介紹如何構建一些NLP應用,涉及文本分類、數據科學和數據處理、社交媒體挖掘和大規模文本挖掘等方面。本書適合 NLP 和機器學習領域的愛好者、對文本處理感興趣的讀者、想要快速學習NLTK的資深Python程序員以及機器學習領域的研究人員閱讀
目錄大綱
第1章自然語言處理簡介\t1
1.1為什麼要學習NLP\t2
1.2先從Python開始吧\t5
1.2.1列表\t5
1.2.2自助功能\t6
1.2.3正則表達式\t8
1.2.4字典\t9
1.2.5編寫函數\t10
1.3向NLTK邁進\t11
1.4練習\t16
1.5小結\t17
第2章文本的歧義及其清理\t18
2.1何謂文本歧義\t18
2.2文本清理\t20
2.3語句分離器\t21
2.4標識化處理\t22
2.5詞幹提取\t23
2.6詞形還原\t24
2.7停用詞移除\t25
2.8罕見詞移除\t26
2.9拼寫糾錯\t26
2.10練習\t27
2.11小結\t28
第3章詞性標註\t29
3.1何謂詞性標註\t29
3.1.1 Stanford標註器\t32
3.1.2深入了解標註器\t33
3.1.3順序性標註器\t35
3.1.4 Brill標註器\t37
3.1. 5基於機器學習的標註器\t37
3.2命名實體識別(NER)\t38
3.3練習\t40
3.4小結\t41
第4章文本結構解析\t43
4.1淺解析與深解析\t43
4.2兩種解析方法\t44
4.3為什麼需要進行解析\t 44
4.4不同的解析器類型\t46
4.4.1遞歸下降解析器\t46
4.4.2移位-歸約解析器\t46
4.4.3圖表解析器\t46
4.4. 4正則表達式解析器\t47
4.5依存性文本解析\t48
4.6語塊分解\t50
4.7信息提取\t53
4.7.1命名實體識別(NER)\t53
4.7.2關係提取\t54
4.8小結\t55
第5章NLP應用\t56
5.1構建第一個NLP應用\t57
5.2其他NLP應用\t60
5.2.1機器翻譯\t60
5.2.2統計型機器翻譯\t61
5.2.3信息檢索\t62
5.2.4語音識別\t64
5.2.5文本分類\t65
5.2.6信息提取\t66
5.2.7問答系統\ t67
5.2.8對話系統\t67
5.2.9詞義消歧\t67
5.2.10主題建模\t68
5.2.11語言檢測\t68
5.2.12光符識別\t68
5 .3小結\t68
第6章文本分類\t70
6.1機器學習\t71
6.2文本分類\t72
6.3取樣操作\t74
6.3.1樸素貝葉斯法\t76
6.3.2決策樹\t79
6.3.3隨機梯度下降法\t80
6.3.4邏輯回歸\t81
6.3.5 支持向量機\t81
6.4隨機森林算法\t83
6.5文本聚類\t83
6.6文本中的主題建模\t84
6.7參考資料\t87
6.8小結\t87
第7章Web爬蟲\t88
7.1 Web爬蟲\t88
7.2編寫第一個爬蟲程序\t89
7.3 Scrapy庫中的數據流\t92
7.3.1 Scrapy庫的shell\t93
7.3.2目標項\ t98
7.4生成網站地圖的蜘蛛程序\t99
7.5目標項管道\t100
7.6參考資料\t102
7.7小結\t102
第8章NLTK與其他Python庫的搭配運用\t104
8.1 NumPy \t104
8.1.1多維數組\t105
8.1.2基本運算\t106
8.1.3從數組中提取數據\t107
8.1.4複雜矩陣運算\t108
8.2 SciPy\t112
8. 2.1線性代數\t113
8.2.2特徵值與特徵向量\t113
8.2.3稀疏矩陣\t114
8.2.4優化措施\t115
8.3 pandas\t117
8.3.1讀取數據\t117
8.3.2數列\t119
8.3.3列轉換\t121
8.3.4噪聲數據\t121
8.4 matplotlib\t123
8.4.1子圖繪製\t123
8.4.2添加坐標軸\t124
8.4.3散點圖繪製\t125
8 .4.4條形圖繪製\t126
8.4.5 3D繪圖\t126
8.5參考資料\t126
8.6小結\t127
第9章Python中的社交媒體挖掘\t128
9.1數據收集\t128
9.2數據提取\t132
9.3地理可視化\t134
9.3.1影響力檢測\t135
9.3.2 Facebook\t135
9.3.3有影響力的朋友\t139
9.4小結\t141
第10章大規模文本挖掘\t142
10.1在Hadoop上使用Python的不同方式\t142
10.1.1 Python的流操作\t143
10.1.2 Hive/Pig下的UDF\t143
10.1. 3流封裝器\t143
10.2 Hadoop上的NLTK\t144
10.2.1用戶定義函數(UDF)\t144
10.2.2 Python的流操作\t146
10.3 Hadoop上的Scikit-learn\t147
10.4 PySpark\t150
10.5小結\t153