NLP大模型詳解:基於LangChain、RAGs與Python Mastering NLP from Foundations to LLMs
Gazit, Lior, Ghaffari, Meysam 譯 郝艷傑
商品描述
本書詳細闡述了與NLP大 模型相關的基本解決方案, 主要包括自然語言處理領域 探索,線性代數、概率和統 計學,釋放機器學習在自然 語言處理中的潛力,進行有 效文本預處理以實現 NLP性能,利用傳統機器學 習技術增強文本分類能力, 重新構想文本分類,揭開大 語言模型的神秘面紗,訪問 大語言模型的強大功能,大 語言模型推動的 應用和 創新,分析大語言模型和人 工智能的過去、現在和未來 趨勢,來自 專家的觀 點和預測等內容。此外,本 書還提供了相應的示例、代 碼,以幫助讀者進一步理解 相關方案的實現過程。 本書適合作為高等院校 計算機及相關專業的教材和 教學參考書,也可作為相關 開發人員的自學用書和參考 手冊。
作者簡介
利奧爾·加齊特(Lior Gazit)是一位技術精湛的機器學習專業人士,在組建和領導使用機器學習推動業務增長的團隊方面有著成功的經驗。他是自然語言處理專家,成功開發了創新的機器學習管道和產品。他擁有碩士學位,並在同行評審的期刊和會議上發表過文章。作為金融行業機器學習小組的高級主管和新興初創公司的首席機器學習顧問,Lior是業界受人尊敬的領導者,擁有豐富的知識和經驗可供分享。Lior充滿熱情和靈感,致力於使用機器學習推動其組織的積極變革和發展。
目錄大綱
第1章 自然語言處理領域探索
1.1 本書目標讀者
1.2 自然語言處理的定義
1.3 NLP的歷史和演變
1.4 自然語言機器處理的初步策略
1.5 成功的協同效應——自然語言處理與機器學習的結合
1.6 自然語言處理中的數學和統計學簡介
1.7 理解語言模型——以ChatGPT為例
1.8 小結
1.9 問答
第2章 掌握與機器學習和自然語言處理相關的線性代數、概率和統計學
2.1 線性代數簡介
2.1.1 標量和向量的基本運算
2.1.2 矩陣的基本運算
2.1.3 矩陣定義
2.1.4 行列式
2.2 特征值和特征向量
2.2.1 尋找特征向量的數值方法
2.2.2 特征值分解
2.2.3 奇異值分解
2.3 機器學習的概率基礎
2.3.1 統計獨立
2.3.2 離散隨機變量及其分布
2.3.3 概率密度函數
2.3.4 似然估計
2.3.5 單詞預測
2.3.6 貝葉斯估計
2.4 小結
2.5 延伸閱讀
2.6 參考文獻
第3章 釋放機器學習在自然語言處理中的潛力
3.1 技術要求
3.2 數據探索
3.2.1 數據探索的意義
3.2.2 數據探索常用技術
3.3 數據可視化
3.4 數據清洗
3.4.1 處理缺失值
3.4.2 刪除重覆項
3.4.3 數據標準化和轉換
3.4.4 處理離群值
3.4.5 糾正錯誤
3.5 特征選擇
3.5.1 篩選方法
3.5.2 包裝器方法
3.5.3 嵌入方法
3.5.4 降維技術
3.6 特征工程
3.6.1 特征縮放
3.6.2 特征構建
本書詳細闡述了與NLP大 模型相關的基本解決方案, 主要包括自然語言處理領域 探索,線性代數、概率和統 計學,釋放機器學習在自然 語言處理中的潛力,進行有 效文本預處理以實現 NLP性能,利用傳統機器學 習技術增強文本分類能力, 重新構想文本分類,揭開大 語言模型的神秘面紗,訪問 大語言模型的強大功能,大 語言模型推動的 應用和 創新,分析大語言模型和人 工智能的過去、現在和未來 趨勢,來自 專家的觀 點和預測等內容。此外,本 書還提供了相應的示例、代 碼,以幫助讀者進一步理解 相關方案的實現過程。 本書適合作為高等院校 計算機及相關專業的教材和 教學參考書,也可作為相關 開發人員的自學用書和參考 手冊。