數據準備和特徵工程 — 數據工程師必知必會技能
齊偉
- 出版商: 電子工業
- 出版日期: 2020-03-01
- 定價: $270
- 售價: 7.9 折 $213
- 語言: 簡體中文
- 裝訂: 平裝
- ISBN: 7121382636
- ISBN-13: 9787121382635
-
相關分類:
DeepLearning、Data-mining
立即出貨
買這商品的人也買了...
-
挑戰 PHP7/MySQL 程式設計與超強專題特訓班, 4/e (適用PHP5~7,MariaDB)$550$468 -
$403Python 網絡爬蟲實戰, 2/e -
微服務架構設計模式 (Microservices Patterns: With examples in Java)$834$792 -
$280特徵工程入門與實踐 (Feature Engineering Made Easy) -
Pandas 資料分析實戰:使用 Python 進行高效能資料處理及分析 (Learning pandas : High-performance data manipulation and analysis in Python, 2/e)$580$493 -
Python 爬蟲技術 — 深入理解原理、技術與開發$534$507 -
微服務容器化開發實戰$534$507 -
精通機器學習|使用 Scikit-Learn , Keras 與 TensorFlow, 2/e (Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2/e)$1,200$948 -
$2965G+醫療:新技術如何改變醫療產業商業模式 -
$658Angular 應用程序開發指南 -
$505微軟 Azure 實戰參考 -
數據中臺架構:企業數據化最佳實踐$516$490 -
深度學習 -- 硬體設計$750$675 -
$378數據分析通識 -
$352數據中臺實戰:手把手教你搭建數據中臺 -
$534算法與數據中台:基於 Google、Facebook 與微博實踐 -
自動機器學習 (AutoML):方法、系統與挑戰$534$507 -
中臺架構與實現:基於 DDD 和微服務$534$507 -
使用 AWS 在雲端建置 Linux 伺服器的 20堂課$500$395 -
$796瘋狂 Spring Boot 終極講義 -
$454數據中臺建設:從方法論到落地實戰 -
資料科學的統計實務 : 探索資料本質、扎實解讀數據,才是機器學習成功建模的第一步$599$509 -
$1,010人工智能硬件電路設計基礎及應用 -
5G 大規模天線增強技術$1,199$1,139 -
特徵工程的藝術:通用技巧與實用案例$539$512
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
VIP 95折
深入淺出 SSD 測試 : 固態存儲測試流程 方法與工具$594$564 -
VIP 95折
MCP 開發從入門到實戰$515$489 -
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
RISC-V 架構 DSP 處理器設計$534$507 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
85折
$454RAG 實踐權威指南:構建精準、高效大模型之道 -
VIP 95折
CUDA 並行編程與性能優化$714$678 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
VIP 95折
大模型驅動的具身智能 架構,設計與實現$534$507 -
VIP 95折
納米級CMOS VLSI電路(可制造性設計)$474$450 -
VIP 95折
Manus應用與AI Agent設計指南:從入門到精通$359$341 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
VIP 95折
芯片的較量 (日美半導體風雲)$414$393 -
VIP 95折
Manus AI 智能體從入門到精通$294$279 -
VIP 95折
深度學習:基礎與概念$1,128$1,072 -
85折
$505GitHub Copilot 編程指南 -
87折
$469Cursor 與 Copilot 開發實戰 : 讓煩瑣編程智能化 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
Verilog HDL 計算機網絡典型電路算法設計與實現$354$336 -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673
簡體館年度書展|現貨2書79折3書75折 詳見活動內容 »
-
85折
$806Linux x64 匯編語言編程 -
VIP 95折
MCP 極簡開發 : 輕鬆打造高效智能體$479$455 -
VIP 95折
硬件系統模糊測試:技術揭秘與案例剖析$419$398 -
VIP 95折
生成式視覺模型原理與實踐$288$274 -
87折
$459AI大模型:賦能通信產業 -
VIP 95折
科學預測——預見科學之美$408$388 -
VIP 95折
Processing創意編程入門:從編程原理到項目案例$299$284 -
87折
$360高薪Offer 簡歷、面試、談薪完全攻略 -
VIP 95折
軟件系統優化$534$507 -
85折
$505GitHub Copilot 編程指南 -
85折
$551C#核心編程200例(視頻課程+全套源程序) -
VIP 95折
SAAS + AI 架構實戰:業務解析、架構設計、AI 應用$708$673 -
VIP 95折
深入淺出 Docker, 2/e$419$398 -
85折
$658Unity 特效制作:Shader Graph 案例精講 -
79折
$275零基礎玩轉國產大模型DeepSeek -
VIP 95折
人工智能大模型:機器學習基礎$774$735 -
VIP 95折
RAG 極簡入門:原理與實踐$419$398 -
VIP 95折
大模型實戰 : 從零實現 RAG 與 Agent 系統$419$398 -
VIP 95折
算法趣學(第2版)$348$331 -
VIP 95折
大模型理論與實踐——打造行業智能助手$354$336 -
VIP 95折
大模型應用開發 RAG 實戰課$599$569 -
85折
$509生成式人工智能 (基於 PyTorch 實現) -
VIP 95折
機器人抓取力學$894$849 -
VIP 95折
集成電路版圖設計從入門到精通$474$450 -
VIP 95折
Java 學習筆記, 6/e$839$797
相關主題
商品描述
本書詳細地介紹了大數據、人工智能等項目中不可或缺的環節和內容:數據準備和特徵工程。書中的每節首先以簡明方式介紹了基本知識;然後通過實際案例演示了基本知識的實際應用,並提供了針對性練習項目,將“知識、案例、練習”融為一體;最後以“擴展探究”方式引導讀者進入更深廣的領域。本書既適合作為大學相關專業的教材,也適合作為大數據、人工智能等領域的開發人員的參考讀物。
作者簡介
齊偉
自稱老齊,現居蘇州,所著在線教程《零基礎學Python》及《
零基礎學Python(第2版)》在業內引起非常大的反響。
願意和來自各方的朋友討論技術問題,並能提供相關技術服務
目錄大綱
目錄
第1章感知數據............................................ ............... 001
1.0瞭解數據科學項目............................................ ..... 001
1.1文件中的數據............................................ ......... 003
1.1.1CSV文件............................................ ....... 003
1.1.2Excel文件............................................ ..... 009
1.1.3圖像文件............................................ ...... 015
1.2數據庫中的數據............................................ ....... 019
1.3網頁上的數據............................................ ......... 029
1.4來自API的數據............................................ ........ 039
第2章數據清理............................................ ............... 044
2.0基本概念.............................................. ........... 045
2.1轉化數據類型............................................. ........ 046
2.2處理重複數據............................................. ........ 054
2.3處理缺失數據............................................. ........ 057
2.3.1檢查缺失數據........................................... ... 058
2.3.2用指定值填補.......................................... .... 063
2.3.3根據規律填補........................................... ... 069
2.4處理離群數據............................................ ......... 076
第3章特徵變換............................................ ............... 083
3.0特徵的類型............................................. .......... 084
3.1特徵數值化............................................. .......... 085
3.2特徵二值化............................................ ........... 088
3.3OneHot編碼.............................................. ......... 093
3.4數據變換.............................................. ........... 098
3.5特徵離散化............................................. .......... 104
3.5.1無監督離散化.......................................... .... 104
3.5.2有監督離散化.......................................... .... 110
3.6數據規範化.............................................. ......... 113
第4章特徵選擇............................................ ............... 124
4.0特徵選擇簡述............................................ ......... 124
4.1封裝器法............................................. ............ 127
4.1.1循序特徵選擇........................................... ... 127
4.1.2窮舉特徵選擇.......................................... .... 135
4.1.3遞歸特徵消除....................................... 140
4.2過濾器法............................................. .... 144
4.3嵌入法.............................................. ..... 149
第5章特徵抽取............................................ ....... 154
5.1 ① 無監督特徵抽取.......................................... 154
5.1.1主成分分析......................................... 154
5.1.2因子分析........................................... 161
5.2有監督特徵抽取........................................... 167
附錄AJupyter簡介............................................. ... 173
附錄BNumPy簡介............................................. ..... 176
附錄CPandas簡介............................................. .... 185
附錄DMatplotlib簡介............................................. 194
後記 199
