數據科學導論 : Python 語言實現 数据科学导论:Python语言实现 (数据科学与工程技术丛书)
阿爾貝托·博斯凱蒂(Alberto Boschetti), 盧卡·馬薩羅(Luca Massaron)
- 出版商: 機械工業
- 出版日期: 2016-07-01
- 定價: $294
- 售價: 7.9 折 $232
- 語言: 簡體中文
- 頁數: 180
- ISBN: 711154434X
- ISBN-13: 9787111544340
-
相關分類:
Python
- 此書翻譯自: Python Data Science Essentials
立即出貨 (庫存 < 3)
買這商品的人也買了...
-
$294Python 數據分析基礎教程-NumPy 學習指南, 2/e (NumPy Beginner's Guide, 2/e) -
$294機器學習系統設計 (Building Machine Learning Systems with Python) -
$474OpenCV 3 編程入門 -
雲端網頁程式設計 - Google App Engine 使用 Python$290$226 -
$293Python 資料分析 (Python Data Analysis) -
$294OpenCV 影像處理 -
$534OpenCV 圖像處理編程實例 -
$414Python 計算機視覺編程 (Programming Computer Vision with Python) -
$354Python 數據挖掘入門與實踐 (Learning Data Mining with Python) -
$414Python 編程快速上手 : 讓繁瑣工作自動化 (Automate the boring stuff with Python) -
$147OpenCV 3 計算機視覺 : Python 語言實現, 2/e (Learning OpenCV 3 Computer Vision with Python, 2/e) -
實用 Python 程式設計$350$175 -
機器學習 | 使用 Python 進行預測分析的基本技術$580$493 -
$270用 Python 寫網絡爬蟲 (Web Scraping with Python) -
$177Python數據分析實戰 -
不止是測試:Python 網路爬蟲王者 Selenium$560$476 -
$534OpenCV 編程案例詳解 -
$297OpenCV 項目開發實戰 -
王者歸來:Python 在大數據科學計算上的最佳實作$860$731 -
$250Python 科學計算基礎教程 -
$403機器學習之路 : Caffe、Keras、scikit-learn 實戰 -
初探機器學習|使用 Python (Thoughtful Machine Learning with Python)$480$379 -
$301Python 數據科學導論:概念、技術與應用 -
$374從零開始學Python數據分析與挖掘 -
$236Python機器學習 5個數據科學家案例解析
中文年末書展|繁簡參展書2書75折 詳見活動內容 »
-
75折
為你寫的 Vue Components:從原子到系統,一步步用設計思維打造面面俱到的元件實戰力 (iThome 鐵人賽系列書)$780$585 -
75折
BDD in Action, 2/e (中文版)$960$720 -
75折
看不見的戰場:社群、AI 與企業資安危機$750$563 -
79折
AI 精準提問 × 高效應用:DeepSeek、ChatGPT、Claude、Gemini、Copilot 一本搞定$390$308 -
7折
超實用!Word.Excel.PowerPoint 辦公室 Office 365 省時高手必備 50招, 4/e (暢銷回饋版)$420$294 -
75折
裂縫碎光:資安數位生存戰$550$412 -
日本當代最強插畫 2025 : 150位當代最強畫師豪華作品集$640$576 -
79折
Google BI 解決方案:Looker Studio × AI 數據驅動行銷實作,完美整合 Google Analytics 4、Google Ads、ChatGPT、Gemini$630$498 -
79折
超有料 Plus!職場第一實用的 AI 工作術 - 用對 AI 工具、自動化 Agent, 讓生產力全面進化!$599$473 -
75折
從零開始學 Visual C# 2022 程式設計, 4/e (暢銷回饋版)$690$518 -
75折
Windows 11 制霸攻略:圖解 AI 與 Copilot 應用,輕鬆搞懂新手必學的 Windows 技巧$640$480 -
75折
精準駕馭 Word!論文寫作絕非難事 (好評回饋版)$480$360 -
Sam Yang 的插畫藝術:用 Procreate / PS 畫出最強男友視角 x 女孩美好日常$699$629 -
79折
AI 加持!Google Sheets 超級工作流$599$473 -
78折
想要 SSR? 快使用 Nuxt 吧!:Nuxt 讓 Vue.js 更好處理 SEO 搜尋引擎最佳化(iThome鐵人賽系列書)$780$608 -
78折
超實用!業務.總管.人資的辦公室 WORD 365 省時高手必備 50招 (第二版)$500$390 -
7折
Node-RED + YOLO + ESP32-CAM:AIoT 智慧物聯網與邊緣 AI 專題實戰$680$476 -
79折
「生成式⇄AI」:52 個零程式互動體驗,打造新世代人工智慧素養$599$473 -
7折
Windows APT Warfare:惡意程式前線戰術指南, 3/e$720$504 -
75折
我輩程式人:回顧從 Ada 到 AI 這條程式路,程式人如何改變世界的歷史與未來展望 (We, Programmers: A Chronicle of Coders from Ada to AI)$850$637 -
75折
不用自己寫!用 GitHub Copilot 搞定 LLM 應用開發$600$450 -
79折
Tensorflow 接班王者:Google JAX 深度學習又快又強大 (好評回饋版)$780$616 -
79折
GPT4 會你也會 - 共融機器人的多模態互動式情感分析 (好評回饋版)$700$553 -
79折
技術士技能檢定 電腦軟體應用丙級術科解題教本|Office 2021$460$363 -
75折
Notion 與 Notion AI 全能實戰手冊:生活、學習與職場的智慧策略 (暢銷回饋版)$560$420
相關主題
商品描述
<內容簡介>
本書首先介紹如何設置基本的數據科學工具箱,然後帶你進入數據改寫和預處理階段,這一部分主要是闡明所有與核心數據科學活動相關的數據分析過程,如數據加載、轉換、修復以及數據探索和處理等。隨後,通過主要的機器學習算法、圖形分析技術,以及所有易於表現結果的可視化工具,實現對數據科學的概述。
<章節目錄>
譯者序
前言
第1章新手上路1
1.1數據科學與Python簡介1
1.2 Python的安裝2
1.2.1 Python 2還是Python 33
1.2.2分步安裝3
1.2.3 Python核心工具包一瞥4
1.2.4工具包的安裝7
1.2.5工具包升級9
1.3科學計算發行版9
1.3.1 Anaconda10
1.3.2 Enthought Canopy10
1.3.3 PythonXY10
1.3.4 WinPython10
1.4 IPython簡介10
1.4.1 IPython Notebook12
1.4.2本書使用的數據集和代碼18
1.5小結25
第2章數據改寫26
2.1數據科學過程26
2.2使用pandas進行數據加載與預處理27
2.2.1數據快捷加載27
2.2.2處理問題數據30
2.2.3處理大數據集32
2.2.4訪問其他數據格式36
2.2.5數據預處理37
2.2.6數據選擇39
2.3使用分類數據和文本數據41
2.4使用NumPy進行數據處理49
2.4.1 NumPy中的N維數組49
2.4.2 NumPy ndarray對象基礎50
2.5創建NumPy數組50
2.5.1從列表到一維數組50
2.5.2控制內存大小51
2.5.3異構列表52
2.5.4從列表到多維數組53
2.5.5改變量組大小54
2.5.6利用NumPy函數生成數組56
2.5.7直接從文件中獲得數組57
2.5.8從pandas提取數據57
2.6 NumPy快速操作和計算58
2.6.1矩陣運算60
2.6.2 NumPy數組切片和索引61
2.6 .3 NumPy數組堆疊63
2.7小結65
第3章數據科學流程66
3.1 EDA簡介66
3.2特徵創建70
3.3維數約簡72
3.3.1協方差矩陣72
3.3.2主成分分析73
3.3.3一種用於大數據的PCA變型—Randomized PCA76
3.3.4潛在因素分析77
3.3.5線性判別分析77
3.3.6潛在語義分析78
3.3.7獨立成分分析78
3.3.8核主成分分析78
3.3.9受限玻耳茲曼機80
3.4異常檢測和處理81
3.4.1單變量異常檢測82
3.4.2 EllipticEnvelope83
3.4.3 OneClassSVM87
3.5評分函數90
3.5.1多標號分類90
3.5.2二值分類92
3.5.3回歸93
3.6測試和驗證93
3.7交叉驗證97
3.7.1使用交叉驗證疊代器99
3.7.2採樣和自舉方法100
3.8超參數優化102
3.8.1建立自定義評分函數104
3.8.2減少網格搜索時間106
3.9特徵選擇108
3.9.1單變量選擇108
3.9.2遞歸消除110
3.9.3穩定性選擇與基於L1的選擇111
3.10小結112
第4章機器學習113
4.1線性和邏輯回歸113
4.2樸素貝葉斯116
4.3 K近鄰118
4.4高級非線性算法119
4.4.1基於SVM的分類算法120
4.4.2基於SVM的回歸算法122
4.4.3調整SVM123
4.5組合策略124
4.5.1基於隨機樣本的粘合策略125
4.5 .2基於弱組合的分袋策略125
4.5.3隨機子空間和隨機分片126
4.5.4模型序列—AdaBoost127
4.5.5梯度樹提升128
4.5.6處理大數據129
4.6自然語言處理一瞥136
4.6. 1詞語分詞136
4.6.2詞幹提取137
4.6.3詞性標註137
4.6.4命名實體識別138
4.6.5停止詞139
4.6.6一個完整的數據科學示例—文本分類140
4.7無監督學習概述141
4.8小結146
第5章社會網絡分析147
5.1圖論簡介147
5.2圖的算法152
5.3圖的加載、輸出和採樣157
5.4小結160
第6章可視化161
6.1 matplotlib基礎介紹161
6.1.1曲線繪圖162
6.1.2繪製分塊圖163
6.1.3散點圖164
6.1.4直方圖165
6.1.5柱狀圖166
6.1.6圖像可視化167
6.2 pandas的幾個圖形示例169
6.2.1箱線圖與直方圖170
6.2. 2散點圖171
6.2.3平行坐標173
6.3高級數據學習表示174
6.3.1學習曲線174
6.3.2驗證曲線176
6.3.3特徵重要性177
6.3.4 GBT部分依賴關係圖179
6.4小結180
