AI+Python醫學數據分析實踐

余本國 韓惠蕊 傅渝健

  • 出版商: 清華大學
  • 出版日期: 2025-09-01
  • 售價: $480
  • 語言: 簡體中文
  • ISBN: 7302699186
  • ISBN-13: 9787302699187
  • 相關分類: PythonMachine Learning
  • 尚未上市,歡迎預購

  • AI+Python醫學數據分析實踐-preview-1
  • AI+Python醫學數據分析實踐-preview-2
  • AI+Python醫學數據分析實踐-preview-3
AI+Python醫學數據分析實踐-preview-1

相關主題

商品描述

《AI+Python醫學數據分析實踐》是一本為零編程基礎的數據分析人員而編寫的科研用書,主要針對擬從事數據分析人員、醫學生和醫務工作者,是一本全面的醫用數據分析與機器學習指南,內容涵蓋了Python語法基礎、數據的處理技巧、數據分析與挖掘、數據可視化等,並選用相應的醫療分析綜合案例,幫助大家熟悉數據分析處理的過程。此外,本書還結合前沿大模型技術,詳細介紹了如何利用AI大模型零代碼輔助數據分析的方法。另外,本書還贈送PPT課件,方便讀者學習和使用。

作者簡介

"余本國,博士、副教授、碩士研究生導師。2001年畢業於石河子大學數學系,同年到中北大學(原華北工學院)任教,2012年加拿大York University訪問學者,2019年人才引進到海南醫科大學任教。出版個人著作《感受加拿大遊學周記》《Python數據分析基礎》《基於Python的大數據分析基礎及實戰》《python在機器學習中的應用》《PyTorch深度學習入門與實戰》《python數據分析:從零基礎入門到案例實戰》等十多部。韓惠蕊:博士,2019年人才引進到海南醫科大學任教,主要研究方向為機器學習與智能醫學,獲發明專利1項,發表SCI/EI論文十余篇,指導學生獲多項國家級和省級學科競賽獎。傅渝健:擅長醫療領域數據分析,專註於AI與數據科學技術分享,擁有過萬+粉絲與百萬+閱讀量,致力於傳遞實用與前沿的智能技術知識。 "

目錄大綱

目錄

 

 

 

基 礎 篇

第1章 Python語法基礎

1.1?引言

1.2?Python編輯器

1.3 語法規範

1.4 數據類型

1.5 運算符

1.6 流程控制

1.6.1 選擇結構

1.6.2 循環結構

1.7 常用函數

第2章 NumPy和Pandas

2.1 NumPy

2.1.1 數組的創建

2.1.2 數組的操作

2.1.3 條件篩選

2.2 Pandas

2.2.1 Series的創建與訪問

2.2.2 DataFrame的創建與訪問 

2.2.3  條件篩選 

2.2.4 數據的增刪改

2.2.5 排序 

2.2.6 索引重置 

2.3 讀存數據

2.3.1 讀取數據 

2.3.2 保存數據 

2.4 Pandas其他操作

第3章 數據可視化Matplotlib

3.1 Matplotlib基本繪圖

3.1.1 基本操作

3.1.2 中文符號的顯示

3.2 繪圖

3.2.1 餅圖 

3.2.2 散點圖 

第4章 數據處理

4.1 統計性描述

4.2 異常值處理

4.2.1 重復值的處理

4.2.2 缺失值的處理

4.3 數據列計算

4.3.1 對數據進行替換

4.3.2 數據分組

4.3.3 數據排序

第5章 基因序列查找與翻譯

5.1 讀取查找基因序列

5.2 翻譯蛋白質序列

進 階 篇

第6章 機器學習入門

6.1 分類算法

6.2 回歸算法

6.3 聚類算法

6.4 常見的算法模型

第7章 心臟病風險預測分析

7.1 準備工作

7.2 數據讀取與處理

7.3 模型建立與效果評價

7.3.1 決策樹模型

7.3.2 隨機森林模型

7.3.3 XGBoost模型

7.3.4 CatBoost模型

第8章 模型Shap解讀與保存部署

8.1 Shap解讀模型

8.1.1 Shap值計算

8.1.2 摘要圖(Summary Plot)

8.1.3 Shap特征貢獻圖

8.1.4 依賴圖(Dependence Plot)

8.1.5 力圖(Force Plot)

8.1.6 熱圖(Heatmap)

8.2 模型保存

8.3 模型調用

第9章 胎兒健康多分類預測實現及模型評價

9.1 數據讀取與處理

9.1.1 數據預處理——編碼

9.1.2 數據集劃分

9.2 特征篩選

9.2.1 遞歸特征消除與交叉驗證優化特征選擇

9.2.2 遞歸特征消除與交叉驗證結果可視化

9.3 模型構建

9.4 XGBoost模型預測與分類性能評估

9.5 XGBoost模型的混淆矩陣

9.6 宏平均ROC曲線

9.6.1 XGBoost模型的ROC曲線和宏平均AUC計算

9.6.2 宏平均ROC曲線繪制

9.7 Shap值計算及特征貢獻解釋

9.7.1 繪制模型特征貢獻圖

9.7.2 模型單樣本解釋——瀑布圖

第10章 帕金森病患者特征選擇回歸預測實現

10.1 數據準備

10.2  RF回歸模型的創建與訓練

10.3 特征重要性分析

10.4 特征選擇

10.4.1 蒙特卡洛模擬和交叉驗證

10.4.2 最佳特征選擇

10.5 網格搜索和參數優化

10.6 模型評價

10.7 預測結果可視化

第11章 Python實現單細胞RNA測序數據分析

11.1 準備工作

11.2 單細胞數據讀取與預處理

11.2.1 數據讀取

11.2.2 質量控制

11.3 單細胞RNA測序數據分析

11.3.1 數據規範化

11.3.2 找特征

11.3.3 數據縮放

11.3.4 主成分分析(PCA)

11.3.5 構建圖

11.3.6 聚類

11.3.7 尋找差異基因

11.4 註釋細胞類型

實 戰 篇

第12章 論文復現:可解釋的急性腎損傷預測模型

12.1 數據讀取

12.2 構建模型

12.2.1 AdaBoost

12.2.2 ANN

12.2.3 DT

12.2.4 ET

12.2.5 GBM

12.2.6 KNN

12.2.7 LightGBM

12.2.8 LR

12.2.9 RF

12.2.10 SVM

12.2.11 XGBoost

12.3 模型特征的選擇

12.3.1 模型選擇

12.3.2 基於Shap的特征選擇

12.4 模型重構 

12.5 利用Shap對模型進行解釋 

高?級?AI?篇

第13章 PandasAI智能分析

13.1 安裝PandasAI

13.2 開始使用

13.3 存儲數據集

13.4 加載數據集

第14章 Trae智能分析

14.1?安裝Trae

14.2?AI編寫代碼

14.3?AI生成完整代碼

附錄A 模型App部署

A.1 部署準備

A.2 生成URL

附錄B 隨機森林參數調優與缺失值處理

B.1 超參數調優

B.2 隨機森林缺失值處理