Python 網絡爬蟲與數據可視化應用實戰

陳允傑

出版商: 中國水利水電
出版日期: 2021-11-01
定價: $654
售價: 5.0 折 $327
語言: 簡體中文
頁數: 516
裝訂: 平裝
ISBN: 7517090542
ISBN-13: 9787517090540
相關分類: Web-crawler 網路爬蟲、Data-visualization

立即出貨

買這商品的人也買了...

~~$360~~ $280

Python 設計模式深入解析 (Mastering Python Design Patterns)
$297

圖解Spark：核心技術與案例實戰
~~$560~~ $436

MIS 網管達人的工具箱, 3/e
$402

AWS Lambda 實戰 : 開發事件驅動的無服務器應用程序 (AWS Lambda in Action: Event-Driven Serverless Applications)
$254

亞馬遜 AWS 雲基礎與實戰
~~$474~~ $450

遊戲數據分析實戰
$351

關聯數據:萬維網上的結構化數據
~~$680~~ $578

大數據時代一定要會的 SQL 商業資料分析術
$356

推薦系統實踐
~~$580~~ $493

SQL 語法查詢入門｜挖掘數據真相，征服大數據時代的第一本書 (Practical SQL: A Beginner's Guide to Storytelling with Data)
~~$580~~ $493

SQL 達人的工作現場攻略筆記
~~$534~~ $507

Python 爬蟲技術 — 深入理解原理、技術與開發
$453

Python 3 反爬蟲原理與繞過實戰
$768

AWS 高級網絡官方學習指南 (專項領域) (AWS Certified Advanced Networking Official Study Guide: Specialty Exam)
$351

RPA (流程自動化機器人) 入門 — 手把手教你應用 UiPath 自動化工作
~~$760~~ $600

AI 黃金時期正好學：TensorFlow 2 高手有備而來
~~$780~~ $663

強化式學習：打造最強 AlphaZero 通用演算法
~~$1,000~~ $850

深度強化式學習 (Deep Reinforcement Learning in Action)
$254

文本數據挖掘與 Python 應用
$417

財務報表分析與商業決策
$509

Jupyter 金融應用從入門到實踐
~~$600~~ $468

WebSecurity 網站滲透測試：Burp Suite 完全學習指南（iT邦幫忙鐵人賽系列書）
~~$680~~ $612

機器學習的統計基礎 : 深度學習背後的核心技術
~~$880~~ $695

人工智慧再進化：聯邦學習讓資料更安全穩固
$458

數據中臺：賦能企業實時經營與商業創新

商品描述

《Python 網絡爬蟲與數據可視化應用實戰》
是一本介紹大數據時代用 Python 進行數據獲取、數據清洗和數據可視化分析的技術圖書。
全書共分兩篇，
其中第 1 篇主要介紹了數據獲取的相關知識，具體內容包括 HTML、
JSON 與網絡爬蟲基礎，
爬取靜態網頁，使用 CSS 選擇器爬取數據，遍歷 HTML 網頁並獲取數據，使用 XPath 表達式與 Ixml 包創建爬蟲程序，
使用 Selenium 爬取動態網頁，Scrapy 爬蟲框架的使用，數據存儲等；
第 2 篇主要介紹數據分析及可視化相關知識，具體內容包括數據可視化基礎知識，
Pandsa 數據處理，使用 Pandas、Matplotlib、Seaborn、Bokeh 等工具進行數據分析和可視化等。
每篇均設置特別章
節進行了綜合案例演練，提高綜合水平。
《Python 網絡爬蟲與數據可視化應用實戰》一書內容豐富，涵蓋面廣，
特別適合作為大中專院校相關專業的教材，也適合作為大數據分析相關專業的自學參考書。

作者簡介

陳允傑

中國臺灣地區著名信息技術作家，已出版多本人工智能、
機器學習/深度學習、數據科學、網絡爬蟲、大數據分析和物聯網相關圖書。
另外，他開發了多種幫助初學者學習程序設計的教學工具，
如fChart流程圖解釋器(可執行的流程圖)，支持Python、
JavaScript和C語言的Blockly可視化積木程序編輯器，
並且將相關教學工具導入大專和中高職的圖書和程序設計教學中。

目錄大綱

篇創建Python爬蟲程序——從網頁獲取數據
CHAPTER 1 HTML、JSON與網絡爬蟲的基礎
1-1 認識HTML
1-1-1 HTML的標籤與屬性
l-l-2 HTML網頁結構
1-2 JSON的基礎
1-2-1 認識JSON
1-2-2 JSON的語法
1-3 網絡爬蟲的概念
1-3-1 認識網絡爬蟲
1-3-2 為什麼需要網絡爬蟲
1-3-3 網絡爬蟲的基本步驟
1-4 網絡爬蟲的相關技術
1-4-1 網絡爬蟲使用的相關技術
1-4-2 使用瀏覽器瀏覽網頁的步驟
1-5 Python網絡爬蟲的相關函數庫
1-6 Spyder集成開發環境的使用
CHAPTER 2 從網絡獲取數據
2-1 認識HTTP頭部與httpbin.org服務
2-1-1 HTTP頭部
2-1-2 用開發者工具查看HTTP頭部信息
2-1-3 認識httpbin.org服務
2-2 使用Requests發送HFTF，請求
2-2-1 發送GET請求
2-2-2 發送POST請求
2-3 獲取HTTP響應內容及頭部信息
2-3-1 獲取HTTP響應內容
2-3-2 內置的響應狀態碼
2-3-3 獲取響應的HTTP頭部信息
2-4 發送進階的HTTP請求
2-4-1 訪問Cookie的HTTP請求
2-4-2 創建自定義HTTP頭部的HTTP請求
2-4-3 發送RESTful API的HTTP請求
2-4-4 發送需要認證的HTTP請求
2-4-5 使用timeout參數請求時間
2-5 錯誤/異常處理與文件訪問
2-5-1 Requests的異常處理
2-5-2 Python文件訪問
CHAPTER 3 爬取靜態HTML網頁數據
3-1 在HTML網頁定位數據
3-1-1 網絡爬蟲的數據爬取工作
3-1-2 如何定位網頁數據
3-2 使用BeautifulSoup解析HTML網頁
3-2-1 創建BeautifulSoup對象
3-2-2 輸出解析的HTML網頁
3-2-3 BeautifulSoup的對像說明
……
第二篇 Python數據可視化——大數據分析

Python 網絡爬蟲與數據可視化應用實戰

陳允傑

買這商品的人也買了...

商品描述

作者簡介

目錄大綱

類似商品