網站擷取|使用 Python, 2/e (Web Scraping with Python: Collecting More Data from the Modern Web, 2/e)
Ryan Mitchell 楊尊一
- 出版商: 歐萊禮
- 出版日期: 2018-10-09
- 定價: $580
- 售價: 7.9 折 $458
- 語言: 繁體中文
- 頁數: 280
- ISBN: 986476926X
- ISBN-13: 9789864769261
-
相關分類:
Web-crawler 網路爬蟲、Python、Web-crawler 網路爬蟲
- 此書翻譯自: Web Scraping with Python: Collecting More Data from the Modern Web, 2/e (Paperback)
-
其他版本:
網站擷取|使用 Python, 3/e (Web Scraping with Python, 3/e)
買這商品的人也買了...
-
Python 錦囊妙計, 3/e (Python Cookbook, 3/e)$880$695 -
精通 Python|運用簡單的套件進行現代運算 (Introducing Python: Modern Computing in Simple Packages)$780$616 -
流暢的 Python|清晰、簡潔、有效的程式設計 (Fluent Python)$980$774 -
Data Science from Scratch|用 Python 學資料科學 (中文版)(Data Science from Scratch: First Principles with Python)$580$458 -
不止是測試:Python 網路爬蟲王者 Selenium$560$476 -
Python 自動化的樂趣|搞定重複瑣碎 & 單調無聊的工作 (中文版) (Automate the Boring Stuff with Python: Practical Programming for Total Beginners)$500$425 -
Python 專家實踐指南|搭乘專業開發者的學習便車 (The Hitchhiker's Guide to Python: Best Practices for Development)$580$458 -
資料視覺化|使用 Python 與 JavaScript (Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data)$680$537 -
TensorFlow + Keras 深度學習人工智慧實務應用$590$460 -
Deep Learning|用 Python 進行深度學習的基礎理論實作$580$458 -
演算法圖鑑:26種演算法 + 7種資料結構,人工智慧、數據分析、邏輯思考的原理和應用 step by step 全圖解$450$356 -
為你自己學 Git$500$425 -
Python 資料科學學習手冊 (Python Data Science Handbook: Essential Tools for Working with Data)$780$616 -
比 Selenium 還強大的網路爬蟲:Scrapy 一本就精通$580$493 -
Deep Learning 深度學習基礎|設計下一代人工智慧演算法 (Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms)$620$490 -
Flask 網頁開發, 2/e (Flask Web Development : Developing Web Applications with Python, 2/e)$580$458 -
Python 資料分析, 2/e (Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2/e)$880$695 -
Python 網路爬蟲與資料分析入門實戰$450$351 -
Python 網路爬蟲與資料視覺化應用實務$650$553 -
深入淺出 Python, 2/e (Head First Python: A Brain-Friendly Guide, 2/e)$880$695 -
金融數據解密|產業研究與策略分析的實用技術指南 (Unlocking Financial Data: A Practical Guide to Technology for Equity and Fixed Income Analysts )$580$458 -
Web API 建構與設計 (Designing Web APIs: Building APIs That Developers Love)$480$379 -
精通 Python|運用簡單的套件進行現代運算, 2/e (Introducing Python: Modern Computing in Simple Packages, 2/e)$880$695 -
Python 自動化的樂趣|搞定重複瑣碎&單調無聊的工作, 2/e (Automate the Boring Stuff with Python : Practical Programming for Total Beginners, 2/e)$680$537 -
使用 Python 搜刮網路資料的 12堂實習課$520$406
相關主題
商品描述
在現代網路蒐集資料
「本書涵蓋的工具與範例,讓我輕易把好幾個重複的工作自動化,騰出時間解決更多有趣的問題。這是本重視成果、內容從實務問題與解法出發,又能很快讀完的好書。」
— Eric VanWyk, 電子計算機工程師,麻州歐林工程學院
如果程式設計是魔術,那麼網站擷取當然是一種魔法。你可以撰寫簡單的自動化程式查詢網頁伺服器、請求資料、並解析所需的資訊。本書不只介紹網頁擷取,還包含擷取各種現代網站資料的詳盡指南。
本書第一部份專注於網站擷取機制:使用Python從網頁伺服器取得資料、執行伺服器回應的基本處理工作、以及與網站的自動化互動。第二部分探索適用於不同擷取場景的各種工具與應用程式。
‧解析複雜HTML網頁
‧以Scrapy架構開發爬行程序
‧學習爬行資料的儲存方式
‧從文件讀取與提煉資料
‧清理格式不良的資料
‧以自然語言讀寫
‧透過表單與登入的爬行
‧JavaScript與API爬行
‧使用影像文字識別軟體
‧避開爬行陷阱與機器人阻擋程序
‧使用爬行程序測試你的網站
目錄大綱
前言
第一部 建構擷取程序
第一章 你的第一個擷取程序
第二章 進階HTML解析
第三章 撰寫網站爬行程序
第四章 網站爬行模型
第五章 Scrapy
第六章 儲存資料
第二部 儲存資料
第七章 讀取文件
第八章 清理髒資料
第九章 讀寫自然語言
第十章 表單與登入
第十一章 與擷取相關的JavaScript
第十二章 透過API 爬行
第十三章 影像處理與文字辨識
第十四章 避開擷取陷阱
第十五章 以爬行程序測試你的網站
第十六章 平行擷取網站
第十七章 遠端擷取
第十八章 網站擷取的法規與道德
索引
