數據算法:Hadoop/Spark大數據處理技巧 数据算法:Hadoop/Spark大数据处理技巧
Mahmoud Parsian(馬哈默德·帕瑞斯安)
- 出版商: 中國電力
- 出版日期: 2016-10-01
- 定價: $768
- 售價: 8.5 折 $653
- 語言: 簡體中文
- 頁數: 696
- 裝訂: 平裝
- ISBN: 7512395949
- ISBN-13: 9787512395947
-
相關分類:
Hadoop、Spark、大數據 Big-data
- 此書翻譯自: Data Algorithms: Recipes for Scaling Up with Hadoop and Spark (Paperback)
已絕版
買這商品的人也買了...
-
$580$458 -
$250機器學習系統設計 (Building Machine Learning Systems with Python)
-
$780$616 -
$580$458 -
$980$774 -
$301Flask Web 開發:基於 Python 的 Web 應用開發實戰 (Flask Web Development: Developing Web Application with Python)
-
$860$731 -
$534$507 -
$680$578 -
$500$395 -
$360$281 -
$580$458 -
$480$379 -
$301Web 接口開發與自動化測試 — 基於 Python 語言
-
$590$460 -
$390$332 -
$352Python 與機器學習實戰:決策樹、集成學習、支持向量機與神經網絡算法詳解及編程實現
-
$505Python 數據處理 (Data Wrangling with Python)
-
$480$379 -
$301Spark與Hadoop大數據分析 (Big Data Analytics)
-
$450$356 -
$500$390 -
$699$629 -
$352OpenStack 常用部署
-
$520$442
相關主題
商品描述
《數據算法:Hadoop/Spark大數據處理技巧》介紹了很多基本設計模式、優化技術和數據挖掘及機器學習解決方案,以解決生物信息學、基因組學、統計和社交網絡分析等領域的很多問題。這還概要介紹了MapReduce、Hadoop和Spark。
主要內容包括:
完成超大量交易的購物籃分析。
數據挖掘算法(K-均值、KNN和樸素貝葉斯)。
使用超大基因組數據完成DNA和RNA測序。
樸素貝葉斯定理和馬爾可夫鏈實現數據和市場預測。
推薦算法和成對文檔相似性。
線性回歸、Cox回歸和皮爾遜(Pearson)相關分析。
等位基因頻率和DNA挖掘。
社交網絡分析(推薦系統、三角形計數和情感分析)。