大資料分析:R基礎及應用 大数据分析:R基础及应用

深圳國泰安教育技術股份有限公司, 中科院深圳先進技術研究院-國泰安金融大數據研究中心

  • 出版商: 清華大學
  • 出版日期: 2016-03-01
  • 定價: $294
  • 售價: 8.5$250
  • 語言: 簡體中文
  • 頁數: 187
  • 裝訂: 平裝
  • ISBN: 7302428638
  • ISBN-13: 9787302428633
  • 相關分類: Data Science
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

相關主題

商品描述

<內容介紹> 

在大數據時代,R以其強大的數據分析挖掘、可視化繪圖等功能,越來越受到社會各個領域的青睞。現在,R的計算引擎、性能、程序包都得到了提升,其中R與大數據分析平臺Hadoop的結合,實現了R對大數據的分析式處理分析。這些不僅大大擴展了R的應用,也擴大了R在各行業的需求。
    為了更好地適應新形勢,掌握大數據分析處理的相關知識是很有必要的。陳工孟、須成忠編著的《大數據分析--R基礎及應用》從理論基礎、方法、實證三方面詳細地闡釋了R和RHadoop的相關理論、技術以及應用,使讀者瞭解大數據的基礎概念,掌握R以及Rhadoop大數據分析技術。本書不僅適合高等院校的各相關專業的本專科生、研究生,也適合零編程基礎的科研人員以及對大數據分析技術感興趣的人士閱讀。本書在內容的選擇和結構的安排上進行了深入的思考,使得不論是R或RHadoop的初學者還是具備一定相關專業知識的人員都能從本書中得到一定的收穫或啟發。

<章節目錄>

第一部分  大數據簡介
第1章  大數據概述
  1.1  大數據的概念
  1.2  大數據的特徵
  1.3  大數據的產生
  1.4  大數據應用案例
第2章  大數據相關技術
  2.1  數據採集和準備
  2.2  分佈式數據庫
  2.3  分佈式數據分析框架
    2.3.1  Hadoop
    2.3.2  HDFS
    2.3.3  HBase
    2.3.4  Hive
    2.3.5  MapReduce
    2.3.6  Strom
  2.4  大數據分析與R
    2.4.1  RHadoop
    2.4.2  RHIPE
    2.4.3  RHive
    2.4.4  RHBase
  2.5  國泰安的大數據
    2.5.1  大數據實驗室建設
    2.5.2  大數據分析平臺
第二部分  R語言
第3章  R語言簡介
  3.1  R語言概述
  3.2  R的下載、安裝和使用
    3.2.1  RGui界面
    3.2.2  RStudio界面
    3.2.3  R的運行
    3.2.4  工作目錄和工作空間
    3.2.5  R語言的幫助
  3.3  R的包
    3.3.1  包的獲取
    3.3.2  包的安裝
    3.3.3  包的加載
    3.3.4  包的使用
第4章  R語言基本操作
  4.1  數據結構
  4.2  數據的基本操作
    4.2.1  賦值和創建
    4.2.2  數據的運算
    4.2.3  數據的導入
  4.3  數據的管理
    4.3.1  數據排序
    4.3.2  數據集的合併
    4.3.3  剔除變量
    4.3.4  數據集提取
    4.3.5  subset函數

  4.4  常用函數
第5章  R語言繪圖
  5.1  繪圖參數
    5.1.1  符號、線條與顏色
    5.1.2  標題、坐標軸與圖例
    5.1.3  文本屬性
    5.1.4  圖形的組合
  5.2  高級繪圖函數
    5.2.1  通用二維圖
    5.2.2  餅圖
    5.2.3  箱線圖
    5.2.4  條形圖
    5.2.5  直方圖
    5.2.6  核密度圖
    5.2.7  點圖
  5.3  低級繪圖函數
第6章  R語言數據分析
  6.1  數據處理基礎函數
    6.1.1  數學函數
    6.1.2  統計函數
    6.1.3  概率函數
    6.1.4  數據分析實例
  6.2  描述性統計分析
    6.2.1  描述統計函數
    6.2.2  軟件包的描述統計
  6.3  多元統計分析
    6.3.1  方差分析
    6.3.2  判別分析
    6.3.3  聚類分析
    6.3.4  主成分分析
    6.3.5  因子分析
    6.3.6  典型相關分析
第三部分  專題實證研究
第7章  金融時間序列建模專題
  7.1  金融時間序列
  7.2  ARMA模型
    7.2.1  ARMA模型簡介
    7.2.2  ARMA模型定階
    7.2.3  ARMA模型擬合
  7.3  GARCH模型
    7.3.1  GARCH模型簡介
    7.3.2  GARCH模型擬合
第8章  動態面板數據專題
  8.1  GMM估計
    8.1.1  系統GMM估計
    8.1.2  GMM估計原理
  8.2  動態面板數據模型的系統GMM估計
第9章  數據挖掘專題
  9.1  關聯規則
  9.2  降維分析

  9.3  社交網絡分析
  9.4  貝葉斯分類法
    9.4.1  貝葉斯定理
    9.4.2  貝葉斯分類實例
  9.5  決策樹
    9.5.1  決策樹原理
    9.5.2  決策樹分類實例
  9.6  人工神經網絡
    9.6.1  三層前饋神經網絡原理
    9.6.2  神經網絡分類實例
  9.7  支持向量機
    9.7.1  支持向量機原理
    9.7.2  支持向量機分類實例
第10章  信息可視化專題
  10.1  繪製地圖
    10.1.1  世界地圖
    10.1.2  中國地圖
    10.1.3  公路線圖
  10.2  可視化實例
    10.2.1  數據
    10.2.2  ggmap
第四部分  RHadoop案例分析
第11章  RHadoop的基本操作
  11.1  數據文件的讀取
  11.2  包的加載
  11.3  基本函數
第12章  RHadoop環境下案例分析
  12.1  回歸分析
    12.1.1  回歸分析原理
    12.1.2  線性回歸分析案例
  12.2  Logistic分析
    12.2.1  Logistic分析原理
    12.2.2  Logistic分析案例
  12.3  判別分析
    12.3.1  線性判別分析原理
    12.3.2  線性判別分析案例
  12.4  聚類分析
    12.4.1  K-means聚類分析原理
    12.4.2  K-means聚類分析案例
  12.5  主成分分析
    12.5.1  主成分分析原理
    12.5.2  主成分分析案例
  12.6  因子分析
    12.6.1  因子分析原理
    12.6.2  因子分析案例
  12.7  商品推薦演算法
    12.7.1  商品推薦演算法原理
    12.7.2  商品推薦案例
  12.8  差異分析
    12.8.1  多維標度法的原理

    12.8.2  差異分析案例
附錄一  國泰安CSMAR數據下載
附錄二  深圳國泰安教育技術股份有限公司簡介
參考文獻