Spark技術手冊|輕鬆寫意處理大數據
活動訊息
內容簡介
本書是由Spark這個專案的成員所撰寫,詳盡的說明如何使用、部署與維運Apache Spark。本書將帶領您探索Spark結構化API基礎操作、結構化串流,並透過新的高階API建立端到端的串流應用。開發與系統管理人員可由本書學習到如何進行Spark的監控、調校以及除錯,以及如何使用MLlib分散式機器學習函式庫。
.完整說明大數據與Spark
.透過實際的範例學習DataFrame、SQL與Dataset等Spark核心API概念
.深入了解Spark低階API、RDD以及DataFrame與SQL的關係
.學習如何在叢集環境運行Spark
.針對Spark叢集與應用程式進行除錯、監控與調校
.體會Spark結構化串流處理引擎的威力
.學習MLlib函式庫並將其應用於多種分類或推薦等機器學習專案中
Bill Chambers是Databricks的產品經理,專注於大數據分析並提供企業用戶完整的文件與協作讓客戶藉由Spark與Databricks取得成功。
Matei Zaharia是史丹佛電腦科學系的助理教授以及Databricks的技術長。他於2009在加州柏克萊大學發起Spark專案,同時他也是Apache Mesos專案的共同發起人以及Apache Hadoop的早期貢獻者。
.完整說明大數據與Spark
.透過實際的範例學習DataFrame、SQL與Dataset等Spark核心API概念
.深入了解Spark低階API、RDD以及DataFrame與SQL的關係
.學習如何在叢集環境運行Spark
.針對Spark叢集與應用程式進行除錯、監控與調校
.體會Spark結構化串流處理引擎的威力
.學習MLlib函式庫並將其應用於多種分類或推薦等機器學習專案中
Bill Chambers是Databricks的產品經理,專注於大數據分析並提供企業用戶完整的文件與協作讓客戶藉由Spark與Databricks取得成功。
Matei Zaharia是史丹佛電腦科學系的助理教授以及Databricks的技術長。他於2009在加州柏克萊大學發起Spark專案,同時他也是Apache Mesos專案的共同發起人以及Apache Hadoop的早期貢獻者。
名人推薦
「本書是專業Spark開發人員的必讀指南,提供在其他書上找不到的技巧與訣竅」
—Ion Stoica, Director of the UC Berkeley RISE Lab
—Ion Stoica, Director of the UC Berkeley RISE Lab
目錄
第一篇 大數據與Spark概覽
第1章 何為Apache Spark?
第2章 Spark 簡介
第3章 Spark 工具組導覽
第二篇 結構化API—DataFrame、SQL與Dataset
第4章 結構化API 概覽
第5章 基礎結構化操作
第6章 操作不同型別的資料
第7章 聚合
第8章 關聯
第9章 資料源
第10章 Spark SQL
第11章 Datasets
第三篇 低階API
第12章 彈性分散式資料集(RDD)
第13章 進階RDD
第14章 分散式共享變數
第四篇 Production Applications
第15章 如何在叢集上運行Spark
第16章 開發Spark 應用程式
第17章 部署Spark
第18章 監控與除錯
第19章 效能調校
第五篇 串流
第20章 串流處理基礎
第21章 結構化串流基礎
第22章 事件時間和狀態處理
第23章 生產級的結構化串流
第六篇 進階分析與機器學習概覽
第24章 進階分析與機器學習概覽
第25章 前處理與特徵工程
第26章 分類
第27章 迴歸
第28章 推薦
第29章 非監督式學習
第30章 圖形分析
第31章 深度學習
第32章 其他特定語言: Python(PySpark) 與R(SparkR 和sparklyr)
第33章 生態系與社群
第1章 何為Apache Spark?
第2章 Spark 簡介
第3章 Spark 工具組導覽
第二篇 結構化API—DataFrame、SQL與Dataset
第4章 結構化API 概覽
第5章 基礎結構化操作
第6章 操作不同型別的資料
第7章 聚合
第8章 關聯
第9章 資料源
第10章 Spark SQL
第11章 Datasets
第三篇 低階API
第12章 彈性分散式資料集(RDD)
第13章 進階RDD
第14章 分散式共享變數
第四篇 Production Applications
第15章 如何在叢集上運行Spark
第16章 開發Spark 應用程式
第17章 部署Spark
第18章 監控與除錯
第19章 效能調校
第五篇 串流
第20章 串流處理基礎
第21章 結構化串流基礎
第22章 事件時間和狀態處理
第23章 生產級的結構化串流
第六篇 進階分析與機器學習概覽
第24章 進階分析與機器學習概覽
第25章 前處理與特徵工程
第26章 分類
第27章 迴歸
第28章 推薦
第29章 非監督式學習
第30章 圖形分析
第31章 深度學習
第32章 其他特定語言: Python(PySpark) 與R(SparkR 和sparklyr)
第33章 生態系與社群
配送方式
-
台灣
- 國內宅配:本島、離島
-
到店取貨:
不限金額免運費
-
海外
- 國際快遞:全球
-
港澳店取:
訂購/退換貨須知
退換貨須知:
**提醒您,鑑賞期不等於試用期,退回商品須為全新狀態**
-
依據「消費者保護法」第19條及行政院消費者保護處公告之「通訊交易解除權合理例外情事適用準則」,以下商品購買後,除商品本身有瑕疵外,將不提供7天的猶豫期:
- 易於腐敗、保存期限較短或解約時即將逾期。(如:生鮮食品)
- 依消費者要求所為之客製化給付。(客製化商品)
- 報紙、期刊或雜誌。(含MOOK、外文雜誌)
- 經消費者拆封之影音商品或電腦軟體。
- 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,經消費者事先同意始提供。(如:電子書、電子雜誌、下載版軟體、虛擬商品…等)
- 已拆封之個人衛生用品。(如:內衣褲、刮鬍刀、除毛刀…等)
- 若非上列種類商品,均享有到貨7天的猶豫期(含例假日)。
- 辦理退換貨時,商品(組合商品恕無法接受單獨退貨)必須是您收到商品時的原始狀態(包含商品本體、配件、贈品、保證書、所有附隨資料文件及原廠內外包裝…等),請勿直接使用原廠包裝寄送,或於原廠包裝上黏貼紙張或書寫文字。
- 退回商品若無法回復原狀,將請您負擔回復原狀所需費用,嚴重時將影響您的退貨權益。
商品評價