0920~0926_夏季暢銷第三波BN

超越多顯卡多機器:分散式機器學習超速實戰

  • 9 900
    1000

活動訊息

想找書的時候,特別想偷看網友的書櫃... 原來大家都在看這本 ↓↓↓

用閱讀開啟視野,讓書成為照亮你人生的光
【金石堂選書】本月推薦您這些好書👉 快來看看

內容簡介

在Hadoo/Spark/Mahout/Tensorflow上跑多機器多片GPU的機器學習

 

機器學習在神經網路和GPU流行起來之後大放異彩,連販夫走足都CNN/RNN朗朗上口,然而許多企業/研究機關/學校在花了大筆預算購買昂貴的硬體時,卻不知如何採購,更不用說如何應用這些硬體來進行研發或產品開發了。本書作者是知名電商的創辦人,其不止在機器學習上有十足的實務經驗,在面對大量資料的場景下,更能利用前人的智慧,用上了Big Data最流行的Hadoop/Spark平台。尤有甚者,在新一代的AI函數庫面世時,也能充分利用這些函數庫的GPU加速,將多機器,多GPU的資源應用在大型專案上。

 

業界獨有

全書以Hadoop/Spark為基礎,加上使用了最流行的TensorFlow on Hadoop,更使用了分散式系統最老牌的Mahout,有別於一般只介紹Python/TensorFlow的坊間書籍,是市場上唯一僅有完整從Hadoop一直延伸到神經網路。

 

內容完整豐富

本書以分散式機器學習為主線,以實戰為主要目的。共分為8章,分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法系統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平台、Spark分散式機器學習平台、分散式深度學習實戰、完整工業級系統實戰(推薦演算法系統實戰、人臉辨識實戰、對話機器人實戰)等內容。

 

適合讀者

適合分散式機器學習的初學者閱讀,對於有一定經驗的分散式巨量資料方向的從業人員及演算法工程師,也可以從書中獲取很多有價值的知識,並透過實戰專案更佳地理解分散式機器學習的核心內容。

作者

陳敬雷
 
充電了麼創始人。擁有十幾年互聯網從業經驗,在技術領域,尤其在大數據和人工智慧方向有豐富的演算法工程落地實戰經驗。目前專注於大數據和人工智慧驅動的上班族線上教育行業,研發了充電了麼App,用深度學習演算法、NLP、推薦引擎等技術來高效提升線上學習效率。

目錄

第1 章 網際網路公司巨量資料和人工智慧那些事
1.1 巨量資料和人工智慧在網際網路公司扮演的角色和重要性
1.2 巨量資料部門組織架構和各種職務介紹 

第2 章 巨量資料演算法系統架構
2.1 經典應用場景
2.2 應用系統架構設計

第3 章 巨量資料基礎
3.1 Hadoop 巨量資料平台架設
3.2 Hive 資料倉儲實戰
3.3 HBase 實戰
3.4 Sqoop 資料ETL 工具實戰
3.5 Spark 基礎

第4 章 Docker 容器
4.1 Docker 介紹
4.2 Docker 容器部署

第5 章 Mahout 分散式機器學習平台
5.1 Mahout 採擷平台
5.2 Mahout 機器學習演算法

第6 章 Spark 分散式機器學習平台
6.1 Spark 機器學習函數庫
6.2 各個演算法介紹和程式設計實戰

第7 章 分散式深度學習實戰
7.1 TensorFlow 深度學習框架
7.2 MXNet 深度學習框架
7.3 神經網路演算法

第8 章 完整工業級系統實戰
8.1 推薦演算法系統實戰
8.2 人臉辨識實戰
8.3 對話機器人實戰

參考文獻

序/導讀

 

網際網路技術的發展催生了巨量資料平台,尤其公司巨量資料部門基本是以Hadoop巨量資料平台為基礎,在這之上透過機器學習建模、演算法工程落地成產品,透過資料分析進行巨量資料視覺化展示來影響管理層決策。另外,以資料和機器學習來科學地驅動產品設計也成為主流。隨著巨量使用者資料的累積,傳統單機版機器學習框架已經不能滿足資料日益增長的需求,於是分散式機器學習應運而生。本書以分散式機器學習為主線,對目前主流的分散式機器學習框架和演算法進行重點講解,偏重實戰,最後是幾個工業級的系統實戰專案。

 

全書共分為8章,分別介紹網際網路公司巨量資料和人工智慧、巨量資料演算法系統架構、巨量資料基礎、Docker容器、Mahout分散式機器學習平台、Spark分散式機器學習平台、分散式深度學習實戰、完整工業級系統實戰(推薦演算法系統實戰、人臉辨識實戰、對話機器人實戰)等內容。

 

第1章介紹了巨量資料常用框架及人工智慧的常用演算法,並且對公司實際的巨量資料部門組織架構,以及每個職務的技能要求、發展方向、市場薪資水準等都做了介紹,這一章可以幫助讀者從整體上認識巨量資料和人工智慧的常用技術框架和演算法,以及公司的實際工作場景。第2章介紹應用場景,並且對個性化推薦系統、個性化搜索、人物誌系統的架構原理做了深入的講解,方便從整體上把握一個完整的系統,提高系統架構設計能力,並指導讀者針對某個系統模組應該掌握哪些核心技術。第3章講解巨量資料基礎,為後面的分散式機器學習平台打基礎。第4章講解Docker容器,可以幫讀者快速建構標準化運行環境,以便節省時間和簡化部署。第5章講解的Mahout分散式機器學習是基於Hadoop的MapReduce計算引擎來分散式訓練的。第6章介紹Spark如何讀取Hadoop分散式儲存檔案系統HDFS上的資料在記憶體裡做疊代計算,以此提高訓練性能。第7章介紹基於TensorFlow和MXNet框架基礎上的神經網路演算法如何讀取Hadoop的HDFS資料,如何使用Kubernetes管理叢集進行分散式訓練。第5~7章是本書分散式機器學習的主線。第8章突出本書的實戰性,尤其是推薦系統的實戰,能讓讀者完整地認識實際工作中的系統產品是怎樣來做的,以便快速地投入到實際工作中去。  

 

陳敬雷

配送方式

  • 台灣
    • 國內宅配:本島、離島
    • 到店取貨:
      金石堂門市 不限金額免運費
      7-11便利商店 ok便利商店 萊爾富便利商店 全家便利商店
  • 海外
    • 國際快遞:全球
    • 港澳店取:
      ok便利商店 順豐 7-11便利商店

詳細資料

詳細資料

    • 語言
    • 中文繁體
    • 裝訂
    • 紙本平裝
    • ISBN
    • 9789860776546
    • 分級
    • 普通級
    • 頁數
    • 616
    • 商品規格
    • 23*17
    • 出版地
    • 台灣
    • 適讀年齡
    • 全齡適讀
    • 注音
    • 級別

商品評價

訂購/退換貨須知

加入金石堂 LINE 官方帳號『完成綁定』,隨時掌握出貨動態:

加入金石堂LINE官方帳號『完成綁定』,隨時掌握出貨動態
金石堂LINE官方帳號綁定教學

提醒您!!
金石堂及銀行均不會請您操作ATM! 如接獲電話要求您前往ATM提款機,請不要聽從指示,以免受騙上當!

退換貨須知:

**提醒您,鑑賞期不等於試用期,退回商品須為全新狀態**

  • 依據「消費者保護法」第19條及行政院消費者保護處公告之「通訊交易解除權合理例外情事適用準則」,以下商品購買後,除商品本身有瑕疵外,將不提供7天的猶豫期:
    1. 易於腐敗、保存期限較短或解約時即將逾期。(如:生鮮食品)
    2. 依消費者要求所為之客製化給付。(客製化商品)
    3. 報紙、期刊或雜誌。(含MOOK、外文雜誌)
    4. 經消費者拆封之影音商品或電腦軟體。
    5. 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,經消費者事先同意始提供。(如:電子書、電子雜誌、下載版軟體、虛擬商品…等)
    6. 已拆封之個人衛生用品。(如:內衣褲、刮鬍刀、除毛刀…等)
  • 若非上列種類商品,均享有到貨7天的猶豫期(含例假日)。
  • 辦理退換貨時,商品(組合商品恕無法接受單獨退貨)必須是您收到商品時的原始狀態(包含商品本體、配件、贈品、保證書、所有附隨資料文件及原廠內外包裝…等),請勿直接使用原廠包裝寄送,或於原廠包裝上黏貼紙張或書寫文字。
  • 退回商品若無法回復原狀,將請您負擔回復原狀所需費用,嚴重時將影響您的退貨權益。
※ 網友掛保證,絕不踩雷書單如下 ↓↓↓
預計 2025/10/03 出貨 購買後進貨 
金石堂門市 全家便利商店 ok便利商店 萊爾富便利商店 7-11便利商店
World wide
活動ing