熱門關鍵字:

BN說明
排序依
  • Power BI終極實戰寶典|使用Power Query與PowerBI進行資料分析

    Power BI終極實戰寶典|使用Power Query與PowerBI進行資料分析

    Gil Raviv  著 碁峰資訊 出版 2019/5/13 出版

    amazon.com全五星無差評,看過的都說讚。晉身power bi專家必讀的一本書 透過power query這項內建於excel與power bi的工具,就能輕鬆地匯入、重塑和清理任何資料,從數據當中發掘洞見。本書將告訴您如何駕馭power query這項功能強大的工具,藉由範例的操作,逐步了解如何運用power query進行有效率的資料分析。 藉由本書,您將學會: .使用excel中的power query(「取得與轉換」)和power bi快速準備分析資料 .只需點擊幾下滑鼠並進行簡單的公式編輯,即可解決常見的資料準備問題 .組合來自多個資料來源,多個查詢和不同表格當中的數據 .掌握表格的基礎和進階技術 .使用m語言自定義轉換並構建靈活的資料混搭 .使用power query解決協作挑戰 .取得關於文本資料的重要洞見 .分析取自社群網路的資料

    79特價490
  • 大數據分析Excel Power BI全方位應用(第三版)

    大數據分析Excel Power BI全方位應用(第三版)

    謝邦昌、鄭宇庭、宋龍華等  著 碁峰資訊 出版 2019/7/23 出版

    台灣微軟技術經理 王恩琦 專業推薦! 隨著電腦技術的發展,資料存儲量呈現倍增成長,以資料採礦為核心的business intelligence(bi)顯然成為it和其他行業的必爭之地,同時市場潮流big data讓巨量資料分析變得更重要,商業智慧也順理成章成為企業注重的一環,專業的分析人員更是市場人才寵兒。 基於此利基microsoft excel power bi實現在數據分析與商業智慧分析領域,達到方便且有效率的作業模式。使用excel power bi可迅速完成以往只有透過專業商業智慧工具或花費大量時間才能完成的任務,它同時提供蒐集合併清理內外部資料來源功能(power query)、精華版olap工具(power pivot)、視覺化分析資料探索(power view)與2d/3d地圖資訊分析(power map),協助企業能夠整合來自不同來源的巨量資料並轉化成資訊和洞察,應用在市場策略上,最終達到令人滿意的效果。同時,microsoft power bi服務除了具有microsoft excel power bi功能之外,更增加許多視覺化效果的模板,而且還能客製化。 ■ 適用excel 2019/2016/2013 ■ 瞭解自助式商業智慧分析流程,提升人員決策能力 ■ 學習利用power bi工具建立視覺化圖表分析 ■ 學習如何使用excel power pivot、power view、power map與power query ■ 內容逐步實際操作,從入門到進階,縮短學習時間,讓您有效率的抓住學習重點 ■ 帶領您瞭解power bi服務的範疇,快速掌握power bi desktop的使用技巧

    79特價427
  • 翻轉Excel 駕馭Power BI:商業智慧進化自助大數據分析實務應用

    翻轉Excel 駕馭Power BI:商業智慧進化自助大數據分析實務應用

    馬世權  著 深石數位 出版 2019/6/5 出版

    只會使用excel做遜爆了的數據資料分析? 本書讓你從excel基礎敏捷邁跨到超能power bi技術! 埋首茫茫巨量數據資料中無所適從? 本書讓你飛速上手操作power bi成為資料分析高手! 從資料搬運工進化成為高效數據分析師! 本書內容基於microsoft power bi desktop版本。 數據資料處理量更大;速度更快;數據資料分析功能更強大;視覺化效果更精美。 microsoft power bi是微軟發佈的一套商業分析工具,其功能整合了excel中的power query、power pivot、power view、power map外掛程式,並加入了社交分享、雲端服務等功能。 本書以excel基礎+power bi為方法論,使用最平易近人的語言講解power bi的技術知識,讓零基礎讀者也能快速上手操作power bi。 以讀者的興趣閱讀為出發點,首先通過介紹視覺化模組讓讀者全面體驗power bi操作,並掌握讓資料-飛起來-的祕技;然後向上邁跨一大步,讓讀者學習power query資料查詢功能,瞬間解決最耗費時間且附加值最低的工作;最後全力攻克power bi的核心價值模組power pivot(資料建模)和dax語言,讓讀者直達商業智慧數據分析的巔峰,站到excel的肩膀上。 ※範例資源請至上奇資訊網站下載

    79特價458
  • 文科生也看得懂的資料科學

    文科生也看得懂的資料科學

    Annalyn Ng & Kenneth Soo  著 碁峰資訊 出版 2018/4/30 出版

    * amazon.com 五顆星讀者無差評 * 史丹佛大學、劍橋大學相關課程指定教材 雖然資料科學越來越常被用來改善工作場域的種種決策,但對普羅大眾來說,這仍然是個神祕難懂的領域。本書避開艱深的數學與生澀的術語,以直觀的例子來說明各演算法功能與特色,例如,用預 測犯罪事件的例子來解釋隨機森林,用分群演算法來分析各類電影迷的人格特質等,本書所選用的例子能夠幫助讀者明確理解各演算法及實際應用,即使您不曾接觸過資料科學,也能藉由本書掌握基本概念。 本書特色: .淺白的解釋,以及大量的圖解說明 .以實際的例子解說演算法的應用 .每章最後會有重點歸納加強學習效果

    79特價300
  • CV+AI自己動手完成圖像搜尋引擎

    CV+AI自己動手完成圖像搜尋引擎

    明恒毅  著 深智數位 出版 2019/9/18 出版

    圖像搜尋引擎有兩種實現方式—基於圖像上下文文字特徵的方式和基於圖像視覺內容特徵的方式。本書所指的圖像搜尋引擎是基於內容特徵的圖像檢索,也就是「以圖搜圖」來檢索相似圖片。本書主要講解搜尋引擎技術的發展脈絡、文字搜尋引擎的基本原理和搜尋引擎的一般結構,詳細講述圖像搜尋引擎各主要組成部分的原理和實現,並構建一個基於深度學習的web圖像搜尋引擎。 本書首先介紹圖像搜尋引擎的相關理論和實現方法,結合具體的java程式碼實例解釋理論,展示從文字搜尋演進到圖像搜尋的技術路徑。最後會帶領讀者逐步實現一個ai圖像搜尋引擎,使讀者不僅理解相關理論,而且具備實際的開發能力。 本書主要內容: ■ 從文字搜索到影像搜索 ■ 傳統影像特徵分析 ■ 深度學習影像特徵分析 ■ 影像特徵索引與檢索 ■ 建置一個以深度學習為基礎的web 影像搜尋引擎 適合讀者群:對圖像搜尋引擎有興趣的開發者、程式設計師、演算法工程師,或機器視覺等相關領域工作者,也適合作為大專院校相關科系師生參考用書。 本書特色 ➢以深度學習web圖像搜尋引擎為基礎 ➢講解圖像搜尋引擎的原理和實現 ➢帶領讀者從零開始掌握圖像檢索技術

    9特價540
  • Power BI零售大數據分析應用

    Power BI零售大數據分析應用

    謝邦昌、蘇志雄、宋龍華  著 碁峰資訊 出版 2019/6/10 出版

    前行政院長 張善政、台灣微軟首席技術與策略長 丁維揚 專文推薦! .瞭解零售大數據的實務分析與自助式商業智慧分析流程,提升人員決策能力 .強調用戶型商業智慧,人人都能實做大數據,案例內容逐步操作,縮短學習成本 資料視覺化分析是許多企業相當看重的大數據分析技術之一。從資料工程、機器學習到視覺化,整個過程即為人工智慧(ai)應用,因此資料視覺化分析是扮演詮釋此過程的關鍵角色。 本書精彩內容: .闡述零售大數據概論應用模式。 .以零售相關數據做為主題,介紹microsoft power bi的實際運用,範疇涵蓋power bi價值與重要性、操作power bi desktop開發工具的技巧、儀表板權限管理觀念。 .建置零售數據分析指標+實作視覺化分析模型儀表板。 .介紹零售大數據+實作主題式營運分析常用儀表板。 .介紹客戶360度圖像標籤+實作客戶360度圖像標籤常用儀表板。 本書屬於產業大數據分析書籍,無論是內容或範例資料,都利於讀者從貼近自身的市場分析經驗切入。案例均搭配詳細的步驟說明與軟體操作畫面。適合power bi使用人員、大數據分析人員及從事零售電商分析或營運人員。

    79特價458
  • Deep Learning深度學習基礎|設計下一代人工智慧演算法

    Deep Learning深度學習基礎|設計下一代人工智慧演算法

    Nikhil Buduma  著 歐萊禮 出版 2018/6/19 出版

    深度學習(deep learning)如今已成為非常活躍的研究領域,同時也為現代機器學習鋪展了一條康莊大道。本書提供許多範例與清楚的說明,引導讀者進一步了解這個複雜領域中的一些主要概念。 包括google、微軟和facebook這樣的業界龍頭,全都在其內部積極發展深度學習團隊。不過對於一般人來說,深度學習仍舊是個相當複雜而困難的主題。如果您熟悉python,並具備微積分的背景知識,加上對於機器學習的基本理解,本書即可幫助您入門。 .瞭解機器學習和神經網路的基礎知識 .瞭解如何訓練正向饋送神經網路 .用tensorflow實現你的第一個神經網路 .網路越來越深度時,相關問題的管理 .建立能夠分析複雜圖片的神經網路 .使用自動編碼器進行有效的降維操作 .深入序列分析以處理自然語言 .瞭解強化學習的基礎知識

    85特價527
  • HBase應用大神:OpenTSDB時序式資料庫詳解

    HBase應用大神:OpenTSDB時序式資料庫詳解

    百里燊  著 深智數位 出版 2019/9/18 出版

    opentsdb 是一個分散式、可伸縮的時間序列資料庫,其底層儲存以hbase 為主,目前版本也支援cassandra等儲存。正因為其底層儲存依賴於hbase,其寫入效能和可擴充性都獲得了保障。opentsdb 支援多tag 維度查詢,支援毫秒級的時序資料。 本書共 8 章,主要從原始程式角度深入剖析opentsdb 的原理和實現。 包括opentsdb的網路層、opentsdb中uniqueid元件的原理、opentsdb如何實現時序資料的存儲及相關優化、opentsdb如何實現時序資料的查詢、opentsdb中的中繼資料及tree結構的實現和功能、opentsdb中的外掛程式及工具類實現原理內容。 各章之間的內容相對獨立,對opentsdb 有一定了解的讀者可以有目標地選擇合適的章節開始閱讀。 本書主要以opentsdb 的最新版本(2.3.1 版本)為基礎介紹。 本書主要內容: ■ 快速入門 ■ 網路層 ■ uniqueid ■ 資料儲存 ■ 資料查詢 ■ 中繼資料 ■ tree ■ 外掛程式及工具類別 適合讀者群:對時序資料庫感興趣的讀者。 本書特色 opentsdb 是一個分散式、可伸縮的時間序列資料庫,本書從原始程式角度深入剖析opentsdb 的原理和實現。

    9特價612
  • 從大數據到人工智慧(熱銷版):理論及Spark實作

    從大數據到人工智慧(熱銷版):理論及Spark實作

    鄧立國、佟強  著 佳魁 出版 2019/9/10 出版

    本書重點在大數據與雲端運算的融合,列出了大數據與雲端運算的一些基本概念的同時,以spark 為開發工具,全面說明雲環境下的大數據技術部署與典型案例演算法實現,最後介紹了經典spark 大數據與雲端運算融合的架構與演算法。 商品特色: 本書圍繞網際網路重大的技術革命:雲端運算、大數據進行說明。 適用: 雲端運算環境下spark大數據技術人員、spark mllib機器學習技術人員。

    9特價522
  • PyTorch自然語言處理|以深度學習建立語言應用程式

    PyTorch自然語言處理|以深度學習建立語言應用程式

    Delip Rao等  著 歐萊禮 出版 2019/6/28 出版

    “這是nlp與深度學習入門的好書。作者delip與brian清楚的說明nlp概念並以程式碼示範如何解決nlp實務工作 -liling tang rakuten研究員 自然語言處理(natural language processing,nlp)提供解決人工智慧問題的機會,造就出amazon alexa與google translate等產品。如果你正在開發或學習nlp與深度學習,這本書能告訴你如何以pytorch這個python深度學習函式庫應用這些方法。 作者delip rao與brian mcmahan提供扎實的nlp與深度學習演算法,還示範如何以pytorch建立處理大量文字問題的應用程式。每一章均包含多個程式範例與圖示。 ‧探索計算圖與監督式學習的典範 ‧掌握pytorch張量操作函式庫的基礎 ‧認識傳統nlp概念與方法 ‧學習建構神經網路的基本概念 ‧檢視多層感知器等前饋神經網絡 ‧使用詞嵌入表示字、句、文件及其他特徵 ‧認識如何設計遞歸神經網路的資料序列 ‧探索序列預測與產生序列對序列模型 ‧學習nlp系統的設計模式

    79特價458
  • 不懂程式也能學會的大數據分析術 : 使用 RapidMiner

    不懂程式也能學會的大數據分析術 : 使用 RapidMiner

    黃柏崴李童宇  著 旗標 出版 2019/2/22 出版

    行銷企劃、市場分析、統計預測、財務金融、風險管理...都該學! 養成大數據分析力的第一本書! 資料分析、資料科學都是近來非常夯的關鍵字,與其相關的工作職務紛紛冒出,形成一股勢不可擋的大數據分析學習熱潮。 只是聽說學資料分析都得具備一定的技術能力 (例如要會撰寫 python、r...程式),往往讓底子不夠、或非資訊背景的人止步...沒關係!不管您身處什麼領域、技術背景如何,本書就是為了想搭上這波學習熱潮的您而生。 書中將利用免費、完全不用撰寫程式的分析工具 - 【rapidminer】,帶您走過資料科學 / 資料分析的經典分析領域。各專案會一步步帶您從「思考解決什麼樣的問題?」開始,從蒐集資料、清理資料、資料探索與視覺化、到實際建置模型、正確解讀結果...等。所用的分析方法均結合時下盛行的機器學習演算法,您會清楚了解如何利用已知的資料對未來做出預測分析。 在現今數據充斥的環境下,期盼讀者可以藉由本書將滿滿的數據「變現」,提早掌握重要資訊、贏得先機! 【釐清資料領域重要關鍵字】 ‧大數據‧開放資料‧資料分析‧資料科學‧機器學習 【資料分析雙鑽石模型】 ‧問題發掘‧蒐集與前處理‧資料探索與視覺化‧建模‧模型解讀 【完全免費的資料集散地任你挖寶】 ‧data.word‧kaggle‧github‧政府開放資料平台… 【統計、建模術語零阻礙,白話解說保證看懂】 ‧監督式/非監督式學習‧決策樹‧邏輯迴歸‧混淆矩陣‧分類問題‧迴歸問題‧rmse、mse‧分群問題‧k-means模型‧elbow method‧時間序列‧arima 模型 【不分領域、一看就懂的生活實例】 ‧預測nba選秀球員發展性‧預測中古車的價格‧找出相似喜好的客群‧出生率預估 本書特色 ●零程式基礎!建立分析模型 step by step 保證做的到 ●零統計基礎!滿滿白話實例,輕鬆解讀統計、衡量指標概念 ●生活化實例全面展示【分類、迴歸、分群、時間序列】經典分析

    9特價495
  • 大數據專案經理的實戰心法:善用視覺化工具

    大數據專案經理的實戰心法:善用視覺化工具

    彭其捷  著 博碩文化 出版 2018/11/30 出版

    大數據時代來臨,面對動輒數百甚至數千萬的資料量, 我們該如何將其轉換成為易懂的視覺化圖表呢? 本書內容主要針對管理/數據分析人員所撰寫,現在人們的生活當中,每天都會看到大量的數據,然而可惜的是,許多透過數據想要說明的事情,並沒有清楚地被傳遞出來,有些是因為呈現的手法不正確,或是缺少了關鍵的資訊,又或者是製作的手法粗糙,美學上欠缺考量,很難吸引到許多人的目光,而導致無法發揮出它該有的影響力。 本書主要解說大數據視覺化工具。在大數據浪潮之下,許多角色都被重新詮釋,也產生了許多新的任務,書中介紹的技巧與工具,對於產品經理、管理人員、主管階層、分析人員、學生等都有幫助。過去我們大多依賴excel完成相關任務,但在新時代中我們還有許多工具可選擇。本書主要搭配tableau工具來引導實戰案例,讀者可透過書中的步驟教學,一步步完成大數據視覺化任務。 【本書特色】 ★ 介紹大數據資料的分析技巧。 ★ 專門提供給管理/分析人員的視覺化指引。 ★ 搭配實戰案例進行實作教學。 ★ 提供大數據資料集供讀者練習。 ★ 提供完整視覺化工具與應用情境介紹。

    79特價411
  • 用TensorFlow 玩轉大數據與量化交易

    用TensorFlow 玩轉大數據與量化交易

    何海群  著 深石數位 出版 2018/8/27 出版

    本書是關於tensorflow大數據與量化交易的原創書籍,除了神經網路與量化分析的教程,配合zwpython開發平臺和zwquant開源量化軟件學習,是一套完整的大數據分析、量化交易的學習教材,可直接用於實盤交易。

    85特價553
  • SAP HANA企業級大數據資料處理

    SAP HANA企業級大數據資料處理

    尹東升、陳磊、周斌  著 佳魁 出版 2017/11/13 出版

    sap 高性能分析應用軟體(sap high-performance analytic appliance,sap hana)自2011向全球推廣以來,引發資料庫領域大震動。sap hana利用其突破性的分析功能,已經為全球客戶的業務運營方式帶來根本性的變革,並成為sap史上用戶數量增長最快的產品之一。 本書以初學者為核心,全面介紹sap hana的基本知識和基於sap hana 開發應用的各種技術。由淺入深,讀者循序漸進地掌握sap hana相關基本知識的同時,輔以實例和練習;在內容講解上結合豐富的圖解,幫助讀者理解晦澀難懂的技術,快速掌握sap hana的知識以及應用方法。 適用:適合任何對sap hana感興趣的初學者、有sap hana專案經驗的開發者、技術人員。

    85特價442
  • 大數據時代一定要會的自動化資料搜集術

    大數據時代一定要會的自動化資料搜集術

    佐木拓郎  著 旗標 出版 2017/8/28 出版

    長期、大量的資料會產生分析決策的價值,用工具程式幫忙搜集最有效率! 從【超簡單雲端擷取工具】到【客製化網頁爬蟲程式】, 各種網路資料輕鬆自動抓! 大數據時代,網路上最不缺的就是「資料」。許多行銷、企劃人員會希望持續搜集網路熱門話題,產生統計上的價值;拿商品銷售數字和搜集的資料量一比對,或許就可以分析出某種關聯性;又或者,身為 app 開發者的您需要搜集 app 排行榜資訊,隨時掌握流行動向。 想要長期、不費力地搜集資料,使用工具、程式來處理最快! 本書將聚焦在最重要的第一步:教您用 【excel 函數/vba、google 試算表、完全不需要程式的雲端服務工具、客製化的網頁爬蟲程式】,不費力地把各種資料搜集到手。例如:每天上午 9 點取得網路商店暢銷排行榜清單,下午 3 點幫你自動整理好股價資料,所有工作交給電腦處理,我們則聚焦在這些資料背後隱藏的價值,用它們來產生對決策有幫助的資訊! 本書特色 ●免手動!各種網路資料通通幫你搜集 大數據時代必學的職場工作術! ‧博客來書籍暢銷排行榜前 100 名 ‧網路商店全館暢銷榜資料 ‧股票當日最高價、最低價、交易量、收盤價... ‧自家商品在社群網站的心得評論、討論量 ‧網路商店最新主題策展資訊 ‧amazon購物商店的用戶評論 ‧ios/android app 的銷售排行、營收排行 ●特別收錄:資料到手如何應用? 介紹資料應用熱門主題,包括資料視覺化、機器學習...以實例解說讓您立即懂。

    9特價432
  • 圖形演算法|Apache Spark與Neo4j實務範例

    圖形演算法|Apache Spark與Neo4j實務範例

    Mark Needham- Amy E. Hodler  著 歐萊禮 出版 2019/11/12 出版

    從基本概念到重要的演算法,再到處理平臺和實際案例,作者為美妙圖形世界編寫了一本兼具指導性與說明性的參考指南。 —kirk borne phd principal data scientist and executive advisor booz allen hamilton 一本實用且資訊豐富的指南,幫助你藉由使用圖形演算法檢測模式和結果,來獲取更多洞察力,圖形資料庫開發人員的必讀書籍。 —luanne misquitta vice president of engineering graphaware 學習圖形演算法可以幫助你利用資料關係的力量,開發更聰明的解決方案,以及增強你的機器學習模模型。有了這本實用的指南,開發者和資料科學家將會發現,圖形分析能提昇價值,無論是用圖形分析建構動態網路模型,還是預測真實世界中的行為。 neo4j的mark needham和amyhodler說明圖形演算法如何描述複雜結構,並揭示難以找出的模式—從發現漏洞和瓶頸到社群偵測和提升機器學習預測。你將會透過一些實際的範例了解如何在apache spark和neo4j中使用圖形演算法,這兩個平台是圖形分析最常用的選擇。 ‧學習圖形分析如何從現今的資料中找到更多預測元素 ‧瞭解熱門的圖形演算法是如何工作以及如何應用 ‧使用超過20個圖形演算法範例的程式碼和提示 ‧學習對不同類型問題,挑選合適演算法 ‧使用spark和neo4j程式碼和樣本資料集探索範例 ‧結合neo4j和spark,建立一個用於連結預測的機器學習工作流程

    79特價458
  • Apache Kylin大數據入門

    Apache Kylin大數據入門

    蔣守壯  著 佳魁 出版 2019/11/11 出版

    本書全面介紹apache kylin,內容包含: .環境架設、範例演練、原始程式分析、cube最佳化⋯⋯等。 .資料倉儲、資料模型、olap、資料立方體⋯⋯等方面的相關知識。 .系統性學習與實戰操作,使讀者能夠架設以apache kylin為基礎的企業級大數據分析平台。 .熟練使用apache kylin多維度分析巨量資料,並透過視覺化工具展現結果。 商品特色: . apache kylin為第一個由華人團隊完整貢獻至apache的專案。 .作者為業界知名的apache kylin專家,本書為其多年的技術累積與實戰精華。 .內容淺顯易懂、實作性強大,是目前第一本系統性介紹kylin的實作書籍。 .apache kylin為開放原始碼的分散式儲存引擎,提供hadoop上的sql查詢介面及多維分析能力以支援大規模資料。 適用: 大數據技術初學者;大數據分析人員、架構師等;亦適合hadoop、hbase、hive和kylin等相關從業人員。

    79特價514
  • Spark技術手冊|輕鬆寫意處理大數據

    Spark技術手冊|輕鬆寫意處理大數據

    Matei Zaharia等  著 歐萊禮 出版 2019/10/18 出版

    本書是由spark這個專案的成員所撰寫,詳盡的說明如何使用、部署與維運apache spark。本書將帶領您探索spark結構化api基礎操作、結構化串流,並透過新的高階api建立端到端的串流應用。開發與系統管理人員可由本書學習到如何進行spark的監控、調校以及除錯,以及如何使用mllib分散式機器學習函式庫。 .完整說明大數據與spark .透過實際的範例學習dataframe、sql與dataset等spark核心api概念 .深入了解spark低階api、rdd以及dataframe與sql的關係 .學習如何在叢集環境運行spark .針對spark叢集與應用程式進行除錯、監控與調校 .體會spark結構化串流處理引擎的威力 .學習mllib函式庫並將其應用於多種分類或推薦等機器學習專案中 bill chambers是databricks的產品經理,專注於大數據分析並提供企業用戶完整的文件與協作讓客戶藉由spark與databricks取得成功。 matei zaharia是史丹佛電腦科學系的助理教授以及databricks的技術長。他於2009在加州柏克萊大學發起spark專案,同時他也是apache mesos專案的共同發起人以及apache hadoop的早期貢獻者。

    9特價792
  • Spark SQL親自動手做(熱銷版):大數據時代的資料庫處理

    Spark SQL親自動手做(熱銷版):大數據時代的資料庫處理

    紀涵、靖曉文、趙政達  著 佳魁 出版 2019/10/14 出版

    spark sql是spark大數據框架的一部分,支援使用標準sql查詢和hiveql來讀寫資料,可用於結構化資料處理,並可以執行類似sql的spark資料查詢,有助於開發人員更快地建置和執行spark程式。 全書分為4篇,共9章,第一篇講解spark sql 發展歷史和開發環境搭建。第二篇講解spark sql 實例,幫助讀者掌握spark sql的入門操作,瞭解spark rdd、dataframe和dataset,並熟悉 dataframe 各種操作。第三篇講解基於wifi探針的商業大數據分析專案,實例中包含資料獲取、預處理、存儲、利用spark sql 挖掘資料,一步步帶領讀者學習spark sql強大的資料採擷功能。第四篇講解spark sql 最佳化的知識。 適用:spark初學者、spark資料分析人員以及spark程式開發人員,也可作為大專院校和培訓機構等相關專業的師生教學參考。

    85特價493
  • 科技巨頭神器下放民間:流式處理唯一選擇Kafka

    科技巨頭神器下放民間:流式處理唯一選擇Kafka

    朱忠華  著 深智數位 出版 2019/9/16 出版

    本書從kafka的基本概念入手,主要從生產端、消費端、服務端等3個方面進行全面的陳述,主要內容包括kafka的基本使用方式、生產者用戶端的使用、消費者用戶端的使用、主題與分區、記錄檔儲存、深入原理解析、監控的設計、高級應用的擴展以及與spark的整合等。 kafka的核心使用scala語言編寫,但是本書基本以java語言作為主要的示例語言,方便絕大多數讀者的理解。 本書雖然沒有明確的界定,但是總體上可以劃分為三個部分:基礎篇、原理篇和擴展篇,以循序漸進的方式讓讀者容易接受。 本書主要內容: ■ 初識kafka ■ 生產者 ■ 消費者 ■ 主題與分區 ■ 記錄檔儲存 ■ 深入服務端 ■ 深入用戶端 ■ 可用性深入 ■ kafka 應用 ■ kafka 監控 ■ 進階應用 ■ kafka 與spark 的整合 ■ kafka 原始程式環境架設 本書特色 ◎認識kafka的基本概念 ◎從生產端、消費端、服務端說明 ◎擴展至進階應用與spark整合

    85特價663
頁數1/6
移至第

32