1103~1105_神奇柑仔店1920完結篇

白話大數據與機器學習

  • 9 432
    480

活動訊息

金石堂,總有一本書懂你!雙11更好買,25家銀行信用卡分期0利率!

內容簡介

本書以降低學習門檻為宗旨,解說大數據與機器學習的相關基礎知識,只要具備高中數學基礎即可看懂。內容結合大量案例與生動的插畫,將高度抽象的數學、演算法與現實生活中的事件作關聯,幫助讀者理解。

本書精彩內容包括:
.大數據基礎,說明大數據應該具備的基礎數學知識
.大數據演算法,解說向量空間、回歸、聚類、分類等核心演算法
.大數據熱門應用:介紹推薦算法、文字挖掘、人工神經網路等技術的原理
.大數據主流框架:介紹Hadoop、Spark、Cassandra

目錄

Chapter 01 大數據產業
Chapter 02 步入資料之門
Chapter 03 排列組合與古典機率
Chapter 04 統計與分佈
Chapter 05 指標
Chapter 06 資訊理論
Chapter 07 多維向量空間
Chapter 08 迴歸
Chapter 09 聚類
Chapter 10 分類
Chapter 11 關聯分析
Chapter 12 使用者側寫
Chapter 13 推薦演算法
Chapter 14 文字挖掘
Chapter 15 人工神經網路
Chapter 16 大數據框架簡介
Chapter 17 系統架構和最佳化
Chapter 18 資料解讀與資料的價值

序/導讀



不知從何時開始我們已周身沒入大數據時代的潮流,不知不覺被捲入了大數據時代。

無論是每天上網看網頁、聊LINE、上FB,或者使用網路銀行、網購、買票,或者出遊、訂房,甚至是出入任何公眾場合、駕車、用水用電⋯⋯我們無時無刻不在生產著各種數據。而同時我們也在消費著其他人生產的數據,我們使用的眾多家電產品,每一個設計細節都融入了設計者對用戶體驗數據的調查與分析;我們使用的每一部手機、每一台電腦,每一個元件的產出都融入著多得無法想像的指標數據控制下的生產與監控;我們造訪的每一個網頁、每一個軟體,每一次享受到的貼心的產品改動和服務的升級,無不浸透著無數的數據彙集與精細的分析和反饋。這是一場慢慢到來的、貫穿所有產業的革命,這是一次潤物細無聲的各行業精耕細作的開端。

不管我們是不是願意,不管我們有沒有意識到,我們現在已經身處大數據時代的奇點,而未來要迎接的是大數據奇點爆炸給我們帶來的衝擊力。我們需要力量來駕馭浪裡的航船,我們需要乘風破浪前進的動力。

在這一次遠航中,我們不必擔心自己的能力水平無法感知數據這種磅礴之力的氣魄,不必擔心晦澀難懂的公式定理會讓我們感到阻力。

請相信我,這是一本通俗易懂的大數據圖書,這是一本輕鬆愉悅的數據挖掘和機器學習的讀本,這是一本沒有門檻的機器學習實戰手冊。讓我們一起揚帆遠航吧!

試閱

對大數據產業的認識

「大數據」這個詞彙其實很容易產生不少誤解,尤其是這個「大」字,很容易讓人感覺,資料量必須大,而且特別大,越大越能形成產業,也越有價值。其實這是「大數據」造成的誤導。大數據產業的存在,和其他產業並無二致,本身是為了服務其他產業。

做個假設,假如現在對石油產業冠以「大石油」產業的名號,會影響石油產業本身對其他行業的服務模式嗎?應該不會。

在「大石油」產業裡,同樣有人從事這些的工作內容:石油勘探、石油開採、石油運輸、石油提煉、石油產品銷售等多個細分領域和環節。

最後提供給社會的,是由大量人力和智慧凝結在石油產品上的服務,而這些服務滿足了社會各領域對於工業能源、建築材料、食品包裝、服裝布料、模型器具、日用品等多種製造與使用的需求。試想如果沒有石油,也就沒有廉價汽車與航空動力,尤其是沒有聚乙烯等重要化工原材料的來源,連塑膠這種廉價的工業製造材料都未必能生產,那麼各個產業則需要用其他造價更為高昂的材料對其進行取代,更不用提家用的天然氣和液化石油氣了,大家只能再去尋找其他能源:可能是木柴和煤炭這些不環保的燃料,或者是價格昂貴的氫氣。我們之所以選用石油作為整個產業鏈的根源,並把它發展成一個完整的產業也是由於這樣的原因。

回頭來看「大數據」產業,資料收集、資料傳輸、資料儲存、資料建模、資料分析、資料交易貫穿了大數據產業的完整產業鏈。在這個產業鏈裡同樣蘊含著和「大石油」一樣的東西,這個東西是什麼?

經由各種軟體收集資料,利用網路傳輸,儲存至雲端資料中心,透過資料科學家或者產業專家,建模、加工,最後資料分析得到的是一種知識,是一種大家透過資料洞悉世界的能力。資料之間本來彼此錯綜複雜的潛在關係,使大量獨立而多來源的資料同時出現在一個舞臺,變得更有趣,大量看似不相關的事情卻能夠在觀察與分析後告訴我們更多背後的因果。這些因果聯繫的意義會讓大家在各個方面能夠推測未來趨勢,減少犯錯的機會,降低成本跟風險,節省人力。筆者認為這才是大數據產業本身的價值與意義所在。大數據開發方向

大數據開發方向的人才更多注重的是伺服器端開發、資料庫開發、呈現與視覺化、人機互動等銜接資料載體、各層面的資料加工,以及用戶的功能實作。

以下是大數據開發研究的主要範疇:
.資料庫開發:關鍵字有 RDBMS、NoSQL、MySQL、Hive 等。
.資料流程工具開發:關鍵字有 Flume、Heka、Fluentd、Kafka、ZMQ等。
.資料前端開發:關鍵字有 HightCharts、ECharts、JavaScript、D3、HTML5、CSS3等。
.資料擷取開發:關鍵字有爬蟲、分詞、自然語言學習、文字分類等。

可以注意到,大數據開發和大數據架構方向有很多關鍵字雖然是重複的,但是措辭不一樣,一個是「應用」,一個是「開發」。區別在於:「應用」著重的是懂得這些這種技術能為大家提供什麼功能,以及使用這種技術的優缺點,並擅長取捨;「開發」更注重的是熟練掌握,快速實作。

最後一個方面——資料獲取開發與前面的資料庫開發、資料流程工具開發、資料前端開發略有不同,它出現的時間相對較晚,應用面相對較窄。現在很多資料公司,如湯森路透、彭博等諮詢公司的資料除了從專業公司直接得到以外,也多有從網路上爬取的,這個過程中也涉及一些關鍵技術。

配送方式

  • 台灣
    • 國內宅配:本島、離島
    • 到店取貨:
      金石堂門市 不限金額免運費
      7-11便利商店 ok便利商店 萊爾富便利商店 全家便利商店
  • 海外
    • 國際快遞:全球
    • 港澳店取:
      ok便利商店 順豐 7-11便利商店

詳細資料

詳細資料

    • 語言
    • 中文繁體
    • 裝訂
    • 紙本平裝
    • ISBN
    • 9789864764563
    • 分級
    • 普通級
    • 頁數
    • 424
    • 商品規格
    • 18開17*23cm
    • 出版地
    • 台灣
    • 適讀年齡
    • 全齡適讀
    • 注音
    • 級別

商品評價

訂購/退換貨須知

加入金石堂 LINE 官方帳號『完成綁定』,隨時掌握出貨動態:

加入金石堂LINE官方帳號『完成綁定』,隨時掌握出貨動態
金石堂LINE官方帳號綁定教學

提醒您!!
金石堂及銀行均不會請您操作ATM! 如接獲電話要求您前往ATM提款機,請不要聽從指示,以免受騙上當!

退換貨須知:

**提醒您,鑑賞期不等於試用期,退回商品須為全新狀態**

  • 依據「消費者保護法」第19條及行政院消費者保護處公告之「通訊交易解除權合理例外情事適用準則」,以下商品購買後,除商品本身有瑕疵外,將不提供7天的猶豫期:
    1. 易於腐敗、保存期限較短或解約時即將逾期。(如:生鮮食品)
    2. 依消費者要求所為之客製化給付。(客製化商品)
    3. 報紙、期刊或雜誌。(含MOOK、外文雜誌)
    4. 經消費者拆封之影音商品或電腦軟體。
    5. 非以有形媒介提供之數位內容或一經提供即為完成之線上服務,經消費者事先同意始提供。(如:電子書、電子雜誌、下載版軟體、虛擬商品…等)
    6. 已拆封之個人衛生用品。(如:內衣褲、刮鬍刀、除毛刀…等)
  • 若非上列種類商品,均享有到貨7天的猶豫期(含例假日)。
  • 辦理退換貨時,商品(組合商品恕無法接受單獨退貨)必須是您收到商品時的原始狀態(包含商品本體、配件、贈品、保證書、所有附隨資料文件及原廠內外包裝…等),請勿直接使用原廠包裝寄送,或於原廠包裝上黏貼紙張或書寫文字。
  • 退回商品若無法回復原狀,將請您負擔回復原狀所需費用,嚴重時將影響您的退貨權益。
※ 金石堂網書25週年慶
金石堂門市 全家便利商店 ok便利商店 萊爾富便利商店 7-11便利商店
World wide
活動ing