用TensorFlow 玩轉大數據與量化交易
本書是關於TensorFlow大數據與量化交易的原創書籍,除了神經網路與量化分析的教程,配合zwPython開發平臺和zwQuant開源量化軟件學習,是一套完整的大數據分析、量化交易的學習教材,可直接用於實盤交易。
大數據的下一步:Spark MLlib機器學習實戰技巧大公開
本書特色❑ 從應用實作出發:儘量避免純粹的理論知識介紹和高深技術研討,用最簡單的、典型的範例引伸出核心知識,最後還指出通往「高精尖」進一步深入學習的道路。❑ 系統介紹MLlib全貌:全面介紹了MLlib相關資料採擷的基本結構與上層程式設計,讓讀者在學習過程中不至於迷失方向。❑ 簡潔的理論:本書在寫作上淺顯容易,沒有深奧的數學知識,讓讀者透過輕鬆愉悅地閱讀掌握相關內容。❑ 創新的技術:每章都會用範例描述的形式,幫助讀者更進一步地學習內容。❑ 程式遵循重建原理:避免程式污染,引導讀者寫出優秀、簡潔、可維護的程式。適用:欲接觸或對Spark MLlib有興趣的讀者最佳入門書,亦適合大數據採擷、分析等相關領域之從業人員與師生作為參考之用。
從大數據到人工智慧:理論及Spark實作
本書共分為四篇: ▶ 第一篇& 企業儲存概述: 試圖以一幅生動的演進畫面,讓讀者清晰理解近60年來儲存工業的原始訴求,以及透過歷史的分析,為讀者在了解與思考儲存工業後續新媒體及雲端環境下之研究打下基礎。 ▶ 第二篇& 雲端儲存: 有系統的介紹雲端運算環境的典型分散式儲存系統所要解決的問題以及其技術架構。 ▶ 第三篇& 資料庫: 以企業到雲端化的演進為出發點,探索資料庫從垂直擴充架構向分布擴充架構的需求變化,以及其後對儲存所產生的影響。 ▶ 第四篇& 大數據: 主要介紹大數據儲存的挑戰及應對技術、產品。 適用:資訊管理、IT經理人等專業人士;技術專家、電腦資訊相關科系學生;及更多欲瞭解與投入到儲存浪潮中者。
雲端時代三大基石之儲存篇:大數據時代的資料新範式
本書共分為四篇: ▶ 第一篇& 企業儲存概述: 試圖以一幅生動的演進畫面,讓讀者清晰理解近60年來儲存工業的原始訴求,以及透過歷史的分析,為讀者在了解與思考儲存工業後續新媒體及雲端環境下之研究打下基礎。 ▶ 第二篇& 雲端儲存: 有系統的介紹雲端運算環境的典型分散式儲存系統所要解決的問題以及其技術架構。 ▶ 第三篇& 資料庫: 以企業到雲端化的演進為出發點,探索資料庫從垂直擴充架構向分布擴充架構的需求變化,以及其後對儲存所產生的影響。 ▶ 第四篇& 大數據: 主要介紹大數據儲存的挑戰及應對技術、產品。 適用:資訊管理、IT經理人等專業人士;技術專家、電腦資訊相關科系學生;及更多欲瞭解與投入到儲存浪潮中者。
大數據資料處理利器:Storm技術內幕與應用
本書內容主要圍繞即時大數據系統的各個主題,從即時平台總體介紹到集群程式碼、運算監控、即時系統擴展、以使用者畫像為主的資料平臺,最後到推薦、廣告、搜索等具體的大數據應用。書中提到實際生產環境中因為資料量增長而遇到的一些真實問題,對即將或正在運用即時系統處理大數據資料的團隊會有所幫助。 本書特色 匯集作者在大眾點評和1號店即時平台的大數據實作方式。 講解以Storm為基礎的流資料處理整體解決方案。
Neo4j 圖形資料庫權威指南:傲視大數據時代的先端利器
全面剖析Neo4j圖形資料庫 ◆一種高效能、擅長處理複雜或龐大的關係網絡、新型態的NoSQL資料庫。 ◆大數據、圖形資料庫愛好者絕對值得擁有的專業書籍。 ◆全書涵蓋基本概念、基本操作和豐富的實際案例。 ◆無論是入門還是高級進階均具有極高之參考價值。 圖形資料庫(Graph database)是應運"大數據時代"所產生的一種新型NoSQL資料庫;以圖論為理論根基,用節點與關係所組成的「圖」為真實世界直接建立資料庫模型,支持百億乃至千億規模之巨型圖的高效關係運算,非常適合用於高效、便捷、直觀的分析和處理大數據中之複雜關係。 本書全面深入介紹目前最為成熟優異、領先全球的最高端圖形資料庫─Neo4j,全書涵蓋基本概念、基礎操作與運用,以及提供豐富的實際案例,既可以作為Neo4初學者的入門教材,亦可作為相關行業Neo4j技術專家的絕佳參考手冊。
認識大數據的第一本書
完整的大數據概論 大數據是無所不包的名詞,它代表無法使用傳統資料管理工具來管理十分大量、快速、且高度多樣又複雜的資料。理想上大數據包含了所有資料類型,可用來協助我們在正確的時間,以正確的數量,傳達正確的資訊給適當的人,最終協助人們做出正確決策。本書將為管理階層與資料科學家提供完整的大數據概論。涵蓋大數據的關鍵挑戰與優點,以及組織所需的必備工具與技術,還有能從大數據獲得的好處。 本書涵蓋內容包括: .大數據的商業應用 .頂尖組織如何應用大數據 .大數據的生態系統 .大數據的應用、入門與教學
大數據時代:資料庫系統實作與案例分析
本書作者精心彙整大數據分析工作所需的理論知識、系統開發,程式撰寫與建立模型之實務經驗,以資料庫實作為主軸,導引出大數據之應用和未來方向;由資料分析、資料倉儲到資料探勘,皆有周詳的說明與釋例,讓讀者一目了然,在觀念結構的建立上能更有效率的掌握,並舉列案例讓讀者透過案例分析,而能對資料庫的概念有更深一層的體會。 書中並完整介紹一些常用和知名套件如何撰寫、使用以及對跑出的結果如何進行解讀,例如:如何利用wordcloud套件繪製文字雲、Arules 套件 apriori 進行關聯規則分析、stats套件 kmeans 進行集群分析、C50 套件 C5.0 進行決策樹分析、stats 套件 glm 和RevoScaleR 套件 rxLogit進行羅吉斯迴歸分析等,相信對於有志成為資料科學家的初學者而言,本書絕對是一本絕佳的入門書籍。 ※本書架構: 1. 第一、二、三、五章:主要介紹關聯式資料庫中進階技巧,以檢視表為開端,接續單元介紹索引技術、交易管理和可程式性物件,讓讀者建立在處理大量結構化資料時能更有效率的觀念與基礎。 2. 第四章:介紹 ADO.NET 資料庫程式設計,讓讀者從無到有建置一個小型資訊系統專案,建立對於資訊系統開發之認識,以及提升程式撰寫的能力。 3. 第六章:介紹資料倉儲與資料探勘,對於監督式學習或非監督式學習相關知識有一定程度的了解。 4. 第七章:介紹 SQL Server 2016 版才有的新功能,也是微軟致力於大數據分析的解決方案,主要提供資料科學家能夠透過原先所熟悉的 R 語言,不論是在交談式介面中透過SQL Server R Services直接撰寫 R 腳本指令進行資料分析,或是在 Visual Studio.NET 中透過R Tools for Visual Studio或 Microsoft R Client 的安裝,在原有 Visual Studio開發環境撰寫 R 指令從事各種機器學習,進行關聯、分類、集群和預測的工作。 書附光碟內容 1.Microsoft SQL Server 2016 範例資料庫 2.SQLServer2016 本書特色 1. 以資料庫的實作為主軸,詳述大數據的應用和未來方向。 2. 詳盡說明資料分析、倉儲與探勘等課題。 3. 舉列實際案例且循序引導,進而培養對資料庫的概念。 4. 常用套件、知名套件之介紹、撰寫、解讀說明與範例。 5. 對有志成為資料科學家的初學者而言,本書絕對是一本絕佳的入門書籍。
SAP HANA企業級大數據資料處理
SAP 高性能分析應用軟體(SAP High-Performance Analytic Appliance,SAP HANA)自2011向全球推廣以來,引發資料庫領域大震動。SAP HANA利用其突破性的分析功能,已經為全球客戶的業務運營方式帶來根本性的變革,並成為SAP史上用戶數量增長最快的產品之一。 本書以初學者為核心,全面介紹SAP HANA的基本知識和基於SAP HANA 開發應用的各種技術。由淺入深,讀者循序漸進地掌握SAP HANA相關基本知識的同時,輔以實例和練習;在內容講解上結合豐富的圖解,幫助讀者理解晦澀難懂的技術,快速掌握SAP HANA的知識以及應用方法。 適用:適合任何對SAP HANA感興趣的初學者、有SAP HANA專案經驗的開發者、技術人員。
巨量資料分析與智能應用
巨量資料分析,強化洞悉事物能力。 智能應用於裝置產品,大幅提升價值。 讓本書給您洞悉力與價值觀,點燃人生亮點。 & 本書內容: 以智能開發模型注入到巨量資料分析實務練習中,按部就班讓讀者由淺入深的學習如何為產品量身訂做智能化裝置,進而以範例說明如何應用在行動商務、醫療診斷服務、自助服務式智能商務、金融科技等新世代裝置產品的開發上,適用於現代人想投入智能產品開發的人才培育與自學用實務教材。
Storm-大數據分散式即時運算系統
阿里巴巴、yahoo、Twitter、Groupon等大型互聯網企業,處理即時巨量資料的最實用工具! 本書從基礎知識、安裝與部署、研發與維護、進階知識、企業應用等5個模組,分別介紹Storm 的安裝與設定、基本原理、Topology 元件、Spout 元件、Bolt 元件、ZooKeeper 叢集、實戰環節等內容。讓讀者在最短的時間內系統掌握Storm 的理論基礎,針對Linux 平台架設與研發自己以Storm 為基礎的巨量資料處理平台。 適合:所有巨量資料處理、即時流資料處理、Storm的開發者或有興趣者,或大專院校和培訓單位等相關科系的師生參考使用。
大數據:語意分析整合篇
c不要再拔草測風向了! 大數據讓你了解現實世界的風向。 ●市長失言,網友怎麼看?粉絲專頁經營,關鍵字是什麼?社群平台除了交朋友,還能拿來做什麼?本書通通報你知! ●全彩印刷、圖文並茂,詳細解說語意輿情分析的方法。 ●R語言、Fanpage Karma、Tagxedo、D3、ECharts等超好用分析工具介紹。 隨著網路科技發達,人們漸漸地習慣在網路上傳遞訊息,這些訊息具有很大的用處。對於企業來說,分析消費者在Facebook對產品的意見,能幫助他們調整行銷策略;對於政府來說,可利用大數據分析得到民眾對於政策的想法,無形間起到監督政府的作用。 本書解析大數據中的「語意分析」方法。語意分析是對文本進行分析、處理、歸納和推理的過程,主要目的是用來分辨使用者對於人、事、物的看法或態度。利用分析工具如R語言、Tagxedo、D3等,更可以將資料圖像化,使資料清楚呈現、一目了然。
圖解!大數據下必學的統計基礎
‧65個統計學知識點/50個經典學習案例 ‧讓您以數據提供最大的說服力 這本書談大數據,也討論統計學,更討論二者之間千絲萬縷的關聯。大數據時代要面對的不僅是技術的變革,還有工作方式和思維模式的變革。統計學本身就是大數據時代的一門重要學科。隨著大數據逐漸走進公眾的視野,統計學也必然會迎來更多的關注。這就意味著,越來越多的非統計學專業人士會瞭解統計學、應用統計學,人們也必然需要更多的統計學讀物。 本書從當下熱門話題大數據切入,引入與之息息相關的統計學。深入淺出地講述了在「資料為王」的時代下,統計學作為分析、解讀數據的學科,如何為商業、社會、生活等領域提供決策支援。 本書行文按照【案例】+【知識點】+【分析】的結構,輔以清晰明瞭的圖解和文字說明,搭配大量講述的應用案例也都和人們的生活息息相關,是想要瞭解大數據應用和統計學的必備入門參考。 本書內容重要點如下: 第1章 大數據時代下的統計學,講解了統計學的基本原理、應用領域及資料的獲取方法等內容。 第2章 樣本魅影,重點介紹了統計學最核心的思維,即用樣本資訊推論總體,並和大數據的推論思維進行比較,強調二者在實踐中結合使用的重要性。 第3章 描述資料,告訴讀者面臨大量資料的時候,如何迅速提煉出有用資訊,以一種直接、感性的方式勾勒出隱藏在冷冰冰的資料背後的內涵。 第4章 常態女神,隆重推出了統計學最經典、最重要、最具代表性的一個分佈—常態分佈,詳細介紹了關於常態分佈的理論、應用和相關的知識點。 第5章 統計推斷,講述了統計推斷是用樣本來估計總體的,是一種具有科學依據的合理猜測,儘管它不可能百分百準確,卻對人們認知事物有著不可估量的作用。 第6章 變數間的關係,從大數據思維的其中一個角度切入,即強調事物的相關關係而非因果關係,重點講述了究竟什麼是相關關係,它的統計學內涵、方法及應用。 第7章 統計雜談,以一種漫談的方式,深入淺出地講解了統計學一些熱門應用的理論。特別強調了這些理論在實踐中的誤用,並告訴讀者正確的使用方法和解讀方法。 第8章 大數據,在水一方,探討了大數據巨大的商業價值,除此之外還強調如何從大數據中獲取洞察力和決策力。
資料科學的商業運用
這本內容完整深入,但又不至於太技術性的指南介紹了數據科學的基礎原則,並引導你了解從資料中抽出有用知識與商業價值所需的「數據分析思維」。透過數據科學原則的學習,你會了解今日常用的許多資料採礦技術。更重要的是,這些原則鞏固了經由資料採礦技術解決商業問題所需之程序與策略的基礎。 「這本書超越了數據分析入門手冊的層次,它是我們這些以無所不在的數據商機及新的數據導向決策任務為事業基礎者(所有人?)的必備指南。」 -Tom Phillips,Media6Degrees首席執行長,前Google搜尋與分析主管 「兩位作者都是在數據科學有名氣之前就已聲譽卓著的專家,他們將複雜的主題處理得淺顯易懂,讓所有人都能輕鬆閱讀。這是第一本談論數據科學觀念之商業問題實際應用的著作。本書藉由羅各種引人入勝的真實案例,點出商業上大家所熟悉、常見的問題,像顧客流失、目標市場行銷,甚至是威士忌分析! 此書獨特的地方在於,它不是直接提供你各種演算法,而是幫助讀者了解數據科學背後的基礎概念,以及最重要的,如何處理並成功地解決問題。無論你想要的是綜合性的數據科學概論,或者你是個需要打好基礎的新手數據科學家,這都是一本必讀好書。」 -Chris Volinsky,AT&T實驗室統計研究總監,為Netflix所舉辦的百萬美元挑戰賽的優勝團隊成員之一 「資料數據是產能增長、創新與更豐富之顧客洞察等新浪潮的基礎,直到最近才被廣泛視為競爭優勢來源,妥善處理數據正迅速成為不被淘汰的籌碼。作者們深度的應用經驗讓此書成為必讀經典,讓你能窺見競爭對手的策略。」 -Alan Murray,連續創業家,Coriolis Ventures合夥人
統計分析與R
精熟應用統計軟體,是研究人員與資料分析人員須具備的基本能力。目前有許多統計軟體可供選擇,然而,多數都需要付費購買,也無法免費升級,通常不是個別人員可以負擔得起。R統計軟體免費,而且功能強大,包含眾多的程式套件,提供大多數統計軟體的全部分析方法;此外,R還可以自行編寫程式,完成自建模型的求解和分析。甚至,像SPSS或Stata等統計軟體也可以直接調用R,擴充其分析功能。現在,R統計軟體正逐步成為統計分析的主流。 全書共分為九大部分。 第一部分(第1章):R的安裝、資料處理及初步分析之簡介。 第二部分(第2章及第3章):統計圖表及描述統計。 第三部分(第4章):各種機率分配簡介,也是本書各章統計方法的基礎。 第四部分(第5章及第6章):說明平均數的區間估計及統計檢定的基本概念。 第五部分(第7章至第15章):平均數差異檢定,分別針對t檢定及各種變異數分析加以說明。 第六部分(第16章至第18章):變數間的相關分析,含簡單相關、偏相關及典型相關。 第七部分(第19章及第20章):迴歸分析,含簡單及多元迴歸。 第八部分(第21章及第22章):卡方檢定,進行質性變數的分析。 第九部分(第23章至第25章):分析量表的信度及效度。
專家親授:極深度大數據統計理論
阿里巴巴集團內部使用,效果顯著 大數據的統計計算是進行資料探索和分析採擷的基礎。在實際應用中會遇到兩個問題:一個是需要使用多少資源;另一個是計算時間,它關係到資料探索分析的效率和效果。人們都希望花更少的錢,並且希望計算時間更短,但對於某個確定的計算過程,它們是成反比的。 本書作者從統計計算的演算法入手,重構其計算過程,從而同時降低資源使用量和計算時間。作者提出一套完整的關於大數據統計的計算理論,包括常用的各種統計量和統計方法,開發的資料分析工具已經在阿里巴巴集團內部的多個部門使用,並取得顯著效果。 專家推薦 本書提出了一套適合於分散式運算的統計計算方法,透過對一些基礎統計量的計算,可獲得有關資料集更全面的統計資訊,進而可以進行進階的統計分析,例如,區間估計、線性回歸、主成分分析等。可以說,本書從統計計算的角度,整理出一套對大數據分析有實用價值的統計理論,並形成參考程式。-潘愛民 阿里雲首席架構師 相信大多數從事數值計算的技術人員都讀過一系列叫作Numerical Recipe in C/Fortran/Java 的書。眼前這本書或許可以叫作Numerical Statistics Recipes in Java,和那個系列一樣,對重新快速學習和使用數值統計演算法來實現資料分析應用的讀者來說,這本書是一本不錯的入門手冊。-何萬青 博士 英特爾技術計算集團技術計算架構師
資訊概論 - 從資訊科技應用培養邏輯思維能力
.電腦硬體介紹 : 從基本電腦架構到目前主流的硬體週邊配備都能有進一步的認識。 .系統軟體功能 : 本書將詳述Windows 8 作業系統功能及Word 2013文書處理操作應用。.資訊科技應用 : 提供最貼近生活的網路應用 - 相片編修、通訊軟體、社群媒體、免費電子郵件、娛樂市集、Google Chrome、Google 地圖…。 資訊科技的應用已從桌上型電腦延伸至雲端、行動裝罝,本書除了介紹電腦硬體週邊,也包含最新作業系統Windows 8的操作、Word 2013 文書處理,以及多種常見的網際網路應用,建立正確的資訊科技應用觀念。 /電腦基礎/ 在資訊充斥的新紀元,電腦科技已經為人類的生活、工作、娛樂...等帶來極大的衝擊,本篇主要針對電腦的硬體、週邊設備、維護方式與正確的使用姿勢進行介紹。 /Window 8/ 新一代的作業系統 Windows 8,以動態磚、市集 App 的型式呈現,並適用於觸控螢幕與滑鼠應用,提供更直覺簡單的畫面。本篇透過 Windows 的操作環境、檔案管理、相片影音及系統維護的說明,帶領大家一起體驗 Windows 8 的嶄新服務。 /網際網路/ 包含多種網路應用軟體如:Google Chrome 瀏覽器、搜尋工具與免費電子郵件Gmail,另外透過 Windows 市集,體驗遊戲、相片、音樂…等各式有趣的應用程式,還有網路上最熱門的 Skype、Facebook、YouTube、Google 地圖…等應用,隨時與朋友保持互動! /文書處理/ 藉由微軟 Office Word 2013這套強大的文書編輯軟體,學習文件常用的編輯技巧、圖片與文字藝術師搭配、建立表格..等功能,加強技能與提升工作效率,讓手邊的文件看起來更顯專業! 本書非常適合剛學習電腦的朋友作為初學教材,也可作為電腦愛好者和自學讀者的參考用書。
巨量資料安全技術與應用
巨量資料之所以在最近幾年快速走紅,主要是順應著網際網路、行動裝置、物聯網和雲端運算等技術的快速崛起,其技術及相關的基礎研究已然掀起廣大的研究熱潮。 & 本書將以巨量資料發展歷史、特徵與發展趨勢為切入點,分析各領域所面臨到的巨量資料安全威脅和需求,歸納總結巨量資料安全的科學內涵和技術研究方向。最後再針對巨量資料安全的後續發展進行展望,提出合理的建議與期許。 & 此書非常適合IT工程技術人員/資訊安全從業人員來閱讀,也可成為高等教育於資訊安全專業領域學習與研究的參考教材。 & 本書特色 & ◎融合完整、實用與豐富的新技術
資料庫系統理論與實務(第三版)
本書涵蓋資料庫領域的重要觀念,從資料庫系統架構開始,首先介紹概念資料模型分析與設計,進而如何轉換為實作上的實際資料模型,前半段是以資料庫分析與設計為主,輔以獨創的SQL語意圖解表達法來解說抽象且生硬的原理,讓每一個SQL語法皆能達到易學、通透之目的。 & 後半段為資料庫管理與規劃,著重於各類的圖解、流程與實作來展現出資料庫極為重要的交易處理、並行控制,以及回復技術等原理。最後再以微軟最新版SQL Server 2014的資料庫管理系統來實作與驗證前面所述的理論,於此對資料庫系統有一個完整與全面的概念。 & 本書特色 & ◎採用邏輯思維的方式,貫穿資料庫系統理論。 ◎輔以圖像化展現SQL語法,更加容易學習理解。 ◎符合業界的實務範例教學,培養與增進專業能力。 ◎使用MS SQL Server 2014管理平台,方便操作與驗證。