Hadoop金融大數據分析

Hadoop金融大數據分析

《Hadoop金融大數據分析》 一書原作者Rajiv Tiwari(拉吉夫.蒂瓦里),中文版由王小寧譯,電子工業出版社2017年5月出版

內容提要

隨著數據的增長以及企業每天處理越來越多的數據, Hadoop作為一個數據平台已經變得很流行。金融行業想要最小化風險和最大化收益, Hadoop作為一個主宰大數據市場的工具,在其中起著很大的作用。

《Hadoop金融大數據分析》介紹了大數據和 Hadoop的基礎知識,讓讀者掌握項目管理、欺詐檢測等 TOP大數據金融項目,其中不僅包含行業參考和代碼模板,同時包括實現中使用的多個 Hadoop組件。

讀完《Hadoop金融大數據分析》,讀者會理解一些行業領先的架構模式、大數據管理經驗、竅門和大數據最佳實踐方案,以便基於 Hadoop成功地開發出適合自己的解決方案。

目錄

第1 章 大數據回顧 1

大數據是什麼1

數據量2

數據速度 2

數據類型 3

大數據技術的演進 3

過去 3

現在 4

未來 5

大數據願景 5

存儲 6

NoSQL 6

NoSQL 資料庫類型 7

資源管理 7

數據治理 8

批量計算 8

實時計算 8

數據整合工具9

機器學習 9

商務智慧型和可視化 9

大數據相關的職業 10

Hadoop 架構 11

HDFS 集群 12

MapReduce V1 14

MapReduce V2——YARN 15

Hadoop 生態圈簡介 18

馴服大數據 18

Hadoop——英雄 19

HDFS——Hadoop 分散式系統19

Hadoop 版本 23

發行版——本地部署 25

發行版——雲端27

總結 28

第2 章 金融服務中的大數據 29

各個行業的大數據使用情況 29

衛生保健30

人類科學30

電信 31

線上零售商 31

為什麼金融部門需要大數據 31

金融部門的大數據套用案例 34

HDFS 上的數據歸檔 34

監管 35

欺詐檢測35

交易數據36

風險管理36

客戶行為預測 36

情感分析——非結構化36

其他套用案例 37

金融大數據的演進過程37

應該如何學習金融大數據 41

把你的數據上傳到HDFS 上41

從HDFS 上查詢數據42

在Hadoop 上的SQL 43

實時 44

數據治理和運營44

ETL 工具 45

數據分析和商業智慧型 45

金融大數據的實現 46

關鍵挑戰46

克服挑戰47

總結 50

第3 章 在雲端使用Hadoop. 51

大數據云的故事51

原因 52

時機 53

收穫 54

項目細節——在雲中進行風險模擬 54

解決方案55

現實世界55

目標世界57

數據轉換60

數據分析62

總結 63

第4 章 使用Hadoop 進行數據遷移. 65

項目細節——歸檔你的交易數據65

解決方案67

項目第一階段——分裂交易數據到數據倉庫和Hadoop 68

項目第二階段——完成數據從關係型數據倉庫到Hadoop 的遷移 77

總結 83

第5 章 入門 85

項目詳細信息——風險和監管報告 86

解決方案87

現實世界87

目標世界88

數據收集89

數據轉換97

數據分析 112

總結 116

第6 章 變得有經驗. 117

實時大數據 117

項目細節——識別欺詐交易 119

解決方案 120

現實世界 120

目標世界 120

馬爾科夫鏈模型執行——批處理模式 121

數據收集 126

數據轉換 128

總結132

第7 章 深入擴展Hadoop 的企業級套用. 133

擴展開來——實際上的水平134

更多的大數據使用案例 135

使用案例——再談欺詐問題 136

解決方案 136

使用案例——用戶投訴 137

解決方案 137

使用案例——算法交易 137

解決方案 138

使用案例——外匯交易 138

解決方案 138

使用案例——基於社交媒體的交易數據139

解決方案 139

使用案例——非大數據 140

解決方案 140

數據湖 140

Lambda 架構 143

大數據管理144

Apache Falcon 概覽 146

安全性 147

總結149

第8 章 Hadoop 的快速增長 151

Hadoop 發行版的升級周期 151

最佳實踐和標準 154

環境154

與BI 和ETL 工具的集成155

提示155

新的趨勢 157

總結158

相關詞條

相關搜尋

熱門詞條

聯絡我們