第1章 认识大数据
1.1 大数据综述1
1.1.1.大数据的产生 1
1.1.2 大数据的特征 2
1.2 大数据的基本概念 5
1.2.1 大数据的定义 5
1.2.2 大数据的特点 5
1.3 大数据思维7
1.3.1 大数据思维的变革 7
1.3.2 大数据思维的关注点 9
1.3.3 企业大数据思维之数字化转型 10
1.4 大数据的处理过程10
1.4.1 大数据采集 10
1.4.2 大数据导入与预处理 11
1.4.3数据治理11
1.4.4 大数据统计与分析 .11
1.4.5 大数据挖掘 12
1.5 企业常用的数据平.台 13
1.5.1 数据分析工具 13
1.5.2 数据中台 13
1.6 大数据分析在企业中的实际应.用 14
1.6.1数据业务应用场景 14
1.6.2 大数据分析应用案例 15
实验1 认识大数据分析工具“魔镜” 18
第2章 大数据技术基础
2.1 云计算 26
2.1.1 云计算的特点 27
2.1.2 云计算与大数据 28
2.2 基础架构支持 28
2.2.1 Hadoop28
2.2.2 HBase.29
2.2.3 MapReduce 30
2.2.4 Hive 31
2.2.5 Python31
2.2.6 R语言 32
2.2.7 维度建模 32
2.3 数据采集 35
2.3.1 数据的形态 35
2.3.2 数据采集的方法 37
2.4 数据存储 38
2.4.1 数据存储的概念 38
2.4.2 数据的存储方式 38
2.4.3 常见数据源类型 39
实验2 数据源接入与编辑 42
第3章 大数据治理
3.1 数据标准管理 51
3.1.1 数据服务标准 51
3.1.2 指标梳理标准 53
3.1.3 技术实现标准 55
3.2 数据清洗 56
3.2.1 数据清洗的作用 57
3.2.2 数据清洗的方法和过程 57
3.2.3 数据清洗的实例 59
3.2.4 数据类型 60
3.2.5 数据转换 63
3.3 数据资产管理 64
3.3.1 数据规划 64
3.3.2 元数据管理 65
3.3.3 数据质量管理 66
3.4 数据服务 67
3.4.1 统计分析 67
3.4.2 数据开发 69
实验3 数据处理 70
第4章 大数据统计分析技术
4.1 统计分析概述 81
4.1.1 统计分析的概念 81
4.1.2 统计分析的特点 83
4.1.3 统计分析的应用 85
4.2 统计分析的常见指标 87
4.2.1 统计指标概述 87
4.2.2 总量指标 89
4.2.3 相对指标 92
4.2.4 平均指标 95
4.2.5 变异指标 100
4.3 回归与预测 102
4.3.1 回归 102
4.3.2 预测 104
实验4数据分析 105
第5章数据挖掘
5.1 大数据挖掘概念 112
5.1.1 数据挖掘的起源 112
5.1.2 数据挖掘的定义 114
5.2 数据挖掘任务 114
5.2.1数据总结 114
5.2.2 分类 114
5.2.3 关联分析 115
5.2.4 聚类 115
5.3 数据挖掘流程 115
5.3.1 业务理解 116
5.3.2数据理解 116
5.3.3数据准备 117
5.3.4 建立模型 117
5.3.5 结果评价 118
5.4 数据挖掘的常用方法 118
5.4.1 决策树 118
5.4.2 遗传算法 121
5.4.3 神经网络 123
5.4.4 关联规则 124
5.4.5 粗糙集 125
5.4.6 判别分析 126
实验5 数据挖掘 128
第6章 大数据可视化
6.1 数据可视化分类 134
6.1.1 结构可视化 134
6.1.2 功能可视化 135
6.1.3 关联关系可视化 135
6.1.4 趋势可视化 136
6.2 可视化表现形式 137
6.2.1 二维可视化形式 137
6.2.2 三维可视化形式 138
6.2.3 仪表盘 140
6.2.4 定制可视化形式 141
6.2.5 大数据可视化方式的选择 142
实验6 数据可视化 144
第7章 大数据安全
7.1 大数据安全的内容 170
7.1.1 物理安全 171
7.1.2 网络安全 172
7.1.3 应用安全 172
7.1.4 数据隐私 174
7.2 数据保护技术 175
7.2.1 镜像技术 175
7.2.2 快照技术 176
7.2.3 持续数据保护技术 177
7.2.4 用户管理技术 178
实验7 权限管理机制 182
第8章 大数据应用案例实操
8.1 贷款明细分析 186
8.1.1 背景分析 186
8.1.2 需求分析 187
8.1.3 大数据分析过程 187
8.1.4 分析总结 196
8.2 电商行业销售分析 196
8.2.1 背景分析 196
8.2.2 需求分析 197
8.2.3 大数据分析过程 197
8.2.4 分析总结 204
8.3 网站流量分析 204
8.3.1 背景分析 204
8.3.2 需求分析 204
8.3.3 大数据分析过程 205
8.3.4 分析总结 215
参考文献 216