在数据分析的每一个阶段,从对数据的认识及分析规划开始,一直到最终结果,都应该尽可能地使用可视化技术,数据处理的每一步中间结果的直观认识都对下一步决策有重要意义. 本书基于R 和Python 绘图的基本技能,不仅介绍了初等数据描述中的可视化,而且把大部分篇幅贡献给更深层次的数据建模过程中各阶段的可视化.
本书既可作为本科各专业可视化的入门课程教材,也可供广大实际工作者参考.
前辅文 第一部分基础篇 第1章 可视化探索性数据分析:从案例开始理解 1.1 案例:例1.1汽车数据 1.2 案例:例1.2葡萄牙选举数据 1.3 案例:例1.3睡眠数据 1.4 案例:例1.4QSAR生物富集类别数据 1.5 案例:例1.5部分鸢尾花人造缺失值数据 1.6 本书使用的一些自编的Python函数 1.7 本章 的R代码 1.8 习题 第2章 Python基本画图技能 2.1 matplotlib.pyplot画图工具及基本技能 2.2 seaborn(sns)系列画图工具 2.3 pandas.DataFrame画图 2.4 Altair画图工具 2.5 Plotly画图工具 2.6 pyecharts画图工具 2.7 习题 第3章 R基本画图技能 3.1 基本的R代码画图 3.2 强有力的画图程序包:ggplot 3.3 recharts画图工具 3.4 习题(第2章 和第3章 合并) 第4章 网络图基本技能 4.1 R网络作图 4.2 Python网络作图 4.3 习题 第二部分应用篇 第5章 有监督学习的可视化案例 5.1 初等可视化描述:例5.1盐度数据 5.2 有监督学习回归案例:例5.2混凝土数据 5.3 有监督学习分类案例(自变量为数量变量):例5.3数字笔迹数据 5.4 有监督学习分类案例(自变量多为分类变量):例5.4皮肤病数据 5.5 本章 的Python代码 5.6 习题 第6章 无监督学习的可视化描述 6.1 降维:主成分方法的可视化 6.2 聚类案例:例6.2人口学数据 6.3 本章 的Python代码 6.4 习题 第7章 关联规则:大量比例的计算、展示及解释 7.1 概述 7.2 一些基本概念和术语 7.3 概观例7.1的数据 7.4 求规则 7.5 关联规则的可视化 7.6 本章 的Python代码 7.7 习题 第8章 社交网络的可视化 8.1 网络图概述 8.2 贸易数据案例 8.3 例8.1贸易数据的部分:中国出口占比 8.4 中心性度量 8.5 本章 的Python代码 8.6 习题 第9章 词语分析的可视化 9.1 通过简单例子概述词语分析 9.2 两个词语文献的词频数比较 9.3 文本的词频率分析 9.4 文本的情感分析 9.5 词之间的关系:n元组 9.6 本章 涉及的Python编程 9.7 习题