本书以“高职院校学情分析”系统为项目原型,以任务驱动为主线,基于Hadoop大数据平台,讲解大数据平台的搭建与运维、大数据的采集与存储、大数据的处理、数据的分析、数据的可视化等完整的大数据应用案例,全面详细地讲述Hadoop、MapReduce、HDFS、Hive和Sqoop 等技术的相关知识,并详细讨论了Mahout大数据分析中的常用算法——K-means聚类算法、Canopy 聚类算法、欧氏距离算法、余弦距离算法、皮尔逊相关系数算法、TF-IDF加权算法等的使用及相关学情分析系统中算法的实现等。 本书具有较强的实用性和可操作性,语言精练,通俗易懂,操作步骤描述详尽,并配有大量操作图例。 本书可作为高等职业院校大数据应用专业、软件技术专业、云计算技术与应用专业的大数据分析与软件开发等相关课程的教材,也可作为从事大数据分析、云计算应用等系统开发与分析技术人员的参考用书。 |
前辅文 |
|
|
|
|
|
“十四五”职业教育国家规划教材 |
|
|
|
|