本书以Hadoop3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解VMware中CentOS7操作系统的安装;第2章讲解操作系统集群环境的配置;第3~16章讲解Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive
本书为上海市教委组织编写的大学计算机系列教材之一,以理论结合实践的形式,探讨了数据思维在大数据时代的作用及应用,讨论了数据分析的方法,通过实践体验掌握数据分析方法和数据可视化方法应用。本书第三版是根据课程改革和新的计算机考试大纲进行的定期修订。数据分析可以帮助人们获得有价值的信息、数据可视化可以帮助人们更好地理解数据分
本书是长沙医学院信息工程学院院长马俊根据教育部有关大数据专业的教学标准进行编写,重点针对长沙医学院开设的大数据专业的课程教学思路进行编写,本书结合国内外关于大数据最新的研究成果和应用技术,力争在系统把握大数据的定义、特征、类型及发展情况的基础上,按照大数据处理的主要流程与基本环节,对大数据的采集处理、存储管理、快速运算
大数据分析实务初级教程(Python篇)作为大数据实务初级教程的Python软件应用部分,主要讲述如何运用Fython进行数据整理、数据分析过程。本书致力于呈现Python常用的数据分析方法,结合实际案例对于海量数据的处理提供了参考。
本书共分4章,内容包括:专业群建设的背景和意义、数控技术专业群建设与发展的思路和方案、数控技术专业群建设与发展的实施路径、数控技术专业群建设与发展的经验总结和成效。
本书将机械装配、电气技术、气动技术、PLC技术、变频器、触摸屏等融合到一起,让学生全面的了解和学习自动化生产线技术,为成为设计、安装、调试、现场操作、维修管理等自动化岗位上的高技能人才打下坚实的基础。本书以培养应用型人才为目标,注重职业道德的培养、注重基础理论知识的讲解,重点体现技能的培养、设备故障的分析和排除,突出实
本书共9章,内容包括:大数据的认知、大数据时代的理解、大数据应用的模式和价值、大数据应用的基本策略、大数据技术在全社会医疗健康资源配置的优化、大数据时代下的城市交通、金融大数据创新应用等。
本书第一章是计算机数据压缩技术基础知识。第二章介绍计算机海量数据的并行快速压缩技术研究。第三章简述基于三维多媒体流的网络数据快速压缩技术研究。第四章是基于SOA的XML数据快速压缩技术研究。第五章叙述基于其他领域的计算机数据快速压缩技术探索与实现。
本书分为“大数据分析基础”“相关法律、伦理与职业道德”两部分,主要内容包括:数据分析概论、业务指标分析、业务数据描述、业务指标量化、参数和统计量、统计推断、大数据和云计算、数据模型等。
本书从Excel初学者的需求出发,第一章首先介绍Excel的软件安装和基础模块;第二章和第三章分别介绍了Excel的数据存储与数据预处理方法;第四章介绍Excel中的相关数据运算和函数;第五章介绍Excel的数据分类汇总方法和数据透视表;第六章介绍时间数据的处理方法;第七章介绍数据可视化方法;第八章介绍了相关分析、回归