《数据挖掘方法与应用》以应用为导向介绍数据挖掘的相关工具、理论和方法,包括数据挖掘概述、数据挖掘工具、数据与数据平台、数据预处理、关联分析、决策树、贝叶斯分类和神经网络。通过循序渐进地讲解数据挖掘可使用的工具、数据存储及分析环境、原始数据可能存在的问题及相应的预处理方法、数据挖掘经典算法等相关知识,使读者对数据挖掘有整
Zabbix凭借其既丰富又优秀的特性,在国内外的监控市场蓬勃发展,投靠Zabbix阵营的用户不计其数。面对Zabbix的蔓延,与其逡巡观望,不如尽早加入抢占先机!本书详细介绍Zabbix各项功能,包括安装、配置、告警、可视化、分布式监控、自动化等。 本书分为14章,由浅入深地对Zabbix的基础和高级功能进行细致地讲
《Flink内核原理与实现》既讲解了Flink的入门、安装、流计算开发入门、类型和序列化系统、监控运维、安全管理配置等基础知识,又讲解了Flink的时间概念、Window的实现原理及其代码解析,Flink的容错机制原理,Flink容错的关键设计、代码实现分析,FlinkJob从源码到执行整个过程的解析,FlinkJob
内容简介这是一部全面讲解数据产品经理核心知识体系的著作。12位作者大多来自国内的知名企业,涉及不同的行业,让本书拥有了更广泛的视角,能帮助读者从不同的角度去了解数据产品经理如何在数据、产品、运营、市场等多个方面产生价值。本书的*终目的是让读者全面了解数据产品经理的工作内容、系统掌握数据产品的核心知识体系,快速实现从入门
本书详细阐述了培养复合型大数据专业人才所需要的大数据相关知识。全书共9章,内容包括大数据概述、大数据与其他新兴技术的关系、大数据基础知识、大数据应用、数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化、大数据分析综合案例。在大数据基础知识部分,本书详细介绍了与培养学生的数据素养相关的知识,包括大数据安全、大数
本书是高校的大数据导论课程教材,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者更清晰地理解大数据技术。本书可作为高等院校相关专业“大数据基础”“大数据导论”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。
共分11章,第1章对大数据及Hadoop进行总体介绍,第2章讲解了如何搭建Hadoop集群。第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务。第6章讲解Hadoop2.0的新特性。第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBas
本书系统介绍了大数据基础知识和相关技术,全书分为大数据概述篇、大数据存储与管理篇、大数据采集与预处理篇、大数据分析与挖掘篇、大数据平台Hadoop实践与案例分析篇。全书共15章,主要内容包括大数据基本概念、大数据存储与管理概念及技术、大数据采集及预处理技术、大数据计算模式、大数据分布式并行处理框架Hadoop、大数据分
本书作为Spark的入门书,从Spark核心编程语言Scala讲起,涵盖当前Spark主流的开发组件。以实操为主,深入讲解每一个操作步骤,包括SparkRDD离线数据处理、SparkSQL快速结构化数据处理、SparkStreaming实时数据处理,同时包括案例讲解、源码剖析、常用Shell命令和JavaAPI详解。即
本书系统地讲解了大数据处理常用技术,具体包括大数据处理架构Hadoop、分布式文件系统HDFS、MapReduce编程模型、分布式数据库Hbase、NoSQL数据库、Spark分布式内存计算、MapReduce应用开发、SparkSQL编程、数据可视化。本书编写特色理论与具体操作相结合,较低基础入门大数据技术。读者对象