这是一部从企业架构视角系统讲解企业级数据架构的著作,包含数据架构的原理、方法和实践。本书拟分为四个部分共17个章节来系统性的阐述数据架构相关内容;第1部分架构基础主要包含1个章节1.数据架构与企业架构其主要从宏观的角度阐述企业架构与数据架构的关系以及重要性使读者明白数据架构并不是孤立存在的且与企业架构息息相关第2部分数
随着社交网络等新型应用的兴起和云计算等新技术的快速发展,人类获取数据的规模正以前所未有的速度增长,数据中包含了大量有价值的信息,能够有效助力社会、经济、科技的发展,因此数据管理与分析方面的研究工作倍受关注。本书针对该领域的研究热点和前沿技术进行了深入浅出的介绍,包括图数据、云数据库系统、时空数据、数据质量、数据库智能化
首席数据官(ChiefDataOfficer,CDO)是数字时代的产物,它在数字化转型的过程中,以及在转型成功后的数字经济中,都会起到关键作用。本书旨在建立一套相对完整的关于首席数据官的知识体系,帮助读者更好地参与数字时代的发展。本书分为5篇。第一篇CDO概论介绍CDO产生的背景、发展趋势、主要职责、技能和工作路径等。
本书以最新版本的工程设计标准和规范为蓝本,对工业生产过程自控工程设计的整体内容进行了全面介绍,主要目的是使自动化专业的本专科学生能够有全面的自控工程设计的概念,掌握自控工程设计的方法,并了解自控工程设计有关的标准和规范,以期对自控工程设计有全面、深入的了解,并能够与其他专业设计人员协调工作,完成整个工程项目的设计和施工
本书共分三个部分,分别是基础篇、实践篇和拓展篇。基础篇是对整个课程的历史、背景和技术原理的解释部分,基础篇包含三个项目,讲解了的大数据处理流程、大数据存储架构、大数据存储技术路线等知识。实践篇则是更偏重于理论的实验部分,实验内容较多,注重简单、易学和实用等原则,实践篇包含三个项目,讲解了结构化数据存储技术路线、Post
本书按照“理论+实战”的形式编写,将企业项目需求分解为单独的任务,全面系统地讲解了大数据采集与预处理的相关知识与技术。全书针对数据采集的不同来源,将知识内容分为五个项目,包括网络数据采集、分布式消息系统Kafka、实时数据库采集工具Canal和Maxwell、ETL日志采集技术栈以及ETL工具——Kettle。本书针对
全书共9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用以及Python应用案例,由浅入深地介绍了数据可视化的基础内容。
"本书是一本面向大数据基础知识学习、基本技能训练和场景应用的项目化教程。全书共分为8个单元,内容包括初识大数据、Linux应用基础、大数据存储与计算、大数据编程基础、数据采集与预处理、数据分析与挖掘、数据可视化、大数据典型行业应用分析。本书知识点全面,融合了大数据应用开发的新技术和多个典型行业应用场景,突出情境案例导引
本书以大数据分析与挖掘的常用技术与真实案例相结合的方式,按照“概念和原理讲解、案例分析、能力拓展——Python软件应用”的层次进行阐述,深入浅出地介绍大数据分析与挖掘的重要内容。全书共11章,第1章作为全书的绪论,介绍了大数据分析与挖掘的基本概念、行业应用等;第2章介绍了Python的安装、编程基础以及常用的数据分析
Spark是业界主流的大数据计算框架。本书通过一系列大数据应用案例和实践项目贯穿始终,使用Python详细阐述了Spark大数据环境的搭建、SparkRDD离线数据计算、SparkSQL离线数据处理、SparkStreaming实时数据计算等一系列常见的大数据处理问题,并在此基础上对Spark的核心概念及技术原理进行了