本书围绕大数据采集、汇聚、存储、计算、分析、挖掘、可视化等处理全过程,基于Flume、Kafka、HDFS、HBase、MapReduce、Spark、Hive、ECharts等主流软件全面介绍大数据的基础原理和核心技术,以及人工智能、云计算和物联网等大数据相关内容,并在此基础上进一步阐述政务、商业等行业大数据,以及文
通过本书,你可以了解到:SparkSQL的新接口如何为SQL的RDD数据结构提升性能。SparkCore与SparkSQL中数据join的不同选择方式。充分利用标准RDD转换的技术。如何解决Spark中键值范式的性能问题。不借助Scala或其他JVM语言来编写高性能的Spark代码。采用改进建议后,如何来测试其功能及性
信号处理与线性系统分析(第2版)
本书共8章,内容主要包括Spark概述及入门实战,Spark的作业调度和资源分配算法,SparkSQL、DataFrame、Dataset的原理和实战,深入理解Spark数据源,流式计算的原理和实战,亿级数据处理平台Spark性能调优,Spark机器学习库,Spark3.0的新特性和数据湖等。 本书适合Spark开发人
本书以S7-200SMART系列PLC控制的典型自动化生产线为载体,按照“项目引领、任务驱动”的编写模式,将自动化生产线安装与调试所需的理论知识与实践技能分解到不同项目和任务中,旨在加强学生综合技术应用和实践技能的培养。主要内容包括自动化生产线认知、自动化生产线核心技术应用、自动化生产线组成单元安装与调试、自动化生产线
《数字化工厂实践指南——PlantSimulation系统仿真与建模手册》包含基础卷、仿真分析与优化卷两册。本册为仿真分析与优化卷,全书以PlantSimulation系统提供的功能为主线,结合实际案例,讲述相应功能在仿真项目中的应用,其中每个范例都从业务目标到仿真建模的方法与设计过程进行了详细的讲解,包括仿真中的统计
内容提要本教材是根据“新工科建设的人才培养目标”“中国工程教育专业认证毕业要求和课程目标”“卓越工程师培养计划能力培养矩阵”等需求编写而成的专业性综合实践教材,其目的在于培养学生掌握工程项目全流程开发设计方法、运用理论知识分析和解决复杂工程问题的能力。本教材共分七章,主要内容包括工业自动化系统的总体概念、虚拟仪器技术;
本书共八章,包括大数据新引擎,大数据从哪里来,大数据到哪里去,大数据处理平台,大数据采集与储存管理技术,大数据预处理技术,大数据分析与挖掘技术,大数据可视化技术。
本书共分为3个教学模块,分别是自动化生产线安装与调试、自动化生产线整体控制、智能搬运。其中,自动化生产线安装与调试模块包含6个项目,分别是自动化生产线的认识、供料单元安装与调试、加工单元安装与调试、装配单元安装与调试、分拣单元安装与调试、输送工作单元安装与调试;自动化生产线整体控制模块包含2个项目,分别是自动化生产线联
本书从大数据基础知识出发,系统阐述了Hadoop和Storm大数据处理平台的基础理论研究、常用的大数据处理技术--大数据存储技术、大数据存储海量数据技术、大数据交互式分析与大数据批处理技术,以及大数据的应用价值与基本策略,同时对大数据在多个领域与相关行业中的应用进行分析与研究。