本书的编写目的是向读者介绍大数据分析的基本概念和相应的技术应用。全书共10章,分别介绍大数据概述、爬虫和大数据相关技术、Scrapy爬虫、Python与MySQL数据库连接与查询、数据可视化基础与应用、大数据存储与清洗、数据格式与编码技术、数据抽取与采集、pandas数据分析与清洗以及综合实训。本书将理论与实践操作相结
本书为电气化铁路变电所预应力混凝土圆杆(TBT2824-2008)的英文译本CircularPrestressedConcretePoleforSubstationofElectrifiedRailway。为国家铁路局颁布的2022年第2批英文铁标(共9种,国铁科法[2022]10号文)的一种。本标准规定了电气化铁路变
本书系统地介绍了大数据的基础知识和前沿技术。全书共8章,内容包括大数据概述、大数据处理平台Hadoop、数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化、大数据思维与安全、城市空气质量大数据分析实战。
为落实国家战略,加速新一代信息技术人才培养,满足数字经济发展的人才需求,为实现经济高质量发展提供人才支撑,中国科协策划并主编中国科协新一代信息技术系列丛书,中国自动化学会受中国科协委托组编《智能控制导论》一书。本书系统地阐述了主流的智能控制概念、框架、流程、方法、算法及典型案例,希望有助于读者全面深入地了解智能控制理论
本书分为三篇,涵盖11个项目。第一篇为概论篇,介绍了大数据导论、大数据中的数据库等内容;第二篇为分析篇,介绍了大数据采集、大数据预处理基础、大数据预处理实施等内容;第三篇为附录篇,介绍了大数据中的统计学、大数据前沿等内容。
本书分上下两篇,上篇共9章,在介绍测量与仪表、误差及其处理的基础上,阐述温度、压力、流量、物位、机械量与成分等流程工业中主要参数的检测原理、方法及相关的仪表;下篇共6章,介绍过程控制装置及系统相关的知识。
本书以Scala作为开发Spark应用程序的编程语言,系统地介绍了Spark编程的基础知识。全书共9章,内容包括大数据技术概述、Scala语言基础、Spark的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSQL、SparkStreaming、StructuredStreaming和SparkML
《分布式智能算法及在大数据中的应用》主要包括智能算法技术与大数据概述;基于Hadoop的分布式杂交水稻算法;基于Hadoop的随机奇异值分解算法;基于Hadoop的分布式水波优化算法;基于Spark的分布式关联规则挖掘算法;基于Spark的分布式飞蛾扑火优化算法;基于Spark的分布式蚁狮算法等内容。本书既可以作为计算
数字经济时代,数据已经成为国家的重要战略资源,已经成为国家核心竞争优势的关键要素。近年来,随着数字经济的迅猛发展,数据的跨境流动规模呈指数量级增长,对全球经济的贡献度也引人瞩目。跨境数据流动已成为关系各国政治、经济、社会的核心议题。全球主要经济体已经围绕跨境数据流动所涉及的重要议题出台规制方案,并积极参与国际规则制定。
本书以任务为导向,较为全面地介绍了Spark大数据技术的相关知识。全书共9章,具体内容包括Spark概述、Scala基础、Spark编程基础、Spark编程进阶、SparkSQL--结构化数据文件处理、SparkStreaming--实时计算框架、SparkGraphX--图计算框架、SparkMLlib--功能强大的