本书是“格致方法·商科研究方法译丛”中的一种,商科研究方法主要是帮助相关专业的研究生进行理论研究的教学参考书。数字方法在商科方法研究中经过许不断发展,形成了完备的体系。本书主要教学的是使用数字方法收集定性数据,即在定性研究中使用数字方法(包括跟踪和追踪),帮助相关专业的硕士研究生完成其毕业论文。全书分六章,手把手地帮助
本书采用案例式编写模式,包括7个单元,其中,单元1介绍数据分析的基本概念、流程和常用工具包,单元2介绍数据标注的分类、基本流程及工具的使用,单元3介绍ndarray数组及Python科学计算库NumPy,单元4介绍数据分析处理库pandas,单元5介绍数据可视化工具包Matplotlib和seaborn,单元6介绍分类
本书共有九章,从数据采集与预处理概述开始,介绍了大数据环境的搭建,并对数据采集与数据预处理的技术方法进行了系统介绍。数据采集的内容包括Flume日志数据采集、Kafka日志数据采集、Fluentd与Logstach等一系列数据采集技术;数据预处理的内容包括网络爬虫采集Web数据、Python数据预处理技术、Kettle
本书以广泛使用的Alluxio2.8.0版本为基础编写,深入介绍Alluxio相关技术原理与实践案例。本书主要内容包括Alluxio系统入门与使用、Alluxio系统内核组件设计实现原理,同时详细介绍了Alluxio在大型企业中的经典应用案例与生产实践,并附有Alluxio的开源社区开发者指南。本书是工业界和学术界从事
本书为高等职业教育计算机类新形态——工作手册式教材,内容包括基础环境的搭建与配置,Hadoop完全分布式集群的搭建与运行,Hadoop核心组件的应用案例,Hive组件的安装、配置与应用,ZooKeeper的安装、配置与应用,HBase的安装、配置与应用,Sqoop组件的安装、配置与应用,Flume组件的安装、配置与应用
本书是数据标注领域领先的实训讲义。本书着重对常见的文本、语音和图像标注任务类型进行介绍,帮助从事标注工作的学习者快速地完成系统化学习,进行标注实战。本书对文本、语音及图像标注的多种任务类型逐一进行讲解和分析,每种标注类型均配有对应的规范、举例分析、习题及解析。同时,本书还针对各类标注配套多种子任务类型或多个领域的实操练
本书是一本专门面向数据标注人才培养的实训教材,适用于有意从事人工智能训练师和数据标注工作的人员。为了使学习更具有针对性,本书特别选择了能代表行业普遍需求的标注项目管理知识及典型文本、语音和图像标注任务进行讲解与训练,辅助学习者快速完成系统化学习,进行标注实战工作。本书对文本的事件标注和关系标注、语音的采集和质检、图像的
随着“十四五”规划纲要中提出“协同发展云服务与边缘计算服务”的观点,边云智能已成为未来发展的重要趋势。本书依托于政策大背景,旨在向读者介绍边云智能的基础知识和应用。书中分为四个篇章,第一篇章介绍了边云架构的骨架和基础概念,第二篇章介绍了人工智能算法和深度学习模型,第三篇章介绍了云端决策算法和边缘端轻量化算法,第四篇章介
本书系统讲述ApacheSpark/PySpark大数据计算平台的原理,以及如果将ApachePySpark应用于大数据的实时流处理、批处理等各个场景。通过原理深入学习和实践示例、案例的学习应用,使读者了解并掌握ApacheSpark/PySpark的基本原理和技能,接近理论与实践的距离。全书共分为8章,主要内容包括:
本书是一本全面介绍数据挖掘基本原理、核心算法以及典型应用方法的专业书籍。第4版在前三版的基础上,对数据挖掘的方法论和知识点进行了重新归纳,按照基础篇、提高篇和应用篇进行设计。从方法论上说,数据挖掘是一个方法和原理逐步演变的过程。首先,最基础的数据挖掘方法主要有“关联规则”“分类”“聚类”,它们是数据挖掘的灵魂和基础,因