本书系统地介绍了语音识别在大模型时代的新技术与新应用。全书共16章,原理部分涵盖声学特征、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)、语言模型和加权有限状态转换器(WFST)、语音大模型,重点描述了GMM-HMM、DNN-HMM和端到端(E2E)三种语音识别框架;应用部分包含Kaldi、W
"近年来人工智能技术突飞猛进,以语音识别为代表的音频处理技术取得了大量突破,但该领域内理论结合实战的入门书籍却较为缺乏,本书旨在为有志学习音频信号处理的读者提供一本实用的入门书籍。本书共13章,第1章和第2章是基础部分,包括声学基础知识及Python基础等内容;第3到4章介绍了音频信号的获取及分析方法;第5~8章介绍了
全书共分11章,主要介绍了声学基础知识、音频信号的数字化、数字音频压缩编码的基本原理及相关标准、信道编码与调制技术、光盘存储技术、电子乐器数字接口(MIDI)、数字音频文件格式、音频处理与控制设备、数字音频工作站、数字声音广播、音频测量与分析等内容。每章都附有小结与习题,以指导读者加深对本书主要内容的理解。本书可作为高
本教材结合语音信息处理的理论与实践部分,主要内容包括语音产生与感知机理、语音信号处理、语音识别、统计语音合成、语音增强、声纹识别、语音对话以及语音信息处理的前瞻技术等。全书共分8章。第1章介绍语音产生与感知机理,以及与此相关的语言基础知识,是全书的理论基础。第2章介绍语音信号处理的基础,包括语音产生与感知的数学模型、语
本书是一本深入探讨BBC监听音箱的专著。BBC在声学领域贡献卓著,其研发的监听音箱具有悠久的历史和广泛的影响力,对当今的声音美学理念和音响产品产生了深远影响。作者杨立新先生凭借多年对BBC设计理念的系统性研习、对BBC声学文献和监听音箱的深入研究,以及对原始设备的精心修复经验,为读者提供了全面而系统的BBC监听音箱知识
本书采用项目式的编写方法,系统地介绍了语音识别的基本概念、基本原理和常用技术,并使用Python语言对每项技术进行了编程实现。全书共有8个项目,内容涵盖搭建语音识别开发环境、语音特征提取、构建传统声学模型、使用深度神经网络构建声学模型、训练语言模型、构建语音识别解码器、构建端到端的语音识别模型和中文普通话语音识别。
本书介绍了语音信号处理的基础、原理、方法和应用,以及该学科领域近年来取得的一些新的研究成果和技术。全书共分13章,内容包括:绪论、语音信号处理的基础知识、语音信号处理的常用算法、语音信号分析、语音信号特征提取技术、语音增强、语音识别、说话人识别、语音编码、语音合成与转换、语音信号情感处理、声源定位、多模态语音信号处理。
本教材紧密结合《数字音效》课程设计,以声音概念为理论基础、人种志方法论为研究方法,结合Audition声音编辑软件,以保护声音文化遗产为目标,结合声音研究实践案例,最终实现把数字音效教材与交互媒体专业课程结合。该课程将理论课与实践作业相结合,以更直接的方式接触和理解声音、空间和材质,使学生能够运用这些知识进行个人创作。
本书系统介绍了声音信号处理的背景知识、发展历史以及研究现状与趋势,并详细阐述了基础原理、处理方法、实践应用、新成果与新技术。全书共9章。第1章绪论,第2章声音信号简介,第3章短时时域处理技术,第4章短时傅里叶变换,第5章声音信号的线性预测,第6章语音编码,第7章声音合成与转换,第8章语音识别,第9章基于深度学习技术的声
《视频师:深入学习视音频编辑(EDIUS实战版)》通过14个经典案例,深入介绍了EDIUSX的核心视频与音频编辑功能,随书赠送360多个案例素材与效果、170多分钟的同步教学视频,帮助读者逐步精通EDIUS软件,从新手成为短视频剪辑高手!14个视音频编辑案例,类型包括美景宣传、门店宣传、儿童相册、节日影像、旅行图集、延