本书系统地介绍了语音识别在大模型时代的新技术与新应用。全书共16章,原理部分涵盖声学特征、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)、语言模型和加权有限状态转换器(WFST)、语音大模型,重点描述了GMM-HMM、DNN-HMM和端到端(E2E)三种语音识别框架;应用部分包含Kaldi、W
"近年来人工智能技术突飞猛进,以语音识别为代表的音频处理技术取得了大量突破,但该领域内理论结合实战的入门书籍却较为缺乏,本书旨在为有志学习音频信号处理的读者提供一本实用的入门书籍。本书共13章,第1章和第2章是基础部分,包括声学基础知识及Python基础等内容;第3到4章介绍了音频信号的获取及分析方法;第5~8章介绍了
本书是一本Hi-Fi音响入门图书。本书从技术和艺术的角度,全面介绍了Hi-Fi音响的相关知识,旨在为音乐、音响爱好者提供入门指导,帮助读者提高音乐欣赏水平和音响设备的使用技能。本书包括电声基础、音响释疑、音乐与欣赏3个部分。在电声基础部分,作者介绍了音响发烧的误区,如片面追求技术指标、忽视听音环境等,强调了正确认识和欣
本书的撰写主要分为四个章节:第一章数字音频艺术的基本艺术体系;第二章数字音频艺术教育;第三章广播剧与影视动漫声音研究;第四章数字音频的文化产业分析。主要内容:1、理清数字音频创意产业发展的脉络,建立数字音频创意发展编年史。2、形成数字音频创意教育引导机制的研究报告,提出音频创意产业发展的咨询报告。3、综合性分析音频创意
本书系统地阐述语音信号处理的原理、方法、技术和应用,同时给出部分内容对应的MATLAB程序。全书共14章,第1~7章是基本理论部分,包括绪论、语音信号的数字模型、语音信号短时时域分析、语音信号短时频域分析、语音信号倒谱分析、语音信号线性预测分析和矢量量化;第8~14章是应用部分,包括语音编码原理及应用、语音识别原理及应
全书共分11章,主要介绍了声学基础知识、音频信号的数字化、数字音频压缩编码的基本原理及相关标准、信道编码与调制技术、光盘存储技术、电子乐器数字接口(MIDI)、数字音频文件格式、音频处理与控制设备、数字音频工作站、数字声音广播、音频测量与分析等内容。每章都附有小结与习题,以指导读者加深对本书主要内容的理解。本书可作为高
本教材结合语音信息处理的理论与实践部分,主要内容包括语音产生与感知机理、语音信号处理、语音识别、统计语音合成、语音增强、声纹识别、语音对话以及语音信息处理的前瞻技术等。全书共分8章。第1章介绍语音产生与感知机理,以及与此相关的语言基础知识,是全书的理论基础。第2章介绍语音信号处理的基础,包括语音产生与感知的数学模型、语
本书是一本深入探讨BBC监听音箱的专著。BBC在声学领域贡献卓著,其研发的监听音箱具有悠久的历史和广泛的影响力,对当今的声音美学理念和音响产品产生了深远影响。作者杨立新先生凭借多年对BBC设计理念的系统性研习、对BBC声学文献和监听音箱的深入研究,以及对原始设备的精心修复经验,为读者提供了全面而系统的BBC监听音箱知识
本教材是以笔者2003年编写并由中国广播电视出版社出版发行的《录音技术》的基础上重新编写的,该书一直是我校录音艺术专业的专业课指定教材。次年该教材被广播电影电视总局评为优秀科技类(著作类)成果二等奖,并多次再版,受到广大读者的褒奖。 由于声频技术的发展势头十分迅猛,从拾音、控制及处理、重放,信源和信道编码及传输方面都发
本书从人类听觉、视觉的处理机制出发,系统地介绍了听觉和视觉感知模型、音视频(图像)压缩编码技术、音视频(图像)处理技术、基于内容的音视频(图像)检索技术、数字音视频技术的交叉应用等内容。同时,本书还给出了相关知识的应用实例,这写实例都具有较高的参考和实用价值。本书涵盖的学科领域十分广泛,包括人工智能、信号处理、图像处理