本书以语音情感为研究对象,以提高语音情感识别率为研究目标,针对在移动应用中语音的噪声干扰问题、语音情感特征的相互干扰和冗余性问题、跨语种语音情感特征与情感识别网络的局限性问题,分别提出将语音降噪与特征降维相结合、情感特征降维优化、跨语种多模型融合框架等方法来提高计算机对语音情感的识别性能。
胡国华,男,1975年11月生,山西省五台县人,忻州师范学院计算机系副主任,硕士,副教授。近5年来,主持教育部产学合作协同育人项目3项,全国高等院校计算机基础教育研究会计算机基础教育教学研究项目1项,山西省高等学校教学改革创新项目1项,山西省艺术科学规划课题1项,忻州市科技计划项目1项,忻州师范学院教学改革创新项目1项;指导山西省高等学校大学生创新创业训练项目2项;发表学术论文10余篇,其中El收录4篇;荣获忻州师范学院优秀共产党员、优秀辅导员、师德师风先进个人等称号。
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本书主要工作
1.4 本书内容组织结构
1.5 本章小结
第2章 语音情感识别的基本理论
2.1 语音的产生
2.2 情感描述模型
2.3 语音情感数据库
2.4 语音情感识别系统组成
2.5 语音信号的预处理
2.6 语音情感特征提取
2.7 特征降维方法
2.8 语音情感识别网络
2.9 本章小结
第3章 深度学习相关知识
3.1 深度学习的发展历程
3.2 深度学习的基本理论
3.3 深度学习的常用神经网络
3.4 本章小结
第4章 基于Chebyshev-PCA 优化的移动应用语音情感识别
4.1 语音信号和噪声信号的特征
4.2 传统语音去噪方法概述
4.3 切比雪夫低通滤波器设计方法
4.4 主成分分析
4.5 Chebyshev-PCA优化
4.6 实验与分析
4.7 本章小结
第5章 基于PCA-GRA分析法的情感特征优化
5.1 语音信号的特征分析
5.2 灰色关联分析
5.3 PCA-GRA特征优化
5.4 实验与分析
5.5 本章小结
第6章 基于多输入的跨语种语音情感识别的多模型融合框架
6.1 MobileNet
6.2 ResNet
6.3 语音情感识别的多模型融合框架
6.4 实验与分析
6.5 本章小结
第7章 总结与展望
7.1 本书工作总结
7.2 研究展望
参考文献