21世纪全国应用型本科计算机系列实用规划教材:多媒体技术及其应用(第2版)
定 价:39 元
丛书名:21世纪全国应用型本科计算机系列实用规划教材
- 作者:张明 编
- 出版时间:2013/1/1
- ISBN:9787301217528
- 出 版 社:北京大学出版社
- 中图法分类:TP37
- 页码:313
- 纸张:胶版纸
- 版次:2
- 开本:16开
多媒体技术是集文字、图形、图像、动画、音频、视频于一体的信息处理技术。它综合了当代计算机硬件和软件的最新成果,是计算机技术的重要发展方向。《21世纪全国应用型本科计算机系列实用规划教材:多媒体技术及其应用(第2版)》较系统地介绍了多媒体计算机的基本原理、处理技术和具体应用。
全书共10章,分别介绍了多媒体技术的基本概念、音频信号处理技术、数字图像与视频处理技术、多媒体数据压缩技术、计算机动画技术、多媒体信息的组织与管理、多媒体数据存储技术、虚拟现实技术、多媒体通信技术和多媒体技术实验。本书对多媒体技术的主要研究内容、开发设计方法和应用实例做了系统的阐述,并配有教案演示文稿、实验指导和相应的实验素材。
在《21世纪全国应用型本科计算机系列实用规划教材:多媒体技术及其应用(第2版)》的编写过程中,力求做到深入浅出,可读易懂。在内容的选取上,遵循多媒体计算机技术原理与多媒体技术应用相结合的原则,全面系统地介绍多媒体计算机原理与多媒体技术应用;既注重理论、方法和标准的介绍,又兼顾实际系统分析、具体技术讨论和实际应用举例。
《21世纪全国应用型本科计算机系列实用规划教材:多媒体技术及其应用(第2版)》可作为“多媒体技术原理与应用”或“多媒体应用技术”等相关课程的教科书,也可作为科学技术人员、计算机爱好者以及从事计算机行业的工程技术人员的参考用书。
《21世纪全国应用型本科计算机系列实用规划教材:多媒体技术及其应用(第2版)》根据教学实践,着眼于培养学生的创新实践能力。融人一线教师多年的教学经验与科研成果,帮助学生全面提高应用技术。在普及科技知识的同时,将人文知识融入理论讲解,提高学生的综合素质。配套的教学课件、源代码、素材和习题答案等教学资源,全面方便教与学。
第1章 多媒体技术概述
1.1 多媒体技术基本概念
1.1.1 数据、信息与媒体
1.1.2 多媒体与多媒体技术
1.1.3 多媒体技术的特点
1.2 多媒体技术的发展
1.3 多媒体系统的构成
1.3.1 基本组成
1.3.2 多媒体系统的硬件结构
1.3.3 多媒体系统的软件结构
1.3.4 工作站环境的多媒体体系结构
1.4 多媒体系统中的若干技术
1.5 感知媒体的基本特性
1.5.1 文本
1.5.2 音频
1.5.3 图像
1.5.4 图形
1.5.5 动画
1.5.6 视频
1.6 多媒体技术的应用与发展趋势
1.6.1 多媒体技术的应用概况
1.6.2 多媒体技术的发展趋势
1.7 小结
1.8 习题
第2章 音频信号处理技术
2.1 声音的特性、类型与处理
2.1.1 声音的特性
2.1.2 声音的类型与处理
2.2 声卡的构成与功能
2.2.1 声卡的组成
2.2.2 声卡的主要功能
2.2.3 声卡的性能指标
2.3 波形声音的数字化
2.3.1 采样
2.3.2 量化
2.3.3 编码
2.3.4 声音的重构
2.4 声音文件的存储格式
2.5 MIDI音乐
2.5.1 MIDI简介
2.5.2 MIDI相关的术语
2.5.3 MIDI音乐合成方法
2.5.4 电子乐器数字接口(MIDI)系统
2.6 音频信息的压缩技术
2.7 数字语音的应用
2.7.1 语音识别
2.7.2 语音合成
2.8 声音媒体编辑软件的应用
2.8.1 Windows的录音机软件
2.8.2 声音编辑软件Cool Edit
2.9 小结
2.10 习题
第3章 数字图像与视频处理技术
3.1 概述
3.2 数字图像数据的获取与表示
3.2.1 数字图像数据的获取
3.2.2 数字图像的表示
3.3 图像的基本属性
3.3.1 分辨率
3.3.2 像素深度
3.3.3 颜色空间
3.3.4 真彩色、伪彩色与直接色
3.3.5 常用图像文件的格式
3.4 图像处理软件Photoshop应用举例
3.4.1 图像处理软件Photoshop简介
3.4.2 Photoshop的运行界面
3.4.3 Photoshop的图层与滤镜
3.4.4 Photoshop应用举例
3.5 视频的基本知识
3.5.1 视频信号的特性
3.5.2 彩色电视制式
3.6 视频的数字化
3.6.1 视频信息的获取
3.6.2 视频信息的数字化
3.6.3 视频信号的采样格式
3.7 数字视频标准
3.8 视频信息的压缩编码
3.8.1 概述
3.8.2 常用的图像压缩方案
3.9 Windows中的视频编辑软件
3.9.1 Windows Movie Maker的运行
3.9.2 获得要编辑的视频
3.9.3 编辑视频
3.9.4 使用视频过渡、视频效果、片头/片尾
3.9.5 为视频剪辑添加背景音乐
3.9.6 保存和发送电影
3.10 数字视频的应用
3.11 小结
3.12 习题
第4章 多媒体数据压缩技术
4.1 数据压缩的基本原理和方法
4.1.1 数据压缩概述
4.1.2 数据压缩的基本原理
4..3 常用的数据压缩方法
4.2 静态图像的压缩标准
4.2.1 JPEG标准简介
4.2.2 JPEG标准中的主要技术
4.2.3 JPEG标准对静态图像的压缩过程
4.2.4 JPEG 2000
4.3 运动图像压缩标准
4.3.1 MPEG系列标准
4.3.2 MPEG-1标准中的主要技术及压缩过程
4.3.3 MPEG-2标准对MPEG-1的改进
4.3.4 MPEG-4标准中的新技术
4.3.5 多媒体内容描述接口标准MPEG-7
4.4 ITU-T H.26x 视听通信编码解码标准
4.4.1 H.26x标准简介
4.4.2 H.261标准中的主要技术
4.5 小结
4.6 习题
第5章 多媒体计算机动画技术
5.1 计算机动画
5.2 计算机动画的应用
5.3 计算机动画的分类
5.4 计算机动画的生成
5.4.1 二维动画
5.4.2 三维动画
5.4.3 三维动画制作软件3dS Max
5.5 计算机动画运动控制方法
5.6 动画语言、动画传输与发展趋势
5.6.1 动画语言简介
5.6.2 动画的传输
5.6.3 计算机动画的发展趋势
5.7 FlashProfessional动画制作
5.7.1 Flash Professional的启动与用户界面
5.7.2 利用工具箱中的工具画图
5.7.3 简单动画的制作
5.8 小结
5.9 习题
第6章 多媒体信息的组织与管理
6.1 多媒体数据与数据管理
6.1.1 多媒体数据的特点
6.1.2 多媒体数据的管理技术
6.2 超文本与超媒体
6.2.1 超文本与超媒体的概念
……
第7章 多媒体数据存储技术
第8章 虚拟现实技术
第9章 多媒体通信
第10章 多媒体技术实验
参考文献
在这一技术中,通过补偿语音速率变化来完成识别,而补偿语音速率变化又是通过前面所述的称为动态时间变形的过程,以及把调整了的连接词短语表示成沿时间轴滑过所存储的单词模板以找到可能的匹配这样一个过程来实现的。如果在给定时间内,任何相似性显示出已经在说出的短语和模板中找到了相同的词,识别器就定位出模板中的关键词。将动态时间变形技术用于连接词短语上来消除或减少由于讲话者个人或其他影响语音的因素,如因兴奋而造成的讲出单词速率的变化。不同情况下,可以用不同的重音和速度说出同一短语。如果我们在每次用不同的重音说出短语时,都抽取所说短语的瞬时写照,并在时间域中生成帧,我们会很快发现每一获取帧是如何相对其他帧而变化的。这就提供了表示所说短语中可能变化的时间变化参数范围。当把动态时间变形技术用于连接词语音识别时,就可以用数学上的压缩或扩展帧去除可能的时间变化,然后把帧与存储模板相比较来进行识别。
为什么连接词语音识别是有用的?这是一种命令识别的高级形式,其中命令是短语而不是单一的词。例如,连接词语音识别可以用于执行操作的应用中。如短语“给总部打电话”,会引起查询总部电话并拨号。类似于孤立词语音识别,连接词语音识别可用于命令和控制应用之中。
3)连续语音识别
这种方法比孤立单词或连接词语音识别都复杂许多。它提出了两个主要问题:分割和标志过程,在此过程中把语音段标记成代表音素、半音节、音节和单词等更小的单元,以及为跟上输入语音并实时地识别词序列所需要的计算能力。用现行的数字信号处理器,可以通过选择正确的CPU体系结构来获得实时连续语音识别需要的计算能力。连续语音识别系统可以分以下3部分。
(1)数字化、幅度归一化、时间归一化和参数表示。
(2)分割并把语音段标记成在基于知识或基于规则系统上的符号串。用于表征语言段特征的知识类型是:语音学,它描述了语音声音(英语中只有41个音素);词汇学,它描述了声音类型;语法,它描述了语言的语法结构;语义学,它描述了词和句子语义;语用学,它描述了句子的上下文。多数连续语音识别系统是使用基于语音学的、词汇学的、语法的知识系统。
(3)识别词序列并进行语音段匹配。在连续语音识别系统中,语音信号的前端处理与孤立单词语音识别系统中的一样。它把模拟信号转换成数字信号,进行幅度和噪声归一化以使由于周围噪声、讲话者的声音、讲话者相对于麦克风的距离和位置、讲话者的呼吸噪声等引起的语音变化最小化。下一步由参数分析组成,它是一个抽取时间变化的语音参数,如共振峰、辅音、线性可预测编码系数等的预处理阶段。这一步骤有两个目的:首先,它抽取了与下一步相关的时间变化语音参数;其次,它通过抽取相关语音参数而减少了数据量。
下一步完成把语音分割为10ms的段并标记这些段。如何标记语音段?孤立词语音识别器使用了把未知发音与已知的参考模式相比较的技术。如果未知发音与已知参考模式之一相类似,那么就找到了一个匹配并识别出了发音。对于连续语音识别,例如,100个词的词汇表会需要超过1000个参考模式。这就要求更大的存储和更快的计算引擎在模式中搜索并完成把模式输入到系统中的处理。如果实时地完成上述处理,这将会是一个很高的要求。为解决这一问题,要把语音分割成更小的符号单元段,它们表示语音、音素、半音节、音节和单词。分割过程生成了10ms的“快照”,并把语音的时间变化表示转换成符号表示。
再下一步是对语音段作标记,其中使用了由语音、词汇语法和语义知识组成的知识系统。
……