Untitled Document

　　在多媒体系统中，音频信号可分为两类：语音信号和非语音信号。非语音信号又可分为乐音和杂音。非语音信号的特点是不具有=复杂的语意和语法信息，信息量低、识别简单。语音是语言的物质外壳（载体）。语言是人类社会特有的一种信息系统，社会交际工具的符号。
　　音频信号处理的特点如下：
　　（1）音频信号是时间依赖的连续媒体。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟，人就会感到断续。
　　（2）由于人接收声音有两个通道（左耳、右耳），因此为使计算机模拟自然声音，也应有两个声道，即理想的合成声音应是立体声。
　　（3）由于语音信号不仅仅是声音的载体，同时还携带了情感的意向，故对语音信号的处理，不仅是信号处理问题，还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学……等。
　　从人与计算机交互的角度来看音频信号相应的处理如下：
　　（1）人与计算机通信（计算机接收音频信号）：
　　音频获取；语音识别与理解；
　　（2）计算机与人通信（计算机输出音频）
　　音频合成：包括音乐合成和语音合成；
　　声音定位：包括立体声模拟；音频/视频同步；目的是让计算机产生真实感声音。
　　（3）人-计算机-人通信：
　　人通过网络，与处于异地的人进行语音通信，需要的音频处理包括：
　　语音采集、音频编码/解码、音频传输等。这里音频编/解码技术是信道利用率的关键。
　　通过本小节的学习，同学应该掌握和了解下面的问题：
　　1.在多媒体系统中，音频信号可分为哪两类？它们有什么区别？
　　在多媒体系统中，音频信号可分为两类：语音信号和非语音信号。
　　语音是语言的物质外壳（载体）。语言是人类社会特有的一种信息系统，社会交际工具的符号。
　　非语音信号又可分为乐音和杂音。
　　非语音信号的特点是不具有复杂的语意和语法信息，信息量低、识别简单。
　　2.音频信号处理的特点如下：
　　（1）音频信号是时间依赖的连续媒体。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟，人就会感到断续。
　　（2）由于人接收声音有两个通道（左耳、右耳），因此为使计算机模拟自然声音，也应有两个声道，即理想的合成声音应是立体声。
　　（3）由于语音信号不仅仅是声音的载体，同时还携带了情感的意向，故对语音信号的处理，不仅是信号处理问题，还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学……等。
　　3. 从人与计算机交互的角度来看音频信号相应的处理如下：
　　（1）人与计算机通信（计算机接收音频信号）：
　　音频获取；语音识别与理解；
　　（2）计算机与人通信（计算机输出音频）
　　音频合成：包括音乐合成和语音合成；
　　声音定位：包括立体声模拟；音频/视频同步；目的是让计算机产生真实感声音。
　　（3）人-计算机-人通信：
　　人通过网络，与处于异地的人进行语音通信，需要的音频处理包括：
　　语音采集、音频编码/解码、音频传输等。这里音频编/解码技术是信道利用率的关键。