在多媒体系统中,音频信号可分为两类:语音信号和非语音信号。非语音信号又可分为乐音和杂音。非语音信号的特点是不具有=复杂的语意和语法信息,信息量低、识别简单。语音是语言的物质外壳(载体)。语言是人类社会特有的一种信息系统,
社会交际工具的符号。 音频信号处理的特点如下: (1)音频信号是时间依赖的连续媒体。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟,人就会感到断续。 (2)由于人接收声音有两个通道(左耳、右耳),因此为使计算机模拟自然声音,也应有两个声道,即理想的合成声音应是立体声。 (3)由于语音信号不仅仅是声音的载体,同时还携带了情感的意向,故对语音信号的处理,不仅是信号处理问题,还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学……等。 从人与计算机交互的角度来看音频信号相应的处理如下: (1)人与计算机通信(计算机接收音频信号): 音频获取;语音识别与理解; (2)计算机与人通信(计算机输出音频) 音频合成:包括音乐合成和语音合成; 声音定位:包括立体声模拟;音频/视频同步;目的是让计算机产生真实感声音。 (3)人-计算机-人通信: 人通过网络,与处于异地的人进行语音通信,需要的音频处理包括: 语音采集、音频编码/解码、音频传输等。这里音频编/解码技术是信道利用率的关键。 通过本小节的学习,同学应该掌握和了解下面的问题: 1.在多媒体系统中,音频信号可分为哪两类?它们有什么区别? 在多媒体系统中,音频信号可分为两类:语音信号和非语音信号。 语音是语言的物质外壳(载体)。语言是人类社会特有的一种信息系统, 社会交际工具的符号。 非语音信号又可分为乐音和杂音。 非语音信号的特点是不具有复杂的语意和语法信息,信息量低、识别简单。 2.音频信号处理的特点如下: (1)音频信号是时间依赖的连续媒体。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟,人就会感到断续。 (2)由于人接收声音有两个通道(左耳、右耳),因此为使计算机模拟自然声音,也应有两个声道,即理想的合成声音应是立体声。 (3)由于语音信号不仅仅是声音的载体,同时还携带了情感的意向,故对语音信号的处理,不仅是信号处理问题,还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学……等。 3. 从人与计算机交互的角度来看音频信号相应的处理如下: (1)人与计算机通信(计算机接收音频信号): 音频获取;语音识别与理解; (2)计算机与人通信(计算机输出音频) 音频合成:包括音乐合成和语音合成; 声音定位:包括立体声模拟;音频/视频同步;目的是让计算机产生真实感声音。 (3)人-计算机-人通信: 人通过网络,与处于异地的人进行语音通信,需要的音频处理包括: 语音采集、音频编码/解码、音频传输等。这里音频编/解码技术是信道利用率的关键。 |