在多媒体系统中,音频信号可分为两类:语音信号和非语音信号。非语音信号又可分为乐音和杂音。非语音信号的特点是不具有=复杂的语意和语法信息,信息量低、识别简单。语音是语言的物质外壳(载体)。语言是人类社会特有的一种信息系统, 社会交际工具的符号。
  音频信号处理的特点如下:
  (1)音频信号是时间依赖的连续媒体。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟,人就会感到断续。
  (2)由于人接收声音有两个通道(左耳、右耳),因此为使计算机模拟自然声音,也应有两个声道,即理想的合成声音应是立体声。
  (3)由于语音信号不仅仅是声音的载体,同时还携带了情感的意向,故对语音信号的处理,不仅是信号处理问题,还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学……等。
  从人与计算机交互的角度来看音频信号相应的处理如下:
  (1)人与计算机通信(计算机接收音频信号):
  音频获取;语音识别与理解;
  (2)计算机与人通信(计算机输出音频)
  音频合成:包括音乐合成和语音合成;
  声音定位:包括立体声模拟;音频/视频同步;目的是让计算机产生真实感声音。
  (3)人-计算机-人通信:
  人通过网络,与处于异地的人进行语音通信,需要的音频处理包括:
  语音采集、音频编码/解码、音频传输等。这里音频编/解码技术是信道利用率的关键。
  通过本小节的学习,同学应该掌握和了解下面的问题:
  1.在多媒体系统中,音频信号可分为哪两类?它们有什么区别?
  在多媒体系统中,音频信号可分为两类:语音信号和非语音信号。
  语音是语言的物质外壳(载体)。语言是人类社会特有的一种信息系统, 社会交际工具的符号。
  非语音信号又可分为乐音和杂音。
  非语音信号的特点是不具有复杂的语意和语法信息,信息量低、识别简单。
  2.音频信号处理的特点如下:
  (1)音频信号是时间依赖的连续媒体。因此音频处理的时序性要求很高。如果在时间上有25ms 的延迟,人就会感到断续。
  (2)由于人接收声音有两个通道(左耳、右耳),因此为使计算机模拟自然声音,也应有两个声道,即理想的合成声音应是立体声。
  (3)由于语音信号不仅仅是声音的载体,同时还携带了情感的意向,故对语音信号的处理,不仅是信号处理问题,还要抽取语意等其它信息。因此可能会涉及到语言学、社会学、声学……等。
  3. 从人与计算机交互的角度来看音频信号相应的处理如下:
  (1)人与计算机通信(计算机接收音频信号):
  音频获取;语音识别与理解;
  (2)计算机与人通信(计算机输出音频)
  音频合成:包括音乐合成和语音合成;
  声音定位:包括立体声模拟;音频/视频同步;目的是让计算机产生真实感声音。
  (3)人-计算机-人通信:
  人通过网络,与处于异地的人进行语音通信,需要的音频处理包括:
  语音采集、音频编码/解码、音频传输等。这里音频编/解码技术是信道利用率的关键。