Untitled Document

　　数据的压缩必然引起音频质量的降低，那么如何评价编/解码器的优劣呢？一般来讲有以下几个因素：音频质量、数据率、编/解码延时和算法复杂度。如果作为一个产品，显然还应考虑其性能价格比。
　　对于音频质量的评价分为客观评定的和主观评定。客观评定是通过测量某些特性来评价解码音频的质量。如测量信噪比、加权信噪比、平均分段信噪比等。这里测量的是信号方差与误差方差之比，其计算较为简单，但与人对音频的感知不完全一致。
　　得到广泛使用的是主观评测方法。如以主观意见打分（Mean Opinion Score - MOS）来度量。它分为5（优）、4（良）、3（中）、2（差）、1（劣）五级。若觉察不到编码失真，可评为5分。对于高质量语音，达到长途电话网的质量要求，可评为4.0～4.5分。当话音质量有所下降，但不足以妨碍正常通信，可评为3.5分。
　　对于语音来说，其质量是指可懂度、清晰度和自然度。目前已有"汉语清晰度诊断押韵字测试（DRT）法"国家标准（GB/T 13504-92）。标准中提供两张字表，各用108对押韵字。如"辅－补，数－主"。每一对为一测试项，两项为一组。听音人记录下所听的字。计算DRT清晰度的公式如下：
　　

　　其中 R 是正确回答数，W是错误回答数，T是总的测试项数。还可以计算区别特征得分，如计算某张记录表某个听音人某类特征的得分；某个听音人某类特征的平均得分；全体听音人得分的算术平均值。
　　被测系统的DRT清晰度得分等级如下：
　　DRT得分（%）音质评价
　　100 > A 3 95 优(excellent)
　　95 > A 3 85 良好(good)
　　85 > A 3 75 中等(fair)
　　75 > A 3 65 差(poor)
　　65 > A 不可接受(unacceptable)
　　数字音频的质量与采样频率(TS)和量化精度(每个样值的比特数)B有关.采样频率越高、B越大、数字音频的质量越高，但数据率（每秒比特数）越大。
　　数字音频可分为以下几个质量等级：

信号类型	频率范围（HZ）	采样率（KHZ）	量化精度（位）
电话话音	200～3400	8	8
宽带音频	50～7000	16	16
调频广播	20～15K	37.8以上	16
高质量音频	20～20K	44.1	16

　　从上表看出，未经压缩的音频数据率可达每秒几十千位或更高。我们期望通过编码，压缩音频数据。当前音频编码质量与数据率的关系、音频压缩的研究目标显示在图3.1中。
　　图3.1　语音质量与数据率的关系
　　

　　选择压缩算法时要进行综合考虑：算法复杂度高，致使计算量大、缓存增加，速度减慢，或许还会造成硬件成本提高。因此在保证质量的前提减小算法复杂度也是很必要的。
　　编码延时长，会影响通信质量。特别是在通信线路多次转接时，延时会造成回声。单次语音编码延时最好小于10ms。

　　数据的压缩必然引起音频质量的降低，评价编/解码器的优劣一般来讲有以下几个因素：音频质量、数据率、编/解码延时和算法复杂度。如果作为一个产品，显然还应考虑其性能价格比。
　　对于音频质量的评价，分为客观评定和主观评定。客观评定是通过测量某些特性来评价解码音频的质量。如测量信噪比、加权信噪比、平均分段信噪比等。这里测量的是信号方差与误差方差之比，其计算较为简单，但与人对音频的感知不完全一致。
　　对于语音来说，其质量是指可懂度、清晰度和自然度。
　　数字音频的质量与采样频率和量化精度有关。采样频率越高、量化精度越大，数字音频的质量越高，但数据率（每秒比特数）越大。
　　选择压缩算法时要进行综合考虑：算法复杂度高，致使计算量大、缓存增加，速度减慢，或许还会造成硬件成本提高。因此在保证质量的前提减小算法复杂度也是很必要的。
　　编码延时长，会影响通信质量。特别是在通信线路多次转接时，延时会造成回声。单次语音编码延时最好小于10ms。