数据的压缩必然引起音频质量的降低,那么如何评价编/解码器的优劣呢?一般来讲有以下几个因素:音频质量、数据率、
编/解码延时和算法复杂度。如果作为一个产品,显然还应考虑其性能价格比。 对于音频质量的评价分为客观评定的和主观评定。客观评定是通过测量某些特性来评价解码音频的质量。如测量信噪比、加权信噪比、平均分段信噪比等。这里测量的是信号方差与误差方差之比,其计算较为简单,但与人对音频的感知不完全一致。 得到广泛使用的是主观评测方法。如以主观意见打分(Mean Opinion Score - MOS)来度量。它分为5(优)、4(良)、3(中)、2(差)、1(劣)五级。若觉察不到编码失真,可评为5分。对于高质量语音,达到长途电话网的质量要求,可评为4.0~4.5分。当话音质量有所下降,但不足以妨碍正常通信,可评为3.5分。 对于语音来说,其质量是指可懂度、清晰度和自然度。目前已有"汉语清晰度诊断押韵字测试(DRT)法"国家标准(GB/T 13504-92)。标准中提供两张字表,各用108对押韵字。如"辅-补,数-主"。每一对为一测试项,两项为一组。听音人记录下所听的字。计算DRT清晰度的公式如下: ![]() 其中 R 是正确回答数,W是错误回答数,T是总的测试项数。还可以计算区别特征得分,如计算某张记录表某个听音人某类特征的得分;某个听音人某类特征的平均得分;全体听音人得分的算术平均值。 被测系统的DRT清晰度得分等级如下: DRT得分(%) 音质评价 100 > A 3 95 优(excellent) 95 > A 3 85 良好(good) 85 > A 3 75 中等(fair) 75 > A 3 65 差(poor) 65 > A 不可接受(unacceptable) 数字音频的质量与采样频率(TS)和量化精度(每个样值的比特数)B有关.采样频率越高、B越大、数字音频的质量越高,但数据率(每秒比特数)越大。 数字音频可分为以下几个质量等级:
从上表看出,未经压缩的音频数据率可达每秒几十千位或更高。我们期望通过编码,压缩音频数据。当前音频编码质量与数据率的关系、音频压缩的研究目标显示在图3.1中。 图3.1 语音质量与数据率的关系 ![]() 选择压缩算法时要进行综合考虑:算法复杂度高,致使计算量大、缓存增加,速度减慢,或许还会造成硬件成本提高。因此在保证质量的前提减小算法复杂度也是很必要的。 编码延时长,会影响通信质量。特别是在通信线路多次转接时,延时会造成回声。单次语音编码延时最好小于10ms。 数据的压缩必然引起音频质量的降低,评价编/解码器的优劣一般来讲有以下几个因素:音频质量、数据率、编/解码延时和算法复杂度。如果作为一个产品,显然还应考虑其性能价格比。 对于音频质量的评价,分为客观评定和主观评定。客观评定是通过测量某些特性来评价解码音频的质量。如测量信噪比、加权信噪比、平均分段信噪比等。这里测量的是信号方差与误差方差之比,其计算较为简单,但与人对音频的感知不完全一致。 对于语音来说,其质量是指可懂度、清晰度和自然度。 数字音频的质量与采样频率和量化精度有关。采样频率越高、量化精度越大,数字音频的质量越高,但数据率(每秒比特数)越大。 选择压缩算法时要进行综合考虑:算法复杂度高,致使计算量大、缓存增加,速度减慢,或许还会造成硬件成本提高。因此在保证质量的前提减小算法复杂度也是很必要的。 编码延时长,会影响通信质量。特别是在通信线路多次转接时,延时会造成回声。单次语音编码延时最好小于10ms。 |