增强型语音通话服务(EVS)编解码器

博亿娱乐42188点com

2018-10-13

正如参考【8】中所述,AMR-NB和AMR-WB等高效的语音编码体系通常拥有三大主要组成部分,包括:(1)模拟人类声道的短期线性预测(LP);(2)模拟声带激励信号周期的长期预测(LTP)滤波器;及(3)用于对语音信号非预测性内容进行编码的创新型代码本。 AAC【9】等感知编码体系主要基于以下三大步骤:(1)进行时间/频率转换;(2)通过后续量化阶段减少不相关性,在这一阶段可使用心理声学模型信息来控制量化误差;(3)减少冗余,即在编码阶段,通过熵编码的方式使用代码表处理量化频谱系数和相关边信息。 这就形成了适应于输入信号数据及人类感知特点的受源代码控制的编解码器。

一般来说,在低比特率情况下,语音编码方式可更好地处理纯粹、清晰的语音信号,而感知编码方式可更好地处理音乐等一般声音内容,并实现可感知的、明晰的声音质量。 首个结合了这两大编码方式的编解码器为语音/音频统合编解码器(USAC)【8】。

USAC算法延迟超过了100毫秒,这是双向通信应用不可接受的。 然而,得益于USAC卓越的编码性能,这一统合的编码方法已经被采用并且取得了进一步的优化,以满足EVS极具挑战性的要求。 低延迟语音/音频切换编码在32毫秒低算法延迟下,EVS编解码器是首个在语音和音频压缩之间部署基于内容且具备即时切换功能的移动通信编解码器,极大地改善了针对音乐信号等一般内容的编码性能。 该语音编码器是改进型代数码激励线性预测(ACELP),还采用了适合不同语音类别的线性预测模式。

对于音频信号编码,则采用频域(MDCT)编码方式,并特别关注低延迟/低比特率情况下的频域编码效率,从而在语音处理器和音频处理器之间实现无缝可靠的切换。

图2展示了EVS编码器和解码器的高级框图。 图2:EVS编解码器结构超宽带编码及更先进的技术EVS可支持超宽带甚至全频带服务,从而克服当前通话中声音不清晰的问题。

从技术上来看,EVS可通过扩展带宽实现这一目标。 根据是否采用语音或音频模式,可部署时域带宽扩展(TBE)技术或一体化频域解决方案。

后者可提供多个子模式,如可处理传统音乐信号的谐波模型编码模式等。

EVS是首个可提供通过不同方式优化的带宽扩展方式的编解码器,而这样的带宽扩展方式通常基于源代码控制来进行使用或切换。 基于专用的内容优化方式,即便在比特率非常低的情况下也能够提供非常自然、清晰的音质。

性能评估图3:3GPPEVS编解码器针对多带宽清晰语音的鉴定测试结果图4:3GPPEVS编解码器针对多带宽混合内容和音乐信号的鉴定测试结果目前,3GPP已进行了大量测试来验证EVS在不同情况下以及处理不同内容【11】时所表现出的性能,其中包括根据方法【12】进行的多频带测试。

图3和图4分别显示了(DOMS评分表)中清晰语音(英语)及混合内容和音乐信号的音质级别。 结果显示了在不同比特率下移动蜂窝业务常用的窄带、宽带和超宽带下的不同音质。 下面将对这些结果进行讨论:对于(超宽带模式下运行的)EVS编解码器,比特率为/s时纯语音音质评价值已非常高,大大超过了AMR-WB在/s比特率下的音质,同时这一数值将随比特率的增加而增加。 从/s开始,EVS-SWB的语音音质已经接近直接来源(原音)的音质。 (在超宽带模式下运行的)EVS编解码器在处理混合内容和音乐信号时的性能大大优于AMR-WB编解码器。

在相同比特率下,其得分基本都比AMR-WB编解码器高出个平均意见得分(MOS)。

在比特率为/s的情况下,EVS编解码器在处理混合内容和音乐信号时所呈现的音质可接近直接来源(原音)的音质。

甚至在宽带模式(当前仅支持宽带模式的设备或服务)下,EVS编解码器在比特率为/s时所能呈现的音质超过了AMR-WB编解码器在比特率为/s时所能实现的音质。 此外,在同一比特率(/s)下,EVS编解码器在处理纯语音以及音乐信号时所呈现的音质要远远好于AMR-WB编解码器。

初看上去,在同等比特率下,即便使用双倍音频带宽,AMR-WB编解码器在处理混合内容和音乐信号时呈现的音质也比不上AMR-NB编解码器,这让人觉得出乎意料。 但EVS编解码器已经解决了这一问题。

在处理窄带输入信号时,EVS编解码器处理纯语音及混合内容和音乐信号时实现的音质要优于AMR-NB编解码器。

这一模式在连接至如固话网络等窄带网络时非常有用。 众所周知,由于语言和所选内容的不同,测试的结果及结果分析也各有不同。 然而,在3GPP进行筛选的阶段,EVS编解码器已经过10种语言、6种不同背景噪音及各种音乐内容的测试,展现出了其卓越的性能并大大改善了早期标准。 这些测试结果以及之后对EVS编解码器进行的进一步性能鉴定结果已在3GPP发布的技术报告(TR)【11】中公布。

应用自第四代移动网络标准问世以来,蜂窝络开始向基于IP的传输方式转变。 LTE标准以发展成熟的和标准为基础,可提供全IP架构和实现低延迟。

LTE需要部署全IP语音业务或VoLTE业务,而这也可促使所有语音服务采用IP网络进行传输,最终淘汰基于GSM、UMTS和等网络的传统转换服务。 在全高清语音技术的推动下,服务提供商可摆脱这些传统服务的限制,包括音频带宽方面的较大限制及需要使用以处理语音信号为主的编解码器等。

由于VoLTE可在管理有序的网络中提供优质服务(),EVS有望在音质、稳定性和服务可用性方面超越Skype或Viber等OTT服务。 因此,移动运营商将可能在语音服务领域收复失地。 得益于杰出的防错能力【10】,EVS非常适用于语音等最佳网络,而且未来还可用于/系统。

结语凭借无法比拟的语音和音频质量等多项新特性,符合3GPP最新标准的EVS编解码器可作为一种效率最高、功能最全的编解码器适用于各种网络(尤其是蜂窝LTE网络和Wi-Fi语音网络等),以实现高质量通信。 即便在移动通信服务中,EVS编解码器也能呈现接近原音的音质,从而为用户带来全新的体验。 因此,即将推出的EVS编解码器可为移动通信运营商及其客户带来长远的好处。

参考资料[1]-,语音频率的脉冲编码调制[2],64kbit/s内的7kHz音频编码[3]自适应多速率编解码器的标准化,,2000年9月[4]等,自适应多速率带宽语音编解码器(AMR-WB),电气与电子工程师协会()语音和音频处理译文,第10卷,第8号,第620-636页,2002年11月[5]等,-4增强型低延迟ACC高音质通信新标准,第125届音频工程师协会大会,2008年10月[6]等,新EVS编解码器标准化,,2015年4月[7]MartinDietz等,EVS编解码器架构概述,,2015年4月[8]等,低比特率下高音质语音/音频统合编码方案,,2009年4月[9]等,/IECMPEG-2增强型音频编码,第4382号论文,第101届音频工程师协会大会,1996年11月[10]等,3GPPEVS渠道感知编码可改善VOLTE及的容错性,,2015年4月[11],通用移动通信系统(UMTS);LTE;EVS编解码器;性能鉴定,http:///DynaReport/[12],传输质量主观验证方法,1996年8月本文档的内容按原样提供,不带有任何明示或暗示的担保或条件,包括但不限于适销性、针对特定用途的默认担保等。

本文档内容的版权归Fraunhofer-Gesellschaft所有,并可在不另行通知的情况下随时进行修改和/或更新。

因此,不允许转售本文全部或部分内容或将其用于商业用途,或将其用于其他产品。