科技日报北京6月26日电(记者 都芃)26日,记者从腾讯获悉,其主导的新一代实时语音编码行业标准AVS3P10已进入公示阶段,即将正式发布。
该标准由腾讯提议启动、推进和维护,以腾讯首款神经网络语音编解码器Penguins为原型,由数字音视频编解码技术标准(AVS)音频组多家成员单位共同参与编制。
作为全球首个系统性引入人工智能并真正实现低码率下高质量语音编码的标准,其仅需现有主流标准1/3的编码码率,便可获得同等清晰度音质。这意味着,今后线上会议、语音通话等实时音频场景,对带宽要求大幅降低,即使在电梯、地库、隧道等较差网络环境中,也能够实现清晰流畅的语音通话。
Penguins将AI与传统技术紧密融合,从算法研究、工程化、产品化层面开展大量系统性创新,打破传统香农定律性能极限,引入大数据并在可控算力增量下提供了新的性能上界,从而对下一代通信系统,尤其是信源编码器部分,提供了新的技术基础和方法论。
多方测试表明,AVS3P10标准代表了目前行业最高水平,实现了6kbps(千比特每秒)下的高质量语音通信,即使在2G网络下也能实现清晰通话。AVS工作组指出,AVS3P10作为新一代语音编解码技术标准,是对AVS系列标准的重要补充。
在编解码、音频降噪、语音增强等领域,腾讯会议天籁实验室正在探索实时音频通信前沿技术,打造全球领先的实时音频通信端到端解决方案,为用户带来“听得清、听得真”的极致体验。