音视频应用新突破!腾讯AI技术赋能,带你探索智能交互新世界!

发布时间:2024-09-18

Image

腾讯在音视频AI技术领域取得重大突破,其主导的AVS3P10实时语音编码标准即将正式发布。这一标准代表了当前AI Codec(人工智能编解码器)的行业最高水平,有望彻底改变远程通信的用户体验。

AVS3P10标准的核心突破在于其超低码率下的高质量语音传输能力。传统音频编解码器在码率降低到10kbps以下时,语音质量会明显下降。而AVS3P10能够在6kbps的超低码率下实现高质量通话,音频质量媲美行业现有主流标准在20kbps时的表现。这意味着,即使在电梯、地库、高铁隧道等网络信号极差的环境下,用户也能享受到清晰流畅的通话体验。

这一突破性进展源于腾讯将AI技术与传统信号处理技术的深度融合。腾讯AI Lab高级研究员阳珊表示:“AI技术的引入,和传统意义上的大模型不一样,大模型是数据驱动,其实本身也是一个生成,我们也可以把编解码看作是生成,但在算法设计上要求更高。”腾讯团队通过独特的算法设计和架构优化,成功研发出适用于各种终端设备的小型音频编解码器,能够在不降低音质的情况下大幅减少文件大小。

AVS3P10标准的推出将对用户体验和行业发展产生深远影响。对于用户而言,这意味着无论身处何种网络环境,都能享受到高质量的语音通信体验。对于行业而言,这一标准的普及将推动整个音视频通信产业的技术升级,为更多创新应用的出现奠定基础。

展望未来,音视频AI技术的发展趋势将更加注重个性化和沉浸式体验。腾讯标准化高级工程师张亚军指出:“要打造沉浸式体验,需要从头到尾考虑,包括采集、处理、编码等多个环节,并且需要针对具体的使用场景进行定制化设计。”这意味着未来的音视频技术将更加智能,能够根据不同场景和用户需求,自动调整编码策略,提供最佳的视听体验。

腾讯在音视频AI技术领域的这一突破,不仅展示了中国企业在前沿技术领域的创新能力,也为全球音视频通信技术的发展指明了新的方向。随着这项技术的广泛应用,我们有理由期待一个更加流畅、清晰、智能的音视频通信新时代的到来。