音视频应用新突破！腾讯AI技术赋能，带你探索智能交互新世界！

发布时间：2024-09-18

腾讯在音视频AI技术领域取得重大突破，其主导的AVS3P10实时语音编码标准即将正式发布。这一标准代表了当前AI Codec（人工智能编解码器）的行业最高水平，有望彻底改变远程通信的用户体验。

AVS3P10标准的核心突破在于其超低码率下的高质量语音传输能力。传统音频编解码器在码率降低到10kbps以下时，语音质量会明显下降。而AVS3P10能够在6kbps的超低码率下实现高质量通话，音频质量媲美行业现有主流标准在20kbps时的表现。这意味着，即使在电梯、地库、高铁隧道等网络信号极差的环境下，用户也能享受到清晰流畅的通话体验。

这一突破性进展源于腾讯将AI技术与传统信号处理技术的深度融合。腾讯AI Lab高级研究员阳珊表示：“AI技术的引入，和传统意义上的大模型不一样，大模型是数据驱动，其实本身也是一个生成，我们也可以把编解码看作是生成，但在算法设计上要求更高。”腾讯团队通过独特的算法设计和架构优化，成功研发出适用于各种终端设备的小型音频编解码器，能够在不降低音质的情况下大幅减少文件大小。

AVS3P10标准的推出将对用户体验和行业发展产生深远影响。对于用户而言，这意味着无论身处何种网络环境，都能享受到高质量的语音通信体验。对于行业而言，这一标准的普及将推动整个音视频通信产业的技术升级，为更多创新应用的出现奠定基础。

展望未来，音视频AI技术的发展趋势将更加注重个性化和沉浸式体验。腾讯标准化高级工程师张亚军指出：“要打造沉浸式体验，需要从头到尾考虑，包括采集、处理、编码等多个环节，并且需要针对具体的使用场景进行定制化设计。”这意味着未来的音视频技术将更加智能，能够根据不同场景和用户需求，自动调整编码策略，提供最佳的视听体验。

腾讯在音视频AI技术领域的这一突破，不仅展示了中国企业在前沿技术领域的创新能力，也为全球音视频通信技术的发展指明了新的方向。随着这项技术的广泛应用，我们有理由期待一个更加流畅、清晰、智能的音视频通信新时代的到来。