文章主题:JPEG, AI标准平台, 火山引擎, 软件平台
近期,联合图像专家组JPEG宣布了JPEG AI标准平台的提案结果。在此背景下,火山引擎多媒体实验室以其卓越的软件平台BEE,成功获得了主观质量性能评价的最佳成绩。这一成果充分展示了我国在图像处理技术领域的强大实力与独特贡献。
JPEG,作为国际标准化组织、国际电工委员会以及国际电信联盟的重要工作小组,肩负着在”信息爆炸”的时代,为互联网数据的传输与存储提供关键技术的使命。随着深度学习在图像压缩技术领域的迅速发展,JPEG AI小组推出了JPEG AI标准平台提案的征集活动,旨在构建一种全新的智能图像编码系统。这个系统不仅能提升图像的质量,同时也能显著提高压缩性能,以适应互联网快速发展的需求。
在全球各地的高校、科研机构、企业等众多单位中,有数十个机构提交了自己的软件平台方案。在这些方案中,所有提交的产品都保持了相同的文件大小。而在这次主观质量性能的评测中,火山引擎软件平台的BEE以其卓越表现脱颖而出,超越了其他所有的参赛软件平台,成功获得了这项评测的冠军。人类的主观视觉感受成为了图像压缩的最重要评价标准,这也使得BEE在主观评测中表现出色。
据相关消息,自动驾驶以及媒体分发等领域对于图像压缩技术有着极高的需求,因为在带宽受限的情况下,如何更高效地传输大量高质量图片成为了亟待解决的问题。在此背景下,智能图像编码——这一人工智能技术在图像压缩领域的跨界应用,展现出了巨大的潜力和价值,成为了图像压缩技术发展的重要方向。
火山引擎多媒体实验室的负责人透露,BEE软件平台提出了多种具有创新性的算法,成功解决了智能图像编码领域软硬件实现的诸多问题。特别是其独创的“解耦式熵编码”技术,有效缓解了长期以来制约端到端压缩数据依赖的问题,从而在使用户的编解码速度上取得了显著的提升。
在智能图像编码领域,熵编码与像素重建过程呈现出高度耦合的状态,这就像是一位力工和一位瓦工在合作建造房屋时的工作方式。力工在每次收到一块砖后,才会将其传递给瓦工,并在瓦工完成抹水泥和砌墙工作并给出收条之后,力工才会继续接收下一块砖。这种流程中的依赖关系和耦合性,对房屋的建造效率产生了影响。
火山引擎的“解耦式熵编码”技术彻底颠覆了传统的建筑施工模式。 no more waiting for the laborers to apply cement, or for the workers to focus solely on laying bricks. Instead, with the new technology, construction becomes a highly efficient and collaborative process. The laborers can focus on moving bricks to their designated locations without any delay, and even call for additional help if needed. Similarly, the workers need not worry about the laborers, as they can continue to lay bricks at an increased pace as long as there are bricks available at the specified site. This approach not only improves productivity but also streamlines the entire construction process.
图1:JPEG官方主观测试结果图,TEAM16、24为火山引擎的方案
图2:JPEG主观测试DMOS表,TEAM16、24为火山引擎的方案
经过严谨的测试分析,我们发现BEE平台在解码速度方面具有显著优势,相较于其他竞争性软件平台,速度快1至3个数量级。事实上,它的解码速度已经超越了当前最先进的视频压缩标准H.266/VVC。在图形处理器GPU的助力下,BEE平台的解码时间仅为H.266/VVC官方参考软件的一半,这无疑是一项令人瞩目的成就。
火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际、国内的标准化工作,其众多创新算法已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!