近日,人工智能领域国际顶级学术会议AAAI(2025)公布论文录用结果,西华大学成果《GLIC:General Format Learned Image Compression》被录用,计算机与软件工程学院2023级硕士研究生周明胜为第一作者,导师孔明明为通讯作者。
AAAI(Association for the Advancement of Artificial Intelligence)为人工智能领域国际顶级学术会议,同时也是中国计算机学会(CCF)和中国人工智能学会(CAAI)推荐的A类国际学术会议。本届会议在美国费城召开,共收到12957篇有效投稿,最终录用3032篇,录取率为23.4%。
在数字信息时代,图像压缩技术是影像传输和存储的重要基础。随着人工智能技术发展,基于深度学习的图像压缩方法在主观视觉效果和定量指标上超越了传统算法。然而,当前学习图像压缩方法多适用于三通道图像格式,限制了其实际应用。针对这一现状,研究团队提出高性能学习图像压缩模型General Format Learned Image Compression(GLIC),旨在处理通用图像格式,拓展技术应用范围。研究工作引入图像通道转换方法,将任意通道数图像统一为适合神经网络处理的格式,并通过信息熵和同态理论验证其有效性。同时,在熵模型中加入自适应注意力残差块(AARB)提升模型泛化能力,提出均匀分组跨通道上下文模块(CCCT)用于渐进式预览图像解码。
GLIC模型框架
GLIC模型框架通过Reconstruction Split and Concat(SC/RSC)模块,将任意通道数图像转换为二维矩阵处理,解码时还原原始格式。模型核心由分析器、合成器以及超先验分析器和超先验合成器构成,用于优化编码效率。CCCT模块通过均匀分组潜在表示、优先处理信息量较大块,解决多通道图像信息冗余问题,加速编解码并保证预览图像质量。AARB模块融合注意力机制与残差网络优势,自适应识别语义信息重要性,提升压缩效率的同时保证图像高保真度。
CCCT模块
AARB模块
该项成果代表了学习图像压缩领域的重要进展,为解决实际应用中的图像压缩难题提供了强有力的技术支持。随着GLIC模型的不断优化和推广,有望在医疗影像处理、无线通信、大规模数据存储等众多领域发挥重要作用。