点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

光明网讯 计算机视觉技术作为AI的“眼睛”,是当前人工智能领域的重要研究方向。近期,计算机视觉领域三大顶级学术会议之一的国际计算机视觉大会(ICCV 2025)举行,其间,合合信息联合上海交通大学等机构主办了首届VQualA视觉质量评估研讨会,为推动建立智能文档图像处理技术的标准化评估体系,研讨会设置了文档图像质量评估竞赛,吸引了来自全球知名高校和研究机构的上百名选手参与。
文档图像质量评估竞赛旨在推动开发与人类判断一致的质量评估模型。经过多轮评审,参赛队伍DeQA-Doc提交的技术方案成功将多模态大模型在图像质量评估上的卓越性能延伸应用至文档图像领域,模型评分位居赛道榜首。
在数字化趋势下,文档图像已成为信息传播的核心载体。然而,经过手机、相机等设备采集的文档图像往往会受外部环境影响,出现阴影、纸张弯曲等问题,智能文档图像处理技术可通过去模糊、几何校正等技术提升图像质量,但如何科学地评估这些算法的优化效果仍然是业界面临的挑战。传统的评估指标与人眼实际的感知效果脱节,主观评估效率低,不适合大规模算法评估。本次竞赛上,来自全球的上百名选手为解决这一问题提出多种技术解决方案,助力优化文档处理系统。
AI行业的发展既需要从长期实践中洞察真实痛点,也需要前沿技术破解特定难题。据了解,合合信息专注于多模态文本智能技术的研发,此前,在智能图像处理等领域,合合信息已与上海交通大学围绕“企业出题、高校攻关”的课题研究模式展开持续合作,双方共同产出了数篇前沿学术论文及多项专利成果,有力推动了智能文档图像处理领域的技术突破。(记者 战钊)
