点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:哈工大联合度小满研发自适应剪枝算法 提升多模态大模型效率
首页> 科技频道> 人工智能 > 正文

哈工大联合度小满研发自适应剪枝算法 提升多模态大模型效率

来源:光明网2024-03-20 16:49

  在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要障碍。近日,哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减,实现了显著的效率提升,相关研究成果已被国际自然语言处理领域顶级会议COLING 24接收。

  据介绍,SmartTrim技术的核心在于其自适应剪枝能力,通过分析模型中每层的token表示和attention head的冗余性,智能识别并剪除不必要的计算负担。这一过程中,SmartTrim不仅考虑了token在单一模态序列中的重要性,还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略,SmartTrim能够在保持模型性能的同时,大幅提升计算效率。

哈工大联合度小满研发自适应剪枝算法 提升多模态大模型效率

  在基于 VQA 微调的 METER 的跨模态编码器中,层内不同 token(上)和 attention head(下)表示的相似性。

  SmartTrim框架的实施涉及两个关键组件:跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器(MLP)结构,智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性,还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中,评估并修剪那些冗余的注意力头,从而优化了模型的计算效率。

哈工大联合度小满研发自适应剪枝算法 提升多模态大模型效率

  SmartTrim 框架结构图

  在训练SmartTrim模型时,研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧,解决了不可导二值mask的问题,实现了模型的端到端训练。此外,自蒸馏和课程学习策略的引入,进一步提高了剪枝后模型的性能,确保了训练过程的稳定性。

哈工大联合度小满研发自适应剪枝算法 提升多模态大模型效率

  Token 的逐步裁剪修剪过程

  实验结果表明,SmartTrim在METER和BLIP两个VLM上实现了2-3倍的加速,同时将性能损失最小化。这一成果不仅在理论上具有创新性,也为实际应用中的模型优化提供了新的思路。特别是在1.5倍加速比下,SmartTrim的性能甚至超过了原始模型。在高加速比下,SmartTrim相比其他方法展现出显著优势。

  SmartTrim技术的推出,标志着多模态大模型研究的一个重要里程碑。度小满表示,SmartTrim技术将在未来整合到公司的轩辕大模型中,以推动大模型技术的发展。相关研究者可以通过访问https://github.com/Duxiaoman-DI/XuanYuan,了解更多关于SmartTrim的详细信息和研究成果。(科文)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 复旦大学迎来建校120周年

  • 江苏盱眙:种粮大户喜获丰收

独家策划

推荐阅读
睡前只需服用一粒药丸就能不再佩戴笨重面罩入睡,这对部分阻塞性睡眠呼吸暂停(OSA)患者来说,可能即将梦想成真。
2025-05-28 09:30
据英国《每日电讯报》26日消息称,美国开放人工智能研究中心(OpenAI)开发的高级人工智能(AI)模型o3,在接收到明确的关机指令后,不仅拒绝执行,还主动干预其自动关机机制。
2025-05-28 09:24
记者5月26日从北京大学获悉,该校环境科学与工程学院教授要茂盛团队研发了空气毒性活体监测系统(以下简称ATMS),实现了对空气污染健康效应的原位、实时、在线监测,有望为优化空气污染控制策略和公众健康防护提供技术支撑。
2025-05-28 09:24
保障粮食储存安全是粮食流通领域科技攻关的核心任务,粮食科研人员深入贯彻绿色发展理念,研发系列粮食仓储技术成果,在粮食仓储领域推广应用,取得良好成效。
2025-05-28 09:19
数据显示,地球陆地上可开采锂资源仅约2200万吨,海水中却蕴藏2300亿吨锂。然而,高效、绿色的海水提锂技术被视作科研界难啃的“硬骨头”。
2025-05-28 09:18
“黑夜给了我黑色的眼睛,我却用它寻找光明。”
2025-05-27 13:22
“世界杰出女科学家奖”由联合国教科文组织和法国欧莱雅基金会在1998年联合设立
2025-05-27 11:10
无法释放起落架的民航客机在巨大的摩擦声中以机腹着地方式从跑道上滑过,高速进入大气层的空天飞机像一个“火球”剧烈燃烧,大型运输机在超强暴风雪中艰难起飞,先进战斗机在复杂空战环境中被导弹碎片打得千疮百孔……
2025-05-27 09:27
近日,中国科学院广州地球化学研究所副研究员高名迪与研究员王煜、中国科学院院士徐义刚,以及澳大利亚国立大学教授Stephen Foley合作,通过高温高压实验与超深金刚石包裹体成分对比研究,揭示了再循环碳酸盐如何改变地幔氧化还原状态,及对克拉通演化和深部碳循环的影响。
2025-05-27 09:22
“浚澜”船配备了高压岸电接入模块,可以采用全电力驱动挖掘系统,实现施工作业零碳排放。
2025-05-27 09:16
天问二号探测器按计划完成了技术区总装、测试、加注、转场、功能检查、联合测试等工作。
2025-05-27 09:10
研究发现,自20世纪80年代以来,北半球高纬地区大气甲烷浓度的季节振幅呈现减弱趋势,而副热带及热带地区的季节振幅却显著增强。这一变化趋势及其空间差异为解析全球甲烷源汇的长期演变提供了关键观测证据,为全球甲烷减排提供了科学支撑。
2025-05-27 09:09
据两位消息人士透露,英伟达还在为中国开发另一款采用Blackwell架构的芯片,最早可能于9月开始生产。
2025-05-26 12:51
研究人员成功诱导干细胞发育成充满液体的羊膜囊。这种模型囊体直径约2厘米,相当于一个4周胚胎周围羊膜囊的实际大小,可用于研究早期妊娠。
2025-05-26 09:21
你有过牙齿酸酸胀胀的体验吗?这会让我们真切地感受到牙齿有多敏感。其实,在咀嚼食物时,这种敏感性大有用处,它能提供关于温度、压力,还有疼痛方面的重要信息。
2025-05-26 09:18
最新一期《自然》杂志发表的论文报告发现一个原以为“不可能存在”的神秘结构。
2025-05-26 09:18
阿尼玛卿雪山保存着50余条冰川,年均径流量占黄河上游总流量35%,其变化对黄河流域水资源具有重要影响。
2025-05-26 09:16
如今,在各地田间地头,植保无人机凌空起舞、无人拖拉机破土前行、水肥一体精准施肥、北斗导航精准播种、智能机器人全天候巡检……科技感十足的农耕图景随处可见。
2025-05-26 09:15
可持续的减肥从不靠极端节食,而是科学的生活习惯。
2025-05-23 13:30
邓宏章对此形象地比喻:“传统LNP像‘硬闯城门’的士兵,难免伤及无辜;而TNP则是‘和平访问’的来客,以最小代价达成使命。”
2025-05-23 13:13
加载更多