哈工大联合度小满研发自适应剪枝算法提升多模态大模型效率

来源：光明网2024-03-20 16:49

　　在视觉语言大模型（VLM）的研究和应用中，高计算成本一直是制约其广泛部署的主要障碍。近日，哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——SmartTrim。该算法针对多模态大模型的冗余计算进行有效削减，实现了显著的效率提升，相关研究成果已被国际自然语言处理领域顶级会议COLING 24接收。

　　据介绍，SmartTrim技术的核心在于其自适应剪枝能力，通过分析模型中每层的token表示和attention head的冗余性，智能识别并剪除不必要的计算负担。这一过程中，SmartTrim不仅考虑了token在单一模态序列中的重要性，还特别强调了跨模态交互中的关键作用。通过这种精细化的剪枝策略，SmartTrim能够在保持模型性能的同时，大幅提升计算效率。

　　在基于 VQA 微调的 METER 的跨模态编码器中，层内不同 token（上）和 attention head（下）表示的相似性。

　　SmartTrim框架的实施涉及两个关键组件：跨模态感知的Token修剪器和模态自适应的注意力头修剪器。Token修剪器利用多层感知器（MLP）结构，智能地识别并去除那些对于当前层不重要的Token。这一过程不仅考虑了Token在文本或图像序列中的独立重要性，还综合了它们在跨模态交互中的贡献。注意力头修剪器则直接集成在模型的自注意力模块中，评估并修剪那些冗余的注意力头，从而优化了模型的计算效率。

哈工大联合度小满研发自适应剪枝算法提升多模态大模型效率

　　SmartTrim 框架结构图

　　在训练SmartTrim模型时，研究人员采用了一种结合任务相关目标和计算开销目标的双重优化策略。通过重参数化技巧，解决了不可导二值mask的问题，实现了模型的端到端训练。此外，自蒸馏和课程学习策略的引入，进一步提高了剪枝后模型的性能，确保了训练过程的稳定性。

哈工大联合度小满研发自适应剪枝算法提升多模态大模型效率

　　Token 的逐步裁剪修剪过程

　　实验结果表明，SmartTrim在METER和BLIP两个VLM上实现了2-3倍的加速，同时将性能损失最小化。这一成果不仅在理论上具有创新性，也为实际应用中的模型优化提供了新的思路。特别是在1.5倍加速比下，SmartTrim的性能甚至超过了原始模型。在高加速比下，SmartTrim相比其他方法展现出显著优势。

　　SmartTrim技术的推出，标志着多模态大模型研究的一个重要里程碑。度小满表示，SmartTrim技术将在未来整合到公司的轩辕大模型中，以推动大模型技术的发展。相关研究者可以通过访问https://github.com/Duxiaoman-DI/XuanYuan，了解更多关于SmartTrim的详细信息和研究成果。（科文）

阅读剩余全文（）

您此时的心情

新闻表情排行日/周

开心

0
难过

0
点赞

0
飘过

0

视觉焦点

2025年空军航空开放活动和长春航空展举行预演
百舸争流迎开渔

最热文章

推荐阅读

展示科技魅力激发创新思维

“科创游”是一种将科技与旅游相结合的新型旅游形式，不仅展示科技企业的生产过程和产品，还注重科技教育的普及和科技创新的体验

2025-09-17 10:23

塑造人与自然可持续的未来

此次大会将讨论通过“人与生物圈计划”及其世界生物圈保护区网络杭州战略行动计划，明确未来十年的发展方向、目标和行动方案

2025-09-17 10:21

在这里，一睹“长空利剑”雄姿！

人造地球卫星、载人飞船、空间站、空间探测器要“上天”进入预定轨道，运载火箭少不了。在“火箭家族”展台，长征一号至五号运载火箭模型笔直而立。

2025-09-17 10:20

邻近标记技术有望成精准“治疗工具”

在化学生物学研究中，有一种强大的“分子地图绘制技术”——邻近标记技术。在癌症免疫治疗中，免疫细胞需要足够强和足够多的“信号”才能发起攻击，但癌细胞表面的天然信号往往非常稀疏。

2025-09-17 10:18

新华全媒+丨丰收在望各地多举措抓好秋粮生产

当前，秋粮陆续进入成熟期。各地抓住最后的窗口期，落实落细各项增产措施，全力以赴抓好秋粮生产，确保秋粮丰产丰收。

2025-09-17 09:32

人工智能和批判性思维“双螺旋”如何推动创新

人工智能的浪潮正在席卷从科技到教育，乃至全社会的各个角落，中国教育界正在积极推动学习和应用人工智能，以便乘势站在时代前列。今年6月，中国工程院院士、华中科技大学校长尤政提出，人工智能和批判性思维结合形成DNA式的“双螺旋结构”，将有力推动创新。

2025-09-16 09:14

《人工智能安全治理框架》2.0版发布

15日，在2025年国家网络安全宣传周主论坛上，《人工智能安全治理框架》2.0版正式发布。落实《全球人工智能治理倡议》，《人工智能安全治理框架》1.0版于2024年9月发布，受到国内外广泛关注。

2025-09-16 09:13

我国畜禽种业发展迈出坚实步伐

光明日报北京9月15日电记者陈晨从农业农村部获悉，2025畜禽种业发展论坛14日在北京市平谷区举行。论坛发布了第三次全国畜禽遗传资源普查、濒危畜禽遗传资源保护成效、主要畜种分子身份证构建和遗传评估优秀种公畜等重大成果，举办了畜禽种业振兴成果展，26家单位现场推介新技术、新设备、新成果，72家单位进行专场展示。

2025-09-16 09:13

数智技术为青年人插上终身学习的“双翼”

数智技术以及数智互联技术将推进青年间社会化协同与知识共享，可精准连接青年学习者，并形成跨地域的学习社群与项目协作组。总而言之，数智技术能够为青年群体参与终身学习创造良好条件，能够充分激发青年群体参与终身学习的动力，能够更好地帮助青年群体全面发展。

2025-09-16 09:12

步入智能教育新赛道中小学校如何“驭浪前行”

作者：王珩、程松泉，分别系浙江师范大学教师教育学院教授；浙江师范大学教师教育学院博士生　　当前，全球教育正经历一场由人工智能技术驱动的深刻变革。唯有坚守育人初心，在伦理框架内审慎推进技术应用，才能让人工智能真正成为引领教育发展的引擎，而非解构教育本质的飓风。

2025-09-16 09:11

我科学家破解颗石藻高效利用光能的奥秘

在合成生物学和气候变化应对领域有巨大潜力。

2025-09-16 09:11

2025年服贸会文旅融合活力足

走进展区，多款新潮文创让人爱不释手；戴上设备，苏轼笔下的诗词世界任人遨游；指尖轻点，三千年前的青铜器“触手可及”……一系列新产品、新服务、新场景在2025年中国国际服务贸易交易会文旅服务专题亮相，漫步其中，处处感受到科技与创意奔涌、文化和旅游融合的无限活力。

2025-09-15 09:54

从2025年服贸会看中国创意经济如何发力

在2025年中国国际服务贸易交易会上，一批品类丰富、兼具趣味与文化内涵的文创精品成为展会现场的“人气王”，引爆观展热潮。

2025-09-15 09:54

网络基础设施筑起数字经济新底座

最大网络基础设施的建成有助于我国突破关键技术的“卡脖子”困境，形成自主可控的核心技术优势，建立起数字经济产业的第二创新生态。（作者：戎珂，系清华大学社会科学学院经济学研究所所长、长聘教授；田晓轩，系清华大学社会科学学院经济学研究所博士研究生）

2025-09-15 09:53

工厂游缘何火爆出圈

今年暑期，工厂游火爆出圈。参观名额秒空、门票收入可观、社交平台相关笔记有10多万条，工厂游俨然成了文旅界新宠。工厂游等新型旅游业态，实现了工业与文旅的跨界融合，也为文旅经济的发展提供了新增长点。

2025-09-15 09:52

一颗匠心筑梦满怀精诚报国

深夜，河南焦作多氟多新材料股份有限公司的实验室依旧灯火通明，总工程师闫春生还在带着团队忙碌。 2006年，多氟多打响了由传统氟化工向精细氟化工、新能源材料转型的战役，闫春生临危受命加入六氟磷酸锂研发团队。

2025-09-15 09:51

服贸会上的科技新看点

2025年中国国际服务贸易交易会9月10日至9月14日在北京举办，众多科技产品亮相展区，吸引观众驻足参观。2025年中国国际服务贸易交易会9月10日至9月14日在北京举办，众多科技产品亮相展区，吸引观众驻足参观。

2025-09-12 10:08

城市道路碳排放有了精准刻画工具

汽车排放被认为是气候变化的“元凶”之一，但学术界一直缺乏对城市道路碳排放进行精准刻画的工具。”借助全景AI模型，可实现二氧化碳排放源的精准提取，模型的平均精度超过93%、平均误差低于1.3ppm（ppm为百万分比浓度）。

2025-09-12 10:01

推动人工智能安全可靠可控发展

习近平总书记指出：“要把握人工智能发展趋势和规律，加紧制定完善相关法律法规、政策制度、应用规范、伦理准则，构建技术监测、风险预警、应急响应体系，确保人工智能安全、可靠、可控。人工智能系统的可靠性不能停留在统计意义上的“高概率正确”，而应追求在复杂、开放、动态环境下的“高置信可靠”。

2025-09-12 10:01

2025世界顶尖科学家协会奖揭晓

10日，2025世界顶尖科学家协会奖（以下简称“顶科协奖”）获奖者名单在上海公布。顶科协奖是2021年在上海发起创设、由红杉中国独家提供永久资金支持的面向全球科学家评选的科学大奖。

2025-09-12 09:59

加载更多

全部导航

哈工大联合度小满研发自适应剪枝算法提升多模态大模型效率

相关阅读

您此时的心情

视觉焦点

最热文章

独家策划

全部导航

哈工大联合度小满研发自适应剪枝算法 提升多模态大模型效率

相关阅读

您此时的心情

视觉焦点

最热文章

独家策划

哈工大联合度小满研发自适应剪枝算法提升多模态大模型效率