多尺度注意力机制突破性成果!低成本、高性能兼备
bigegpt 2025-06-10 13:09 12 浏览
与传统的注意力机制相比,多尺度注意力机制引入了多个尺度的注意力权重,让模型能够更好地理解和处理复杂数据。
这种机制通过在不同尺度上捕捉输入数据的特征,让模型同时关注局部细节和全局结构,以提高对细节和上下文信息的理解,达到提升模型的表达能力、泛化性、鲁棒性和定位精度,优化资源使用效率的效果。
比如发表于TMM2023的MSDA模块,同时考虑了浅层自注意机制的局部性和稀疏性,可以有效地聚合语义多尺度信息,仅用70%更少的FLOPs就媲美现有SOTA。
为方便各位理解和运用,今天分享17种多尺度注意力创新方案,原文和开源代码都有。论文可参考创新点做了简单提炼,具体工作细节可阅读原文。
论文原文+开源代码需要的同学关注“学姐带你玩AI”公众号,那边回复“多尺度创新”获取。
EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction
方法:论文研究了高分辨率密集预测的高效架构设计。我们引入了一个轻量级的多尺度注意力模块,通过轻量级和硬件高效的操作实现了全局感受野和多尺度学习,从而在各种硬件设备上显著加速而不损失性能。
创新点:
- 通过引入轻量级多尺度注意力模块,实现了全局感受野和多尺度学习,提供了在各种硬件设备上显著加速高分辨率密集预测模型的能力。
- 首次成功将ReLU线性注意力应用于高分辨率密集预测,实现了全局感受野,并通过轻量级操作提高了效率。
Efficient Multi-Scale Attention Module with Cross-Spatial Learning
方法:论文提出了一种将其结合到卷积神经网络中的方法。研究发现,通过避免一些形式的降维,可以使CNN同时具有良好的泛化能力和计算资源效率。作者提出的EMA模块具有灵活且轻量级的特点,可以方便地应用于不同的计算机视觉任务,并取得最佳性能。此外,EMA还可以堆叠到其他深度CNN结构中,显著提高特征表示能力。
创新点:
- 提出了一种新的多尺度注意力机制(EMA模块),通过将部分通道维度重新排列到批处理维度中,避免了维度缩减,从而增强了特征表示能力。
- EMA模块采用平行子网络块的方式,能够有效捕捉跨维度交互和建立维度间的依赖关系。
- 在多个计算机视觉任务中,将EMA模块集成到标准网络架构中,如ResNet50/101和MobileNetV2,能够显著提升性能和效率。
LENet: Lightweight And Efficient LiDAR Semantic Segmentation Using Multi-Scale Convolution Attention
方法:本文提出了一种轻量级和高效的基于LiDAR的语义分割网络LENet,利用投影方法进行语义分割。作者开发了一种新颖的多尺度卷积注意力模块(MSCA)来替换编码器中的ResNet块,并通过使用不同的卷积核大小,MSCA能够捕捉关键信息。通过对SemanticKITTI验证集上的多个消融实验的结果进行比较,我们的LENet方法相比基准方法提高了4.8%的准确性,并减少了25%的参数。
创新点:
- 提出了一种新颖的多尺度卷积注意力模块(MSCA),用于替代编码器中的ResNet块。MSCA通过使用不同的卷积核大小来捕捉关键信息,从而提高了网络的性能和准确性。
- 提出了一种轻量级的解码器结构,使用了IAC模块。IAC模块包含上采样特征图的双线性插值和3×3卷积,以及对来自编码器和先前IAC的信息进行融合的点卷积。
- 在网络中使用辅助分割头进一步提高网络的准确性。辅助分割头与主要损失函数一起计算加权损失,并且不同维度的特征图具有不同的表达能力,因此每个损失函数都有相应的权重。
Multi-scale Attention Network for Single Image Super-Resolution
方法:本文提出了一种多尺度注意力网络(MAN),用于多复杂度下的超分辨率。MAN采用变压器风格的块以更好地建模表示。为了在各种区域之间有效灵活地建立长距离关联,作者开发了多尺度大内核注意力(MLKA),它结合了大内核分解和多尺度机制。此外,作者提出了一个简化的前馈网络(GSAU),它集成了门机制和空间注意力,以激活局部信息并减少模型复杂性。
创新点:
- 提出了多尺度注意力块(MAB)。与许多RCAN风格的块相比,所提出的块将MetaFormer风格的功能性纳入其中,以实现有希望的特征提取结果。
- 提出了多尺度大内核注意力(MLKA)。通过MLKA,我们修改了大内核注意力,采用多尺度和门控机制,以在不同粒度级别获得丰富的注意力图,从而聚合全局和局部信息,避免潜在的块状伪影。
- 整合了门控机制和空间注意力,提出了简化的前馈网络(GSAU),以激活局部信息并降低模型复杂性。
论文原文+开源代码需要的同学关注“学姐带你玩AI”公众号,那边回复“多尺度创新”获取。
相关推荐
- 了解Linux目录,那你就了解了一半的Linux系统
-
大到公司或者社群再小到个人要利用Linux来开发产品的人实在是多如牛毛,每个人都用自己的标准来配置文件或者设置目录,那么未来的Linux则就是一团乱麻,也对管理造成许多麻烦。后来,就有所谓的FHS(F...
- Linux命令,这些操作要注意!(linux命令?)
-
刚玩Linux的人总觉得自己在演黑客电影,直到手滑输错命令把公司服务器删库,这才发现命令行根本不是随便乱用的,而是“生死簿”。今天直接上干货,告诉你哪些命令用好了封神!喜欢的一键三连,谢谢观众老爷!!...
- Linux 命令速查手册:这 30 个高频指令,拯救 90% 的运维小白!
-
在Linux系统的世界里,命令行是强大的武器。对于运维小白而言,掌握一些高频使用的Linux命令,能极大提升工作效率,轻松应对各种系统管理任务。今天,就为大家奉上精心整理的30个Linu...
- linux必学的60个命令(linux必学的20个命令)
-
以下是Linux必学的20个基础命令:1.cd:切换目录2.ls:列出文件和目录3.mkdir:创建目录4.rm:删除文件或目录5.cp:复制文件或目录6.mv:移动/重命名文件或目录7....
- 提高工作效率的--Linux常用命令,能够决解95%以上的问题
-
点击上方关注,第一时间接受干货转发,点赞,收藏,不如一次关注评论区第一条注意查看回复:Linux命令获取linux常用命令大全pdf+Linux命令行大全pdf为什么要学习Linux命令?1、因为Li...
- 15 个实用 Linux 命令(linux命令用法及举例)
-
Linux命令行是系统管理员、开发者和技术爱好者的强大工具。掌握实用命令不仅能提高效率,还能解锁Linux系统的无限潜力,本文将深入介绍15个实用Linux命令。ls-列出目录内容l...
- Linux 常用命令集合(linux常用命令全集)
-
系统信息arch显示机器的处理器架构(1)uname-m显示机器的处理器架构(2)uname-r显示正在使用的内核版本dmidecode-q显示硬件系统部件-(SMBIOS/DM...
- Linux的常用命令就是记不住,怎么办?
-
1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...
- Linux常用文件操作命令(linux常用文件操作命令有哪些)
-
ls命令在Linux维护工作中,经常使用ls这个命令,这是最基本的命令,来写几条常用的ls命令。先来查看一下使用的ls版本#ls--versionls(GNUcoreutils)8.4...
- Linux 常用命令(linux常用命令)
-
日志排查类操作命令查看日志cat/var/log/messages、tail-fxxx.log搜索关键词grep"error"xxx.log多条件过滤`grep-E...
- 简单粗暴收藏版:Linux常用命令大汇总
-
号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部下午好,我的网工朋友在Linux系统中,命令行界面(CLI)是管理员和开发人员最常用的工具之一。通过命令行,用户可...
- 「Linux」linux常用基本命令(linux常用基本命令和用法)
-
Linux中许多常用命令是必须掌握的,这里将我学linux入门时学的一些常用的基本命令分享给大家一下,希望可以帮助你们。总结送免费学习资料(包含视频、技术学习路线图谱、文档等)1、显示日期的指令:d...
- Linux的常用命令就是记不住,怎么办?于是推出了这套教程
-
1.帮助命令1.1help命令#语法格式:命令--help#作用:查看某个命令的帮助信息#示例:#ls--help查看ls命令的帮助信息#netst...
- Linux的30个常用命令汇总,运维大神必掌握技能!
-
以下是Linux系统中最常用的30个命令,精简版覆盖日常操作核心需求,适合快速掌握:一、文件/目录操作1.`ls`-列出目录内容`ls-l`(详细信息)|`ls-a`(显示隐藏文件)...
- Linux/Unix 系统中非常常用的命令
-
Linux/Unix系统中非常常用的命令,它们是进行文件操作、文本处理、权限管理等任务的基础。下面是对这些命令的简要说明:**文件操作类:*****`ls`(list):**列出目录内容,显...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)