2021 SA-NET(Shuffle Attention)

#机器学习 #CV

文章信息

文章标题：SA-NET: SHUFFLE ATTENTION FOR DEEP CONVOLUTIONAL NEURAL NETWORKS
文章链接：http://arxiv.org/abs/2102.00240

前置概念

GAP：Global Averaging Pooling，TODO
Group Norm：

论文思想

Shuffle Unit结合了对通道间的注意力(Channel attention)和对空间的注意力(Spatial attention)，随后所有的子特征被聚合并允许在不同的特征之间互相传递信息。

Shuffle Unit保证输入和输出的维度相同，方便将Shuffle Unit插入到任何需要引入注意力机制的地方。

文章重要译文

3. Shuffle Attention

在本章节，首先介绍了SA(Shuffle Attention)模块的构建过程，该模块将输入的特征映射分成若干组，并使用Shuffle Unit将对通道间的注意力(Channel attention)和对空间的注意力(Spatial attention)集成到每个组的一个块中。然后，对所有子特征进行聚合，并利用“通道洗牌”(Channel shuffle)操作符实现不同子特征之间的信息通信。然后，我们展示了如何对深层CNN使用SA模块。最后，通过仿真验证了该方法的有效性和可靠性。SA模块的总体架构如图2所示。

图2：SA模块的概述。它采用“通道分割”并行处理每组的子特征。对于通道注意力分支，使用GAP生成通道统计数据，然后使用一对参数对通道向量进行缩放和移位。对于空间注意力分支，采用Group Norm生成空间统计数据，然后创建类似于通道分支的紧凑特征。然后将这两个分支连接起来。之后，所有子特征都被聚合，最后我们利用“通道洗牌”操作符来实现不同子特征之间的信息通信。

3.1 特征分组(Feature Grouping)

假设输入的特诊图(Feature map，通常由卷积操作得到)的尺寸为，则特征图：随后将C划分为G组(G通常为32或64)，则对于其中的通道分量：