2021 SA-NET(Shuffle Attention)

#机器学习 #CV

文章信息

前置概念

  • GAP:Global Averaging Pooling,TODO
  • Group Norm

论文思想

Shuffle Unit结合了对通道间的注意力(Channel attention)和对空间的注意力(Spatial attention),随后所有的子特征被聚合并允许在不同的特征之间互相传递信息。

Shuffle Unit保证输入和输出的维度相同,方便将Shuffle Unit插入到任何需要引入注意力机制的地方。

文章重要译文

3. Shuffle Attention

在本章节,首先介绍了SA(Shuffle Attention)模块的构建过程,该模块将输入的特征映射分成若干组,并使用Shuffle Unit将对通道间的注意力(Channel attention)和对空间的注意力(Spatial attention)集成到每个组的一个块中。然后,对所有子特征进行聚合,并利用“通道洗牌”(Channel shuffle)操作符实现不同子特征之间的信息通信。然后,我们展示了如何对深层CNN使用SA模块。最后,通过仿真验证了该方法的有效性和可靠性。SA模块的总体架构如图2所示。
0003.jpg

图2:SA模块的概述。
它采用“通道分割”并行处理每组的子特征。对于通道注意力分支,使用GAP生成通道统计数据,然后使用一对参数对通道向量进行缩放和移位。对于空间注意力分支,采用Group Norm生成空间统计数据,然后创建类似于通道分支的紧凑特征。然后将这两个分支连接起来。之后,所有子特征都被聚合,最后我们利用“通道洗牌”操作符来实现不同子特征之间的信息通信。

3.1 特征分组(Feature Grouping)

假设输入的特诊图(Feature map,通常由卷积操作得到)的尺寸为 ,则特征图:随后将C划分为G组(G通常为32或64),则对于其中的通道分量: