SA-NET: SHUFFLE ATTENTION FOR DEEP CONVOLUTIONAL NEURAL NETWORKS
Shuffle Unit结合了对通道间的注意力(Channel attention)和对空间的注意力(Spatial attention),随后所有的子特征被聚合并允许在不同的特征之间互相传递信息。
Shuffle Unit保证输入和输出的维度相同,方便将Shuffle Unit插入到任何需要引入注意力机制的地方。
在本章节,首先介绍了SA(Shuffle Attention)模块的构建过程,该模块将输入的特征映射分成若干组,并使用Shuffle Unit将对通道间的注意力(Channel attention)和对空间的注意力(Spatial attention)集成到每个组的一个块中。然后,对所有子特征进行聚合,并利用“通道洗牌”(Channel shuffle)操作符实现不同子特征之间的信息通信。然后,我们展示了如何对深层CNN使用SA模块。最后,通过仿真验证了该方法的有效性和可靠性。SA模块的总体架构如图2所示。
假设输入的特诊图(Feature map,通常由卷积操作得到)的尺寸为