SSD 目标检测算法
SSD(Single Shot MultiBox Detector)目标检测算法是 2016 年 Liu W 等提出的一种one-stage的深度学习的目标检测算法,并添加了多尺度检测的方式提高不同尺度下的目标检测能力。SSD目标识别算法采用VGG-16作为特征提取网络,去除了末端的2个全连接层,改用3个卷积层进一步提取特征,同时减小特征图的尺寸。为了提高对尺度变化较大的目标的泛化能力,SSD使用了6个不同尺度的特征图进行检测。而在预选框(prior box)生成策略上, SSD 借鉴了Faster R-CNN的 anchor 策略, 在不同尺度的特征图上分别生成4至6个不同大小和不同长宽比的anchor框作为边框回归的预选框,非常好的适应了不同长宽比的目标物体, 有效的提高了检测的效果。
注意力机制
注意力机制(attention)的本质来自于人类只根据需 求观察特定部分的视觉机制。2014年Google DeepMind团队提出了循环注意力模型,将Attention机制引入RNN用于图像分类并取得了良好的效果。2018年,Hu J等提出了SENet,通过在通道间添加注意力机制来 标定不同通道的重要程度,然后依靠添加不同的权重 去提升高效特征并抑制低效特征.
SENet 通过Squeeze和Excitation两个操作对每个同通道的相互依赖关系进行建模。其中Squeeze操作是进行了一个全局池化,相当于采用了全局感受野来令其具有全局信息特征。随后Excitation 操作通过全连接层和Sigmoid函数来表征每个特征通道的相关性。最后通过Reweight操作将输出的权重通过逐点相乘加权到先前的特征上,令原始特征得以重标定.
SSD和注意力机制的结合算法
本文提出的基于轻量级 SSD 的电力设备锈蚀目标检测算法在标准 SSD 的基础上结合MobileNet的深度可分离卷积进行轻量化操作,同时为保证检测精度不受影响,利用注意力机制和concat方式对多尺度特征进行融合。
标准 SSD 采用扩展的VGG-16网络作为特征提取网络,VGG-16 采用的是密集连接的标准卷积方式。而深度可分离卷积是MobileNet 的基本组成块,利用了分解卷积的方法对过参数化的标准卷积进行压缩.首先采用1×1大小的卷积核先对每一个通道进行卷积操作,再使用3×3大小的卷积核进行通道间的信息交流。通过将标准卷积中的乘法分解为加法的方式在不损失精度的情况下有效的减少大量参数.同时将激活函数由ReLU更换为性能更加优越的h-swish 函数。
参考文献:吴之昊,熊卫华,任嘉锋,等.基于轻量级SSD的电力设备锈蚀目标检测[J].计算机系统应用,2020,29(02):262-267.