YSODA算法
YSODA是基于多尺度融合的小目标检测算法,主要特征如下:通过应用特征金字塔网络(Feature Pyramid Networks,FPN)并降低采样率,对YOLO-v3算法进行改进以解决小目标检测精度低的问题、输入图像经过不同的卷积层和池化层,输出不同尺寸的特征图,分别对这些尺度不一的特征图进行预测,然后综合判断所有的预测结果。FPN选用的用来预测的特征图是将当前层的更深一层的特征图进行上采样后,再和当前层的特征图进行融合得到的特征图。
YOLO-v3没有充分利用浅层特征,而是增加网络深度,减少了浅层特征图所携带的细节信息,这会降低小目标检测的正确率。FPN可以将浅层和深层的特征图进行融合,使得到的浅层特征层也拥有深层的语义能力,且又不影响小物体的检测。因此,通过结合FPN能够利用各个层级特征图的特点,来提高YOLO-v3网络的对小目标的检测能力,提出了基于YOLO-v3的检测算法,简称为YSODA(YOLO-based Small Object Detection Algorithm)算法。
在基于YOLO-v3的Darknet-53主模型基础上,通过在其侧脸上增加FPN结构得到最终的小目标检测算法。首先,选取YOLO主模型Darknet-53中输出为64*64的具有残差结构的重复卷积层,其次在网络结构上增加FPN结构用于微小目标的检测;最后,将YOLO原有尺度的特征融合到从高级网络中新增提取的抽象特征中,完成最小尺度的微小目标检测结果的输出。
参考文献:仇梓峰,《基于计算机视觉的风机叶片表面损伤检测研究》,2019,北京交通大学