皮盼资讯网移动版

皮盼资讯网 > 潮流时尚 >

基于MaskRCNN算法的遥感图像舰船目标旋转检测(3)

需要指出的是,一般WS和GN是联合使用。从训练过程中AP的变化曲线可以看出,GN处理后的网络,AP大体上始终高于BN处理后的网络。这正是因为当图片批次较小时,BN估计的均值与方差不准确,使得网络的每个子网络输入的数据存在较大的差异,训练的效率较低,且验证集上的AP较低。由于分割任务较难,导致segm AP上的性能提升相对于bbox AP性能的提升较低。GN处理后的网络在两个指标上依然抖动剧烈,这从侧面验证了,WS的确可以平滑损失空间。由于损失空间的平滑,这使得网络收敛效果更好,在较短时间内可以找到局部最优点,网络训练效率提升。在训练初期可变卷积和正常卷积的性能相当,这是因为偏移量此时并没有学习好。但是随着偏移网络的逐渐学习,后期可变卷积的性能已大幅超越正常卷积。

从最优的模型各个检测指标可以看出,可变卷积大幅提高了网络的性能,在AP75指标上,可变卷积更是大幅度的提高了2.7个点。同时在segm AP指标上的性能提升,依然可观,提升了2.5个点。平均指标的收益大部分来源于这两个指标的贡献。实验结果表明,针对遥感图像中的不同的大小、姿态、视角变化甚至非刚体形变的问题,可变卷积可以有效的改善这些问题。

最终的网络,本文采用主干网络ResNeXt-101_32x8d,然后引入上述的三个模块对Mask RCNN网络进行改进,最终的Mask RCNN算法的性能表现如表3所示。

本文中的Mask RCNN算法并不能称之为严格的舰船目标实例分割,因为数据集的限制,并没有充分的精准的舰船目标轮廓标注数据,只能将舰船目标的选装框标注近似看作是掩模标注信息。这对于较小的舰船是适用的,因为旋转框与掩模标注相差不大,但是对于航母、护卫舰这种级别的舰船,轮廓标注的信息就有所缺失,这就导致训练的Mask RCNN模型有所偏差。

从检测结果可以看出Mask RCNN对于舰船轮廓的边缘缺失做到了有效的提取,实现了实例分割,但是小目标存在较大的漏警率,大目标和中等目标检测效果良好。

4 结论

在不增加网络深度和网络复杂度的条件下,使用了几种算法对Mask RCNN算法的性能进行提升。Mask RCNN算法由于模型较大,计算机的显存的限制,batch size一般为1,BN的使用将会带来较大的误差。为此引入GN对此问题进行改善,改善后的Mask RCNN算法性能有大幅度的提升,同时为了减小Lipschitz约束条件的常数,引用WS算法平滑损失函数空间。针对遥感目标不同的大小、姿态、视角变化,利用可变卷积对舰船目标特征偏移性采样。基于GN、WS、DC的对比实验,均显示了三种算法的优越性。最后采用复杂的主干网络联合这三种优化方法,实验结果显示Mask RCNN算法对大、中、小目标均达到较高的检测性能。

参考文献

[1] He K, Gkioxari G, Dollár P, et al. Mask r-cnn[C]. Proceedings of the IEEE international conference on computer vision. 2017: 2961-2969.

[2] Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 2117-2125.

[3] Wu Y, He K. Group normalization[C]. Proceedings of the European Conference on Computer Vision (ECCV). 2018: 3-19.

[4] Siyuan Qiao, Huiyu Wang, Chenxi Liu, Wei Shen, Alan Loddon Yuille. Weight Standardization. arXiv:1903.10520

[5] Jaderberg M, Simonyan K, Zisserman A. Spatial transformer networks[C]. Advances in neural information processing systems. 2015: 2017-2025.

[6] Dai J, Qi H, Xiong Y, et al. Deformable convolutional networks[C]. Proceedings of the IEEE international conference on computer vision. 2017: 764-773.

[7] Xia G S, Bai X, Ding J, et al. DOTA: A large-scale dataset for object detection in aerial images[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 3974-3983.

(责编:刘扬、赵光霞)

(责任编辑:admin)