View on GitHub

blog

my blog

MaskRcnn

1,原理

2,loss

3,评价

原理

如下图:

image

其中黑色部分为原来的Faster-RCNN,红色部分为在Faster-RCNN网络上的修改。

将RoI Pooling 层替换成了RoIAlign层;添加了并列的FCN层(mask层)。

具体结构如下图:

image

包括以下几个部分:

1, FPN

2, RPN

3, RoIAlign

总结如下:

1, 骨干网络ResNet-FPN,用于特征提取,另外,ResNet还可以是:ResNet-50,ResNet-101,ResNeXt-50,ResNeXt-101;

1, 头部网络,包括边界框识别(分类和回归)+mask预测。头部结构见下图:

image

loss

image

具体参考 https://zhuanlan.zhihu.com/p/57759536 损失函数部分

评价

1, 精度十分高

2, 慢

参考

https://arxiv.org/abs/1703.06870

https://zhuanlan.zhihu.com/p/57759536

https://zhuanlan.zhihu.com/p/37998710

https://blog.csdn.net/qq_37392244/article/details/88844681