本文共 1742 字,大约阅读时间需要 5 分钟。
两点改进对结果提升比较大:
相比于YOLOv2,改进的地方有:引入了一个新的基础网络,bundingbox取最好预测框的去训练,其他框丢掉,用了FPN,丢掉了softmax改用二元交叉熵。
对小目标的检测效果提升明显
具体可以看论文
以下内容摘自知乎的回答
作者:石山潜
链接:https://www.zhihu.com/question/269909535/answer/471978963 来源:知乎
从算法角度补充两点,对比YOLO V3和SSD系列网络结构差异造成的效果的区别。
对比SSD,为何YOLO V3小物体的检测效果这么好?
不仅仅因为YOLO V3引入FPN结构,同时它的检测层由三级feature layers融合,而SSD的六个特征金字塔层全部来自于FCN的最后一层,其实也就是一级特征再做细化,明显一级feature map的特征容量肯定要弱于三级,尤其是浅层包含的大量小物体特征。 FSSD(SSD的变种改进)虽然也引入金字塔融合,但治标不治本,需要靠最后一层保留所有信息的压力没有减小例如SSD的金字塔融合版本FSSD,虽也有与YOLO V3类似的FPN结构,但它输入到回归层的信息量与SSD无差别,对再多的层做concat也只能补充SSD最后一层信息的不完整,却不能扩充总的特征“容量”。尤其是用类似COCO这样,训练数据很多是大物体的数据训练的模型,可以毫不客气的说SSD的主网络会在训练的时候自然而然的让VGG16的最后一层自动筛掉小物体。 YOLO V3主网络输入回归网络实现了多级输入,而非像SSD一样的单级YOLO V3则不一样,直接把浅层网络拉出来融合撸小物体,这样的结构解决了SSD检测小物体能力不佳的问题。YOLO V3为何在mAP与SSD相同的情况下速度快很多?
首先Darknet网络引入了residual结构,结构优势比VGG16不知高到哪里去了,所以如果SSD也用上精简的残差网络,再优化一下冗余的回归金字塔结构,速度也能快很多。另外我猜测使用logistic而不用softmax,对比SSD需要不断抑制background类数量过多而做出的计算上,速度也会更快一些,个人猜测,没有做实际论证。YOLO V3与SSD比有什么缺点?
可能是在大物体定位精度上稍微差一些,这个对比两者网络结构应该也不难看出,相信作者在下一代YOLO V4里会做出优化。总而言之作者还是很厉害的,几乎优化了单步检测所有可以优化的点,精度上干掉F-RCN,速度上干掉SSD,别人哪里强我就比它更强。依我个人看来,如果没有极具创新性的算法革新,短期内很难有能超过YOLO V3性能的了.注:有知道的大佬可以告知一下,感谢。我有时间做一下实验的话,知道后再来补上。
其他小目标检测相关论文笔记:
注:广泛阅读中,有好的优质论文,请各位大佬帮忙多多推荐!!
转载地址:http://ndxen.baihongyu.com/