【论文笔记】：YOLO v3-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

【论文笔记】：YOLO v3

阅读量：3904 次

发布时间：2019-05-23

本文共 1742 字，大约阅读时间需要 5 分钟。

&Title

在这里插入图片描述

&Summary

两点改进对结果提升比较大：

fpn的特征融合（借鉴FPN）

改基础网络（借鉴resnet）

相比于YOLOv2，改进的地方有：引入了一个新的基础网络，bundingbox取最好预测框的去训练，其他框丢掉，用了FPN，丢掉了softmax改用二元交叉熵。

对小目标的检测效果提升明显

具体可以看论文

&Results

在这里插入图片描述

YOLOv3的运行速度明显快于其他具有可比性能的检测方法。

在这里插入图片描述

虽然retinanet的精度高，但是它图像处理时间要长3.8倍。YOLOv3比SSD变种要好得多，可与AP50指标上的最新模型相媲美。

在这里插入图片描述

在精度差不多的情况下，推理时间远低于retinanet
（作者从resnet论文中拿了这张图，然后把自己的放在第二象限，想表达什么意思懂了吧哈哈哈哈哈哈）

&Notes

以下内容摘自知乎的回答

作者：石山潜
链接：https://www.zhihu.com/question/269909535/answer/471978963
来源：知乎

从算法角度补充两点，对比YOLO V3和SSD系列网络结构差异造成的效果的区别。

对比SSD，为何YOLO V3小物体的检测效果这么好？
不仅仅因为YOLO V3引入FPN结构，同时它的检测层由三级feature layers融合，而SSD的六个特征金字塔层全部来自于FCN的最后一层，其实也就是一级特征再做细化，明显一级feature map的特征容量肯定要弱于三级，尤其是浅层包含的大量小物体特征。

FSSD（SSD的变种改进）虽然也引入金字塔融合，但治标不治本，需要靠最后一层保留所有信息的压力没有减小例如SSD的金字塔融合版本FSSD，虽也有与YOLO V3类似的FPN结构，但它输入到回归层的信息量与SSD无差别，对再多的层做concat也只能补充SSD最后一层信息的不完整，却不能扩充总的特征“容量”。尤其是用类似COCO这样，训练数据很多是大物体的数据训练的模型，可以毫不客气的说SSD的主网络会在训练的时候自然而然的让VGG16的最后一层自动筛掉小物体。
YOLO V3主网络输入回归网络实现了多级输入，而非像SSD一样的单级YOLO V3则不一样，直接把浅层网络拉出来融合撸小物体，这样的结构解决了SSD检测小物体能力不佳的问题。

YOLO V3为何在mAP与SSD相同的情况下速度快很多？
首先Darknet网络引入了residual结构，结构优势比VGG16不知高到哪里去了，所以如果SSD也用上精简的残差网络，再优化一下冗余的回归金字塔结构，速度也能快很多。另外我猜测使用logistic而不用softmax，对比SSD需要不断抑制background类数量过多而做出的计算上，速度也会更快一些，个人猜测，没有做实际论证。

YOLO V3与SSD比有什么缺点？
可能是在大物体定位精度上稍微差一些，这个对比两者网络结构应该也不难看出，相信作者在下一代YOLO V4里会做出优化。总而言之作者还是很厉害的，几乎优化了单步检测所有可以优化的点，精度上干掉F-RCN,速度上干掉SSD，别人哪里强我就比它更强。依我个人看来，如果没有极具创新性的算法革新，短期内很难有能超过YOLO V3性能的了.

&Thinks

YOLOv3提升小目标检测精度的主要原因来自于引入了FPN？YOLOv3跟引入了FPN的其他一阶段检测器相比，小目标效果是不是差不多？？如果主要原因不是，那这个原因是不是可以用来改善FPN？

注：有知道的大佬可以告知一下，感谢。我有时间做一下实验的话，知道后再来补上。

关于提升小目标精度的，在特征融合这块，还可以继续怎么做？？增加浅层小目标信息？？？残差连接，保留底层信息？？？还有其他吗？？？

很多特征融合方面的论文，少不了各种的3 * 3卷积，1 * 1卷积等，应该搞清楚作用是啥，目的是啥，可以带来什么好处。这里等我有空总结总结吧，博主本人基础不太扎实（抱哭）！！！

……待补充

其他小目标检测相关论文笔记：

Residual BiFusion Feature Pyramid Network

……

注：广泛阅读中，有好的优质论文，请各位大佬帮忙多多推荐！！

转载地址：http://ndxen.baihongyu.com/

你可能感兴趣的文章

Net Remoting Singleton and Singlecall 区别

2016年安大校赛（补题）

BESTCODER ROUND92 1001.Skip the Class

POJ 1661 Help Jimmy

百练OJ 2755 神奇的口袋（递归+递推）

HDU 1003 Max Sum

Code Vs 1014 装箱

循环队列，队链的实现

HDU 2602 Bone Collector (01背包)

POJ 1837 Blance （01背包）

HDU 2456 饭卡（01背包）

HDU 1559 最大子矩阵

Open Judge 4010 :2011

百练OJ-2815 城堡问题【DFS】

CODE[VS] 1025 选菜【背包】

POJ 1724 ROADS【DFS+剪枝】

AOJ 847 整数拆段

AOJ 848 分数拆分

UVA 133 The Dole Queue 【约瑟夫环】

XDOJ 1208 B.笑爷买房【DFS】

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-18 07:43:37 当前IP: 18.116.8.169 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我