YOLO
YOLO的简介
YOLO是当前目标检测领域性能最优算法的之一,几乎所有的人工智能和计算机视觉领域的开发者都需要用它来开发各行各业的应用。
YOLO的优势在于又快又准,可实现实时的目标检测。
关于YOLO的介绍,可以看再2016年CVPR以及2017年的TED,这两个都是作者本人大佬亲自介绍,而且对YOLO的讲解非常简单清晰,时长很短,分别为13分钟以及7分钟。推荐首先观看TED视频,基础无需前置知识。链接如下:
2016-CVPR:
Youtube:https://www.youtube.com/watch?v=NM6lrxy0bxs
2017-TED
Youtube:https://www.youtube.com/watch?v=Cgxsv1riJhI
YOLO的优势
在2016年JR大佬的CVPR中,首先阐述的,是YOLO算法相比于R-CNN速度的提升:
上图通过对比阐述的意思在于2016年同一个机器根据不同的算法去处理一张图片是什么所需要的时间以及FPS。结合实际应用来看,若我们将其与自动驾驶领域相结合,我们必须选择最快识别的方案,因为自动驾驶领域对路况的实时识别与处理,对于时效性的要求极高。
图1:2017年TED-Joseph现场实测一个2秒钟才能检测出图片的算法的视频目标识别效果
上图可以明显的发现,在这个算法做出预测时,Joseph已经走出了很远;
图2:2017年TED-Joseph现场实测YOLO算法对视频做目标检测的效果
对比上一个算法,YOLO算法在Joseph移动时,可以顺利地追踪,而且可以适应不同地大小、姿势以及前后变化。
所以YOLO可以做到的是,对视频做实时目标检测。
YOLO为什么这么快
在过去,目标检测系统会将一张图片分成很多小区域,然后在每一块区域运行一下识别器,在识别器中获得最高分数的输出会作为这张图片的结果。但是一张图片上,需要识别上千次,以及上千次的神经网络评估才得到最终的结果。
而YOLO,可以同时生成边界盒和类别概率,不再需要上千次的识别与卷积,只需要一次,即 You Only Look Once。这也是YOLO名字的由来。而YOLO是如何实现的,请关注后续的博文!
一个运用YOLO V3检测目标的视频链接:https://www.bilibili.com/video/av39987782/?vd_source=0430935ec172299adfb0bef974e9022a
剩余部分将简单介绍一下YOLO的作者Joseph以及他的故事和YOLO的历史~
@YOLO 的作者:
Joseph Redmon 在西雅图的华盛顿大学,代表作 YOLO V1 & V2 & V3,该图片是 Joseph 在 TED 上的演讲,而正如图片所示,YOLO的全称是 You Only Look Once。同时,Joseph 也是一名热爱生活的爱狗人士,他有一只阿拉斯加雪橇犬 😃 同时就在这场 TED 演讲中,Joseph 退出了计算机视觉界的研究,所以 YOLO 的 V4与V5不再是他的更新内容。
@YOLO 的历史:
从2016年到2021年,YOLO已经更新换代有了五个版本,后面的版本都是在YOLO V1的基础上改进升级的,所以弄明白 YOLO V1是非常重要的,可以提一句的是,YOLO的V1到V3版本都是作者本人的成果。
2022.11.3
理工大学计算机系机房
版权归原作者 脚踏实地的大梦想家 所有, 如有侵权,请联系我们删除。