YOLO V5 改进详解

YOLO V5

Backbone

SPPF

在这里插入图片描述

SPP 是使用了3个kernel size不一样大的pooling 并行运算。SPPF是将kernel size为5的 pooling 串行运算，这样的运算的效果和SPP相同，但是运算速度加快。因为SPPF减少了重复的运算，每一次的pooling 运算都是在上一次运算的基础上进行的。

CSP-PAN neck

在YOLO V4中，作者仅仅使用了PAN模块，在PAN中的卷积操作为一般卷积操作。而在YOLO V5中，PAN中的卷积操作换为了CSP。如图，上图为YOLO V4中的PAN模块，下图为YOLO V5的CSP-PAN模块。

在这里插入图片描述
YOLO V5 CSP-PAN模块

在这里插入图片描述

Loss Function

Loss function 的组成和YOLO V3一样，同样是由

Classes loss

Objectness loss

Location loss

.
改进：

Location Loss 采用的是 CIOU Loss.
Objectness Loss 在YOLO V3中将IOU最大的设为正样本，将IOU小于阈值的设为负样本，其他的都不考虑。而在YOLO V5 中是计算所有样本的obj损失，采用CIOU作为标准。
对于Objectness Loss 同时也平衡了不同尺度的损失，针对三个预测特征层上的obj损失赋予不同的权重。 L o b j = 4.0 ⋅ L o b j s m a l l + 1.0 ⋅ L o b j m e d i u m + 0.4 ⋅ L o b j l a r g e L_{obj} = 4.0 \cdot L^{small}{obj} +1.0 \cdot L^{medium}{obj}+0.4 \cdot L^{large}_{obj} Lobj=4.0⋅Lobjsmall+1.0⋅Lobjmedium+0.4⋅Lobjlarge

横纵比偏移优化

在YOLO V4对于x, y进行了优化使其对极限值0和1更加敏感一些。然而，对于横纵比同样存在问题，原始的公式中仅使用

      e 
     
    
      x 
     
    
   
  
    e^x 
   
  
ex 来进行偏移，这样会导致偏移量没有限制，变得十分敏感。
  
   
    
     
      
       
        
         
         
           b 
          
         
           w 
          
         
        
          = 
         
         
         
           p 
          
         
           w 
          
         
         
         
           e 
          
          
          
            t 
           
          
            w 
           
          
         
        
       
      
     
     
      
       
        
         
         
           b 
          
         
           h 
          
         
        
          = 
         
         
         
           p 
          
         
           h 
          
         
         
         
           e 
          
          
          
            t 
           
          
            h 
           
          
         
        
       
      
     
    
   
     \begin{aligned} b_w = p_we^{t_w}\\ b_h = p_he^{t_h} \end{aligned} 
    
   
 bw=pwetwbh=pheth

而在 YOLO V5中对横纵比的偏移进行了优化，将其变成如下：

           b 
          
         
           x 
          
         
        
          = 
         
        
          2 
         
        
          σ 
         
         
         
           ( 
          
          
          
            t 
           
          
            x 
           
          
         
           ) 
          
         
        
          − 
         
        
          0.5 
         
        
          + 
         
         
         
           c 
          
         
           x 
          
         
        
       
      
     
     
      
       
        
         
         
           b 
          
         
           y 
          
         
        
          = 
         
        
          2 
         
        
          σ 
         
         
         
           ( 
          
          
          
            t 
           
          
            y 
           
          
         
           ) 
          
         
        
          − 
         
        
          0.5 
         
        
          + 
         
         
         
           c 
          
         
           y 
          
         
        
       
      
     
     
      
       
        
         
         
           b 
          
         
           w 
          
         
        
          = 
         
         
         
           p 
          
         
           w 
          
         
         
          
          
            ( 
           
          
            2 
           
          
            σ 
           
           
           
             ( 
            
            
            
              t 
             
            
              w 
             
            
           
             ) 
            
           
          
            ) 
           
          
         
           2 
          
         
        
       
      
     
     
      
       
        
         
         
           b 
          
         
           h 
          
         
        
          = 
         
         
         
           p 
          
         
           h 
          
         
         
          
          
            ( 
           
          
            2 
           
          
            σ 
           
           
           
             ( 
            
            
            
              t 
             
            
              h 
             
            
           
             ) 
            
           
          
            ) 
           
          
         
           2 
          
         
        
       
      
     
    
   
     \begin{array}{c} b_{x}=2 \sigma\left(t_{x}\right)-0.5+c_{x} \\ b_{y}=2 \sigma\left(t_{y}\right)-0.5+c_{y} \\ b_{w}=p_{w}\left(2 \sigma\left(t_{w}\right)\right)^{2} \\ b_{h}=p_{h}\left(2 \sigma\left(t_{h}\right)\right)^{2} \end{array} 
    
   
 bx=2σ(tx)−0.5+cxby=2σ(ty)−0.5+cybw=pw(2σ(tw))2bh=ph(2σ(th))2

这在一定程度上限制了横纵比的偏移，YOLO V5作者所做的实验曲线如下。
在这里插入图片描述

正负样本选取

在YOLO V4的拓展基础上，YOLO V5 对正样本的选取同时加入了横纵比的限制。

           r 
          
         
           w 
          
         
        
          = 
         
         
         
           w 
          
          
          
            g 
           
          
            t 
           
          
         
        
          / 
         
         
         
           w 
          
          
          
            a 
           
          
            t 
           
          
         
        
       
      
     
     
      
       
        
         
         
           r 
          
         
           h 
          
         
        
          = 
         
         
         
           h 
          
          
          
            g 
           
          
            t 
           
          
         
        
          / 
         
         
         
           h 
          
          
          
            a 
           
          
            t 
           
          
         
        
       
      
     
     
      
       
        
         
         
           r 
          
         
           w 
          
         
           max 
          
         
           ⁡ 
          
         
        
          = 
         
        
          max 
         
        
          ⁡ 
         
         
         
           ( 
          
          
          
            r 
           
          
            w 
           
          
         
           , 
          
         
           1 
          
         
           / 
          
          
          
            r 
           
          
            w 
           
          
         
           ) 
          
         
        
       
      
     
     
      
       
        
         
         
           r 
          
         
           h 
          
         
           max 
          
         
           ⁡ 
          
         
        
          = 
         
        
          max 
         
        
          ⁡ 
         
         
         
           ( 
          
          
          
            r 
           
          
            h 
           
          
         
           , 
          
         
           1 
          
         
           / 
          
          
          
            r 
           
          
            h 
           
          
         
           ) 
          
         
        
       
      
     
     
      
       
        
         
         
           r 
          
         
           max 
          
         
           ⁡ 
          
         
        
          = 
         
        
          max 
         
        
          ⁡ 
         
         
         
           ( 
          
          
          
            r 
           
          
            w 
           
          
            max 
           
          
            ⁡ 
           
          
         
           , 
          
          
          
            r 
           
          
            h 
           
          
            max 
           
          
            ⁡ 
           
          
         
           ) 
          
         
        
       
      
     
    
   
     \begin{array}{l} r_{w}=w_{g t} / w_{a t} \\ r_{h}=h_{g t} / h_{a t} \\ r_{w}^{\max }=\max \left(r_{w}, 1 / r_{w}\right) \\ r_{h}^{\max }=\max \left(r_{h}, 1 / r_{h}\right) \\ r^{\max }=\max \left(r_{w}^{\max }, r_{h}^{\max }\right) \end{array} 
    
   
 rw=wgt/watrh=hgt/hatrwmax=max(rw,1/rw)rhmax=max(rh,1/rh)rmax=max(rwmax,rhmax)

在这里插入图片描述
首先算出anchor和GT的横纵比的最大差距，对于最大差距在4倍以上的例子都不作为正样本采用。

标签：深度学习人工智能目标检测

本文转载自: https://blog.csdn.net/leeyns/article/details/128104030
版权归原作者 leeyns 所有，如有侵权，请联系我们删除。

YOLO V5 改进详解

YOLO V5

Backbone

SPPF

CSP-PAN neck

Loss Function

横纵比偏移优化

正负样本选取

发表评论

“YOLO V5 改进详解”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航