官方自带YOLOv5的半自动标注方法

这篇博文介绍一下YOLOv5自带的一个生成标签的方式，**前提是有一个已经训练好的权重！！**    1、权重可以来自官方提供的，比如v5的权重包含80类别，如果包含了你要训练的类别，就可以用官方权重去打标签；2、或者你的数据集打好一部分标签，自己先训练出一个权重，用训练出的权重去检测剩下的图片，生成标签文件等等。

1、利用现有的权重去检测图片，得到标签文件

找到YOLOv5的**detect.py**文件，以我下面检测行人为例，可以去官网下载YOLOv5X.pt，因为官方权重包括行人类，所有可以直接使用，这里建议下载最大的，因为检测精度高。

1.1修改相应参数

1、参数save-txt的末尾添加default = True，这个参数就是保存检测的标签文件。

parser.add_argument('--save-txt', action='store_true', help='save results to *.txt',default=True)

2、参数nosave的的末尾添加default = True，这个参数是是否保存检测后图片，设置不保存。

    parser.add_argument('--nosave', action='store_true', help='do not save images/videos',default=True)

3、然后官网权重是80类别，我现在只想检测行人，可以在pycharm的Termina运行该detect.py

时加上--classes 0,就是只检测行人这个类。

python detect.py --classes 0

4、接下来去找刚才的运行结果，一般默认保存在**run/detect/**文件夹下，存在一个labels文件，就是我们需要的标签文件。

2、对生成的标签文件使用IableImg进行微调

1、因为用初始权重得到的标签的坐标框信息可能存在一些误差，所以还需要进行手动微调，哈哈，是不是又回到了最开始的打标签的时候，这样其实已经能节约很多时间了。

2、将最开始测试图片和得到的labels文件夹放在一起，使用labelImg打开该文件夹。

打开labelImg之前，先在labels文件夹下手动创建一个classes.txt文件，里面写上你的类别名称，防止labelImg的闪退。

3、设置打开的图片文件夹，设置保存标签的文件夹，如下图

完成图片中1,2步后，第3步双击右侧图片，即可对框进行修改。

4、打开自动保存功能，如下图

3、将所有标签微调好了后，下面是对数据进行划分。

1、这里提供一个将数据划分为如下格式的脚本，也能用于v5的训练。图片如下

2、脚本如下：只需要改main函数中，文件路径、rate比列（训练集，验证集比列）。

import os
import random
import re
import shutil
def creat_files():
    try:
        shutil.rmtree('./data//images')
        shutil.rmtree('./data/labels')
    except:
        pass
    try:
        os.makedirs('./data/images/train')
        os.makedirs('./data/images/val')
        os.makedirs('./data/labels/train')
        os.makedirs('./data/labels/val')
    except:
        pass
def read_files(path):
    dir_list = os.listdir(path)
    for i in dir_list:
        #利用正则表达，切割出图片ID
        image_id = re.match(r'(.*)?.(jpg|png)',i).group(1)#图片后缀为jpg，png,可自行添加后缀格式
        labels_name = image_id+'.txt' #由图片ID找到对应标签名
        prob = random.randint(1, 100)#随机数prob
        if (prob < rate):  # train dataset
            old_images_path = path_images + '/' + i
            new_images_path = './data/images/train' + '/' + i
            old_labels_path = path_labels + '/'+ labels_name
            new_labels_path = './data/labels/train' + '/' + labels_name
            shutil.copy(old_images_path, new_images_path)
            shutil.copy(old_labels_path, new_labels_path)
        else:  # val dataset
            old_images_path = path_images + '/' + i
            new_images_path = './data/images/val' + '/' + i
            old_labels_path = path_labels + '/' + labels_name
            new_labels_path = './data/labels/val' + '/' + labels_name
            shutil.copy(old_images_path, new_images_path)
            shutil.copy(old_labels_path, new_labels_path)

if __name__ == '__main__':
    path_images = './images' #图片的路径
    path_labels = './labels' #标签路径
    rate = 90  # （1-100）之间，90即练集与验证集比例9:1，可以改成自己喜欢的比例
    creat_files()
    read_files(path_images)

3、运行脚本会在代码根目录生成一个data文件，里面划分好数据，如下：

4、可以直接把这个data文件夹剪切到YOLOv5中进行训练了。

标签：深度学习人工智能

本文转载自: https://blog.csdn.net/weixin_39357271/article/details/127066607
版权归原作者 爱学习的王同学# 所有，如有侵权，请联系我们删除。

官方自带YOLOv5的半自动标注方法

1、利用现有的权重去检测图片，得到标签文件

1.1修改相应参数

2、对生成的标签文件使用IableImg进行微调

3、将所有标签微调好了后，下面是对数据进行划分。

发表评论

“官方自带YOLOv5的半自动标注方法”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航