【轻量化神经网络的MCU部署/边缘计算：基于GD32H7】开源GD32AI-ModelZoo工具的完善与详细使用说明

本文档将对gd32ai-modelzoo中的使用方法进行更加细致的介绍。并对原博主提供的gd32ai-modelzoo部分代码进行了修改，使其可以更加顺利地运行。

原开源工程地址：https://github.com/HomiKetalys/gd32ai-modelzoo
原作者博客：https://mbb.eet-china.com/forum/topic/140687_1_1.html

本文档开源工程地址：https://download.csdn.net/download/qq_44897194/89569963

阅读此文当前，请先仔细阅读gd32ai-modelzoo\object_detection\yolo_fastestv2目录中的README.md文件和原作者的博客，其中包含了目标检测工程的详细使用步骤。此文档只用于自己移植使用过程中的补充说明。并且此文档之研究了目标检测的代码，没有对分类任务的代码进行调整。
在这里插入图片描述
★★★后续文档中出现的代码指令或者python文件，若其中出现路径，都需要根据自己的实际路径进行修改。此点后续不再说明！！！

STEP1：下载GD32AI工程文件（推荐在Windows中进行）

★以下针对原gd32ai-modelzoo开源项目。若使用该修改后的工程可直接下载。
▲1. 安装GIT
▲2. 通过GIT CMD打开命令窗口
▲3. cd 命令定位到待保存的目录
▲4. 使用命令进行下载

git clone https://github.com/HomiKetalys/gd32ai-modelzoo

▲5. 使用命令初始化和更新工程中的部分文件（该项必须使用，否则工程不完整）。

git submodule update --init--recursive

完成后会发现，工程中的
gd32ai-modelzoo\common_utils\facelandmarks文件夹
gd32ai-modelzoo\common_utils\onnx2tflite文件夹
gd32ai-modelzoo\image_classfication\submodules\ml_fastvit文件夹
gd32ai-modelzoo\object_detection\submodules\Yolo_FastestV2文件夹
均被更新并已下载完相关文件。

若使用本文档配套代码，则不需要上述第5个指令，直接下载所有文件即可。

STEP2.1：下载和处理数据集（需要与训练时所用系统相同）

▲1. 从COCO数据集官网进行下载：https://cocodataset.org/#download
在这里插入图片描述
点击官网最上方的文件即可下载对应数据集文件：
我们只需要下载：

共3个文件。
（若直接点击无法下载，可能是被拦截，将其拖入新的标签页即可）
下载完整后，将其复制进想要保存的文件夹中，直接解压3个压缩包；
目录结构如下（略微进行了调整，删去了image文件夹）：

  COCO2017
  ├── train2017
  │   ├──000000000009.jpg
  |    ...
  │   └──000000581929.jpg
  ├── val2017
  │   ├──000000000139.jpg
  |    ...
  │   └──000000581781.jpg
  └── annotations
      ├── instances_train2017.json
      └── instances_val2017.json

▲2. 使用工程中的脚本文件gd32ai-modelzoo\common_utils\coco2yolo.py对数据集进行格式转换，
仔细观察COCO数据集文件结构和下方指令，补充好指令中“···”处的路径。

（特别注意：推荐输出保存的路径与原图片路径一致，否则之后的训练指令可能报错：数据集图片路径无法找到）

1.训练集转换
python coco2yolo.py --images_path"../../datasets/COCO2017/coco80/train2017"--json_file"../../datasets/COCO2017/coco80/annotations/instances_train2017.json"--ana_txt_save_path"../../datasets/COCO2017/coco80/train2017"--out_txt_path"../../datasets/COCO2017/coco80/train2017.txt"2.验证集转换
python coco2yolo.py --images_path"../../datasets/COCO2017/coco80/val2017"--json_file"../../datasets/COCO2017/coco80/annotations/instances_val2017.json"--ana_txt_save_path"../../datasets/COCO2017/coco80/val2017"--out_txt_path"../../datasets/COCO2017/coco80/val2017.txt"

也可以直接修改coco2yolo.py文件中的相关路径，然后直接运行指令 python coco2yolo.py
在这里插入图片描述
使用成功后就会发现，原数据集中多出了train2017.txt和val2017.txt两个文本文件，其中分别保存了数据集和验证集的原始图片路径；并且原数据集图片所在目录中，多出了保存每张图片对应标签的文本文件。

Windows指令：

python coco2yolo.py --images_path"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\train"--json_file"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\annotations\instances_train.json"--ana_txt_save_path"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\train"--out_txt_path"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\train.txt"
python coco2yolo.py --images_path"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\val"--json_file"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\annotations\instances_val.json"--ana_txt_save_path"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\val"--out_txt_path"C:\Users\DWY\Desktop\MCU_AI\datasets\OBSTACLE2024\obstacle_coco\val.txt"

Linux指令

python coco2yolo.py --images_path"/home/dwy/test/datasets/obstacle_coco/train"--json_file"/home/dwy/test/datasets/obstacle_coco/annotations/instances_train.json"--ana_txt_save_path"/home/dwy/test/datasets/obstacle_coco/train"--out_txt_path"/home/dwy/test/datasets/obstacle_coco/train.txt"
python coco2yolo.py --images_path"/home/dwy/test/datasets/obstacle_coco/val"--json_file"/home/dwy/test/datasets/obstacle_coco/annotations/instances_val.json"--ana_txt_save_path"/home/dwy/test/datasets/obstacle_coco/val"--out_txt_path"/home/dwy/test/datasets/obstacle_coco/val.txt"

STEP2.2：采集自己的数据集（推荐在Windows中进行）

▲1. 采集图片，可选择任意方式进行数据集图片采集，包括但不限于网络爬取、手机怕拍照采集、实际工程所用的摄像头采集。（若使用实际工程所用的摄像头进行采集，例如需要使用STM32 + OV5640进行识别，则可通过STM32的照相机实验进行图片采集，并保存到SD卡中）

▲2. 导出SD卡中的图片。（若使用STM32采集，则可能保存的时BMP格式图片，需要使用软件或脚本转换成JPG格式图片，此过程可自行百度。本工程使用的是迅捷图片转换软件：需要会员）

▲3. 创建数据集所需的文件夹结构，并存入原始JPG图片，文件夹结构目录如下（此处可自行设计）：

  OBSTACLE2024
  ├── obstacle_coco            （与COCO数据集格式相同）
  │   ├── annotations           (最后的COCO格式标签文件夹)
  │   ├── train                （训练集图片文件夹）
  │   └── val                  （验证集图片文件夹）
  │
  └── obstacle_labelme         （原始labelme所需文件夹结构）
      ├── raw_picture          （原始所有未划分的JPG图片）
      ├── labelmejson_train    （训练集labelme标签文件夹）
      ├── labelmejson_val      （验证集labelme标签文件夹）
      ├── train                （训练集图片文件夹）
      └── val                  （验证集图片文件夹）

▲4. 把采集到的原始图片全部复制到raw_picture文件夹中，进入gd32ai-modelzoo/common_utils文件夹，并运行指令：

python picture_divide.py

把原始图片按比例划分为训练集和验证集，并分别保存到OBSTACLE2024/obstacle_labelme/train和OBSTACLE2024/obstacle_labelme/val路径下（注意修改picture_divide.py中的路径和划分比例）
在这里插入图片描述
▲5. 使用labelme软件进行标签制作（该软件使用难度不大，网上有很多安装和使用教程）。

训练集标注：设置打开目录为OBSTACLE2024/obstacle_labelme/train；设置输出目录为OBSTACLE2024/obstacle_labelme/labelmejson_train。
验证集标注：设置打开目录为OBSTACLE2024/obstacle_labelme/val；设置输出目录为OBSTACLE2024/obstacle_labelme/labelmejson_val。

▲6. 标注完成后，进入gd32ai-modelzoo/common_utils文件夹，并运行指令：

python labelme2coco.py

根据实际的划分类别和在Labelme中做的标签，对字典进行修改：
在这里插入图片描述
把labelme格式的标注文件转换成coco格式的标注文件（注意修改labelme2coco.py文件中的训练集和验证集选择变量和路径，需要把Train_or_Test变量设置成0、1，各运行一遍程序，从而分别完成对训练集和验证集的转换。）
在这里插入图片描述
补充：labelme的标注文件是每张图片对应一个json文件，coco的标注文件将训练集/验证集的所有图片整合成一个json文件。

至此，制作自己的数据集已完成，后续可同样采用2.1中的步骤进行coco格式到yolo所需格式的转换

STEP3：模型训练（推荐在Linux服务器中进行，没有条件也可以使用Windows）

环境配置

建议使用anaconda创建虚拟环境进行环境配置（网上有很多教程）
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple（使用这个下载更快，且更容易找到包）
yolo_fastestv2所需

torchvision==0.10.0
tqdm==4.59.0
opencv_python==4.2.0.34
torchsummary==1.5.1（此包只有使用清华镜像才可以下载windows版本）
torch==1.8.1（同时需要搭配对应的cudatoolkit和cudnn）
numpy==1.19.5（此处有误，需要至少为1.23.4，否则导出模型时会出现module 'numpy' has no attribute 'object'）

onnx2tflite所需

onnx==1.10.0
onnxruntime
onnx-simplifier
numpy==1.19.5
tensorflow>=2.5（2.10也可以，不需要下载对应的cuda和cudnn，因为不需要使用tensorflow的gpu训练）
opencv-python
matplotlib（需要加上，源文件没有提到）
timm（需要加上，源文件没有提到）

生成YOLO所需的Anchors

进入gd32ai-modelzoo/object_detection/yolo_fastestv2文件夹
使用脚本genanchors.py，输入命令（注意修改输入模型的尺寸）

python genanchors.py --traintxt"{datasets_root}/COCO2017/train2017.txt"--output_dir"./"--label_flag"coco_80"--num_clusters6--input_width256--input_height256
linux系统中：
python genanchors.py --traintxt"/home/dwy/test/datasets/COCO2017/coco80/train2017.txt"--output_dir"./"--label_flag"coco_80"--num_clusters6--input_width256--input_height256
python genanchors.py --traintxt"/home/dwy/test/datasets/obstacle_coco/train.txt"--output_dir"./"--label_flag"abstacle"--num_clusters6--input_width192--input_height192
windows系统中：
python genanchors.py --traintxt"C:\Users\DWY\Desktop\test\datasets\COCO2017\coco80\train2017.txt"--output_dir"./"--label_flag"coco_80"--num_clusters6--input_width192--input_height192

会发现目录中出现anchors6.txt文件夹，其中包含了6个anchors的尺寸（修改配置文件时将用到）
可能出现错误：
错误1：AttributeError: module ‘numpy’ has no attribute ‘float’.
原因，numpy版本下载不正确，需要下载1.23.4

修改配置文件

修改gd32ai-modelzoo/object_detection/yolo_fastestv2/configs中的coco_sp.data文件：

[name]model_name=coco
[train-configure]epochs=200# 训练总epoch数，可自行修改steps=50,100# 多步学习率衰减相关参数，可自行修改batch_size=64# 批大小，可根据训练机器的性能自行修改subdivisions=1learning_rate=0.001# 学习率，可自行修改[model-configure]pre_weights= pretrain   # 预训练权重，可是这位None、pretrain或路径，可默认为pretrainclasses=80# 类别数，可根据数据集自行修改width=192# 输入宽度，可自行修改（需要与上面python genanchors.py指令中的设置相同）height=192# 输入高度，可自行修改（需要与上面python genanchors.py指令中的设置相同）anchor_num=3separation=4# 分离式结构（原博主说明该结构是为了减小最大RAM占用），先按默认设置进行训练部署separation_scale=2conf_thr=0.1nms_thr=0.5iou_thr=0.4anchors=6.96682733,10.72855861 ,21.39902717,28.37262097 ,31.57415048,74.69314652 ,71.51949295,118.82159896 ,77.94421348,43.19736247 ,154.48875554,139.59583662
# anchors修改为anchors6.txt文件中的内容[data-configure]label_flag=coco_80
train=C:\Users\DWY\Desktop\test\datasets\COCO2017\coco80\train2017.txt  # 修改为训练集的路径txt文件val=C:\Users\DWY\Desktop\test\datasets\COCO2017\coco80\val2017.txt      # 修改为验证集的路径txt文件names=./configs/coco.names                                              # 类别名字，若使用自制数据集需要修改

其余没有注释的参数可不用修改，理解代码后可根据需要修改。

训练

若直接通过Vscode运行程序出现路径无法找到的情况（调试模型时使用），可以参考该方法：https://www.cnblogs.com/justsoso8/p/17756421.html
但是此方法在使用debug调试运行时仍然无效，需要在main文件中开头添加下述代码：

import os
import sys
os.chdir(sys.path[0])

可以强制使工作目录设置为当前运行python文件所在目录。

在train.py开头添加路径，用于导入根目录中的库，否则会找不到common_utils

import sys
sys.path.append('../../')

输入指令：

python train.py --data configs/coco_sp.data

模型默认设置每10个epochs保存一次。
可通过修改gd32ai-modelzoo/object_detection/yolo_fastestv2/submodules\Yolo_FastestV2文件夹中的train.py进行修改
在这里插入图片描述
注意：定位损失使用CIOU可能会导致loss出现nan的情况导致训练失败，可切换为DIOU解决问题。

STEP4.1：导出模型并验证（该步骤用于验证元模型性能，若部署非必须）

先在pytorch2tflite.py开头添加路径，用于导入根目录中的库，否则会找不到common_utils

import sys
sys.path.append('../../')

务必注意修改modelzoo文件夹里配置文件【data文件】中训练集和验证集的路径，否则会出现路径报错

train=/home/dwy/test/datasets/COCO2017/coco80/train2017.txt
val=/home/dwy/test/datasets/COCO2017/coco80/val2017.txt

输入指令：输入为权重和模型，输出为onnx，tflite格式模型，convert_type为0是输出onnx，为1时先经过onnx再经过tflite。

 python pytorch2tflite.py --data ./modelzoo/coco_sp_0005/coco_sp.data --model_path ./modelzoo/coco_sp_0005/best.pth --convert_type1--tflite_val_path"../../../datasets/COCO2017/coco80/val2017"