前言
📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。
🚀对毕设有任何疑问都可以问学长哦!
选题指导: https://blog.csdn.net/qq_37340229/article/details/128243277
大家好,这里是海浪学长毕设专题,本次分享的课题是
🎯毕业设计-基于深度学习的花卉识别分类
课题背景和意义
近年来,互联网技术快速发展,微博、小红书和微信等社交网络平台的兴起,使网 络上充斥着各种人们用于记录生活的图片和视频。其中,图片作为重要的信息载体,成 为人们沟通外界的主要方式。网络中的图片数量繁多、信息丰富,如何从海量图片中筛 选需要的内容并运用于现实世界是人们关注的热点。随着网络技术的飞速发展,人们可以通过手机等设备方便地拍摄各类花卉图片,图 片的采集成本日益下降,海量的图像数据为融合了统计学、数据科学和计算机科学的机 器学习技术在花卉识别领域成为主流方法提供了支持。传统的机器学习方法获取花朵的 颜色、纹理和形状等整体特征,然后通过计算花卉图像之间的相似度来判断花卉的类别。 虽然这种方法可以实现花卉自动分类,但由于缺乏花卉局部特征信息,使得其对花卉的 识别不够准确。此外,花卉的全局特征仅是图像的表层信息,同一种花卉因为光照、拍 摄角度、尺度等因素的不同,常常造成识别效果不理想。 近年来,深度学习发展得如火如荼,许多研究人员提出基于深度学习的图像识别方 法,在众多图像分类数据集上取得很好的分类效果。
实现技术思路
一、花卉识别相关理论基础
数据集与评价指标
1、数据集
使用三个数据集,分别是来自中国植物主题数据库的五类花卉数据集、由牛津 大学视觉几何组提出的 Oxford-17 flowers 数据集和 Oxford-102 flowers 数据集。其中五 类花卉数据集总计 3670 张花卉图片,共分为五类,分别是雏菊、蒲公英、玫瑰、向日 葵和郁金香,每类包含 600-800 张图片,如表所示。
该数据集中的花卉图片尺寸不一致,背景多样,包含花卉的各个阶段、多个品种, 示例图见图。
Oxford-17 flowers 数据集和 Oxford-102 flowers 数据集于 2006 年提出,被广泛地应 用于花卉分类研究中。
Oxford-17 flowers 数据集示例图:
Oxford-102 flowers 数据集示例图:
2、评价指标
在分类问题中,准确率(Accuracy, Acc)、精确率(Precision, Pre)、召回率(Recall, Rec)和 F1 值是常用的评价指标,但其侧重点各有差异。
数据增强
数据集的数据量是制约深度学习网络性能的重要因素之一,大量数据有助于网络提 取更全面的特征,而较少的数据可能让网络产生过拟合风险。为此,研究人员提出数据 增强技术,通过变换原始数据样本,创造类似于训练样本但不同于训练样本的新样本扩充数据库。 使用 Mixup 数据增强方法对原始数据集进行扩充,Mixup 的原理公式为:
图片经 Mixup 数据增强方法处理前后的效果如图所示。
卷积神经网络模型
深度学习在计算机视觉中占有重要地位,将其运用到花卉图像识别中将大大提高识 别准确率。深度学习中的卷积神经网络是图像分类领域的重要组成部分。卷积神经网络 是一种以神经元为基础的多维数据处理网络。
图展示了一个简单的卷积神经网络 模型,它包括输入层、隐藏层和输出层,隐藏层通常包含卷积层和池化层。
1、ResNet
随着网络深度增加,网络特征提取能力增强,提取的特征越发抽象、所含语义信息 越发丰富,但网络误差在反向传播过程中不断累积,导致网络前几层梯度几乎等于 0, 不能收敛,具体表现为网络的精度逐渐饱和并迅速下降,这就是网络“退化”问题与普通网络相比,残差网络添加残差块,残差块包括直接映射和残差部分,直接映 射也称为跳跃连接,残差块结构如图所示。
卷积神经网络中的残差结构表达式为:
残差网 络通过跳跃连接增加梯度信息的传递,运用残差函数逼近恒等映射,从而训练更深的网 络,提升网络模型性能:
两种残差模块,如图所示,图a用于 ResNet-18 和 ResNet-34 浅层 次网络,但是深层次网络使用该结构,将增加许多计算量。ResNet-50 和 ResNet-152 等 深层次网络使用图b所示结构,先使用 1×1 卷积对输入进行降维,再经过 3×3 卷积, 最后将输入维度还原成原维度。
残差网络使用直接映射达到跳过某些层的目的,既保证网络之间数据传递畅通,又 使得网络梯度的传播更加顺畅,同时避免了因为梯度损失导致的拟合不足问题,不仅加 深了网络层数,还改善了模型表达性。ResNet 由一系列残差块构成,常见的有 18 层、 34 层和 50 层残差网络,50 层残差网络结构图如图所示。
2、ResNeXt
ResNet 通过堆叠相同拓扑结构的模块,减少超参数的过度使用及其对不同数据集适 应能力差的影响,再结合 Inception 的“分裂-变换-融合”结构能在计算复杂度更低的情 况下,达到接近大型密集层的表示能力。ResNeXt 在 ImageNet 上的表现优 于 ResNet。ResNeXt 与 ResNet 整体结构相似,不同的地方在于残差部分,ResNeXt 的 残差部分由分组卷积构成,如图所示。
ResNeXt 残差块计算公式为:
ResNeXt 在保留 ResNet 直接映射的基础上,将残差块的残差部分由单路径卷积扩 展至多路径分组卷积,后者遵循分裂、变换和融合模式。
残差块主线经过卷积后的输出必须与输入维度一致才能相加,因此遵循两个规则: (1)如果输入与主线输出维度一致,则直接映射直接将输入和主线输出相连接;(2) 如果输出通道数改变,则需要对直接映射进行卷积操作,直接映射带卷积的残差块如图所示。
3、DenseNet
介绍 ResNet 时曾提到网络退化问题,DenseNet[62]和 ResNet 拥有处理退化问 题一致的思想:在层与层之间创建直接映射,DenseNet 将这一思想发挥到极致——连接 一个块中的所有层,即每一层输入与前面所有层的输出在通道维度上连接,而该层的输 出也将作为输入传递给后续所有层,整个过程实现了特征的复用,加强了特征的传播, 提升了效率。
DenseNet 中第 l 层接收来自先前所有层的特征输入,之后通过卷积操作得到输出,即:
图显示了 DenseNet 网络的总体结构:
4、EfficientNet
扩展卷积神经网络可以获得更高的精度,目前常用的扩展方法包括:增加网络深度、 扩大网络宽度和放大分辨率。以前的许多网络只对三个维度之一进行放大,虽然之前的 工作尝试扩展网络的深度和宽度,但实际操作需要人工调整,而且通常无法实现最 优的准确率。
含有k 层卷积层的卷积网络 N 可以表示为:
二、**基于 ****ResNeXt **和迁移学习的花卉种类识别
基于 ResNeXt 和迁移学习的花卉种类识别模型
1、迁移学习
使用迁移学习相比从头训练不仅训练 速度更快,识别准确率也可得到较大提升。目前,迁移学习已在花卉识别问题上取 得成功应用。迁移学习流程示意图如图所示:
2、分组卷积与 ResNeXt 卷积模块
(1)分组卷积
2012 年,获得 ILSVRC 分类项目冠军的 AlexNet 首次提出了分组卷积,所谓分组卷 积即对输入的特征按通道维度分组,并对每组特征分别进行卷积,最后将卷积后的特征 在通道维度进行拼接。普通卷积和分组卷积具体操作如图所示。
普通卷积的计算量 F 如公式所示,参数量 C 如公式所示。
分组卷积的计算量 F '如公式所示,参数量C'如公式所示。
(2)ResNeXt 卷积模块
ResNeXt 结合 Inception 网络“分裂-变换-融合”思想和 ResNet 残差模块思想,实 现了高度模块化。网络由一系列具有相同拓扑结构的残差块组成,残差块遵循两条规则: 当生成大小一致的空间映射时,残差块中的拓扑结构共享超参数(如宽度和卷积核大小); 当空间映射基于因子 2 下采样时,残差块中的拓扑结构宽度加倍。
3、密集连接模块
密集连接模块主要用于整合 ResNeXt 卷积模块提取到的特征,并将输出特征送入全 连接网络,该模块本质是一个包含若干层 bottleneck 的 DenseBlock,图展示了含有 n 层 bottleneck 的 DenseBlock 具体形式:
4、深度网络总体框架
本章提出的花卉分类模型主要致力于对花卉图形进行更鲁棒、更具泛化性的分类。 构建的分类模型结构如图3.4所示。该模型由ResNeXt-50卷积模块和密集连接模块组成, 预训练的 ResNeXt-50 卷积模块可更快地提取浅层特征,密集连接模块充分利用深层特 征,通过特征复用提高对花卉的特征表达能力,最后将特征输入到全连接层,再使用 Softmax 完成分类,输出准确率和损失函数值,随后更新权值参数值。
三、**基于 ****EfficientNet **和迁移学习的花卉种类识别
基于 EfficientNet 和迁移学习的花卉种类识别模型
1、EfficientNet 模块
卷积神经网络的构建受资源限制,在资源增加的情况下,提高卷积神经网络精度的 常用方法是扩大网络规模,主要包括三个方面:网络的深度、宽度和输入图像的分辨率。 过去的工作基于实验和经验探索新网络结构,人为地调整三者。但是如何平衡这三者十 分困难,直至 Tan 等在 ICMI 2019 上提出 EfficientNet。
(1)移动翻转瓶颈卷积
MBConv 移动翻转瓶颈卷积由一个 1×1 普通升维卷积、一个 k×k 深度可分离卷积、一个 SE 模块、一个 1×1 普通降维卷积和一个 Dropout 层组成,结构如图所示:
(2)EfficientNet 卷积模块
EfficientNet 卷积模块主要用于提取花卉图像特征,该模块主要是移动翻转瓶颈卷积 的堆叠。本章在原 EfficientNet 基础上,去除最后的平均池化层和全连接层。表显示 了 EfficientNet-B2 卷积模块结构框架。
2、SE 模块
卷积神经网络的卷积操作融合局部区域的空间特征和通道特征,其工作重点是增大 感受野,即在空间上融合更多特征。 SE 模块分为压缩(Squeeze)、激励(Excitation)和 标准化权(Scale)三部分,模块使用全局信息对不同维度的特征进行差异化加权学习, 建立表达能力更强的特征,激励对任务更重要的特征,抑制对任务不那么重要的特征。
3、FBSM 特征增强和抑制模块
基于注意力机制的提取特征方法往往只关注最显著部分的特征,而忽略其他不明显 但可识别部分的特征。然而,当屏蔽或抑制最显著部分特征表达时,模型将被迫挖掘其 他潜在特征。基于这个简单有效的思路,Song 等提出了 FBSM 模块。
(1)获得最显著特征图
(2)获取被抑制的潜在特征图
4、FDM 特征多样化模块
直观地说,只关注单独的局部特征而忽略其相互关系不利于最后的分类效果。针对 这一问题,引入 FDM 模块实现每个局部特征的多样化表达。具体实施方式为融合从其 他局部特征中挖掘的互补信息来增强每个局部特征。FBSM 模型示意图:
5、深度网络总体框架
EfficientNet 共有 8 个 Stage,仅 Stage1、Stage3、Stage4、Stage6 和 Stage8 缩减了输 入特征图一半的空间,考虑到网络深层有更多的语义信息,将 FBSM 分别插入 Stage4、 Stage5 和 Stage8 末尾。经过 FBSM 模块得到的三个显著特征图输入 FDM 模块,获得三 个与输入特征图互补的输出特征图,将三个输出特征图分别送至 SE 模块,结果分为两 路,一路经过全局平均池化层,送入三个分类器,另一路经过平均池化层将结果变为大 小一致的张量,再相加送入分类器。总体框架图如图所示。
实现效果图样例
花卉识别分类:
我是海浪学长,创作不易,欢迎点赞、关注、收藏、留言。
毕设帮助,疑难解答,欢迎打扰!
最后
版权归原作者 HaiLang_IT 所有, 如有侵权,请联系我们删除。