ICLR 2023 | 达摩院开源轻量人脸检测DamoFD
目前的NAS方法主要由两个模块组成,网络生成器和精度预测器。其中网络生成器用于生成候选的backbone结构,精度预测器用来对采样的backbone结构预测精度。由于检测和分类的任务目标不一致,前者更重视backbone stage-level (c2-c5)的表征,而后者更重视high-level
2022年 change detection遥感图像变化检测 论文附代码
动机:可用于训练CD模型的标注训练图像较少,应该注重从数百万免费可用的、无标记的、无策展的遥感图像中挖掘尽可能多的信息,以提高CD的准确性和鲁棒性。动机:可用于训练CD模型的标注训练图像较少,应该注重从数百万免费可用的、无标记的、无策展的遥感图像中挖掘尽可能多的信息,以提高CD的准确性和鲁棒性。介绍
Pytorch实战:基于鲸鱼WOA优化1DCNN的轴承故障诊断
采用1DCNN进行轴承故障诊断建模,并基于鲸鱼优化算法WOA对1DCNN的超参数进行优化,以实现更高的精度。建立一个两层的1DCNN,优化的参数包括学习率、训练次数、batchsize,卷积层1的核数量、核大小,池化层1的核大小,卷积层2的核数量、核大小,池化层2的核大小,全连接层1、全连接层2的节
chatgpt生成图片方法总结
Ganbreeder:这个网站使用GAN技术生成数字艺术品,但与Artbreeder不同的是,它让用户可以直接操作模型的参数和设置,生成更具个性化的图片。Artbreeder:这是一个非常流行的AI生成图片网站,它可以让用户使用GAN技术生成独特的数字艺术品。您可以选择不同的艺术风格、颜色方案、主题
torch.nn.Conv3d
torch.nn.Conv3d
深度学习零基础学习之路——第四章 UNet-Family中Unet、Unet++和Unet3+的简介
深度学习小白的学习之路,从零开始,一步一步向深度学习大佬靠近。学习使用Unet网络模型,并对其后续提出的Unet++、Unet3+进行对比学习。
深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention)
常用的注意力机制多为SE Attention和CBAM Attention。它们基本都可以当成一个简单的网络。例如SE注意力机制,它主要就是由两个全连接层组成,这就是一个简单的MLP模型,只是它的输出变了样。所以,在我们把注意力机制加入主干网络里时,所选注意力机制的复杂程度也是我们要考虑的一个方面,
基于so-vits-svc语音模型实现AI翻唱歌曲
使用so-vits-svc模型训练zutomayo的音色,让AI用这音色去翻唱其他歌曲
PyTorch 之 基于经典网络架构训练图像分类模型
我们可以进入 pytorch 的官方网站,对模型的基本架构和训练好的参数进行直接调用,具体链接如下。
DETR训练自己的数据集
本文记录利用官方提供的代码来训练验证自己的数据集的过程以及一些注意事项。该数据集原始的标签保存格式为yolo类型的txt文件,下面提供的代码能够实现数据集标签从txt文件到coco json格式的转化.该部分为利用训练得到的模型权重进行检测验证。在detr工程文件下的images文件夹存放所有待验证
【机器学习】yolov5训练结果分析
yolov5模型训练后的结果会保存到当前目录下的run文件夹下里面的train中下面对训练结果做出分析。
Transformer中的Q/K/V理解
详细解释了Transformer中的Q/K/V矩阵的作用和意义。
quality focal loss & distribute focal loss 解说(附代码)
quality focal loss
2022年顶会、顶刊SNN相关论文
2022年顶会、顶刊脉冲神经网络相关优秀论文收集
基础GAN实例(pytorch代码实现)
输出是长度为100的噪声(正态分布随机数)输出为(1,28,28)的图片linear1100---256linear2256--512linear3reshapenn.Tanh()#对于生成器,最后一个激活函数是tanh,值域-1到1)#定义前向传播#x表示长度为100的noise输入img=img
多目标跟踪MOT(Multiple Object Tracking)最全综述
多目标跟踪,一般简称为MOT(Multiple Object Tracking),也有一些文献称作MTT(Multiple Target Tracking)。在事先不知道目标数量的情况下,对视频中的行人、汽车、动物等多个目标进行检测并赋予ID进行轨迹跟踪。不同的目标拥有不同的ID,以便实现后续的轨迹
【前沿技术】文心一言 PK Chat Gpt
综上所述,文心一言和ChatGPT都是值得关注和研究的语言模型,它们在语言表达、适用场景和应用能力等方面都有自己的优缺点。在选择语言模型时,需要根据实际应用场。
智能优化算法:卷积优化算法-2023 附代码
将二维卷积运算引入智能优化算法的种群位置更新过程,提出一种新的智能优化算法,即卷积优化算法(Convolution Optimization Algorithm,COA)。该算法主要包括卷积搜索和解质量增强 2 种机制:在卷积搜索过程中,分别定义纵向卷积核、横向卷积核和区域卷积核,依次进行二维卷积运
Grad-CAM的详细介绍和Pytorch代码实现
Grad-CAM (Gradient-weighted Class Activation Mapping) 是一种可视化深度神经网络中哪些部分对于预测结果贡献最大的技术。它能够定位到特定的图像区域,从而使得神经网络的决策过程更加可解释和可视化。
Amazon SageMaker:搭建企业级AI模型的完整解决方案
和现有的机器学习平台相比,Amazon SageMaker核心在于快速构建、训练和部署机器学习应用,非常适合和各个应用领域结合,快速提供搭建企业级AI模型的完整解决方案