【Yolov5】Yolov5添加ASFF, 网络改进优化

Yolov5添加ASFF模块,有完整的使用说明,实验可行,可以提高模型性能

ChatGPT 的 10 种集成模式:从开源 AI 体验平台 ClickPrompt 中受到的启发

和国内外的很多公司一样,在 Open AI 公司开放了 ChatGPT API 接口之后,我们也在探索如何去结合到业务中。而在探索的过程中,我们发现了一个问题,大部分的业务人员并不了解 AI 的能力,所以我们开源构建了 ClickPrompt,以使 “普通人” 能更方便地了解 ChatGPT。围绕于

计算机视觉-OpenCV入门讲解

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智

unet模型及代码解析

什么是unet一个U型网络结构,2015年在图像分割领域大放异彩,unet被大量应用在分割领域。它是在FCN的基础上构建,它的U型结构解决了FCN无法上下文的信息和位置信息的弊端(下文细说)Unet网络结构主干结构解析左边为特征提取网络,右边为特征融合网络特征提取网络由两个3x3的卷积层(RELU)

YOLOV8-gradcam 热力图可视化 即插即用 不需要对源码做任何修改!

yolov8-gradcam热力图可视化,即插即用,不需要对源码做任何修改。代码仓库还有yolov5和yolov7的热力图可视化代码,也是不需要对源码做任何修改喔!

普通人如何用AI帮你干活——娱乐1

想跟大家介绍,作为一般的人没有太多编程技巧,对计算机和各种奇淫技巧的算法了解也不多的一般人。可以如何去利用AI,可以如何把问题作简单拆解和流程拆解让AI为我们服务。

使用ControlNet 控制 Stable Diffusion

本文将要介绍整合HuggingFace的diffusers 包和ControlNet调节生成文本到图像,可以更好地控制文本到图像的生成

AI无敌?人类的反击静悄悄。

前几年,alphago横扫围棋棋坛,人类棋手不得不接受现实。那么,按照AI的进步速度,我们当时也提过火车站台的比喻,呼啸而过,望尘莫及。从此,人类棋手输给AI不再是新闻,而且随着相关论文的发布和国内外各个技术团队的跟进,超越顶尖人类棋手的围棋AI已经越来越多,开源版,单机版,任何人都可以用一台稍微配

SwinIR实战:详细记录SwinIR的训练过程

SwinIR实战:详细记录SwinIR的训练过程。论文地址:https://arxiv.org/pdf/2108.10257.pdf预训练模型下载:https://github.com/JingyunLiang/SwinIR/releases训练代码下载:https://github.com/csz

pytorch模型保存与加载总结

pytorch模型保存与加载方式、打包保存tar、多卡训练遇到的问题、torch.jit、加载预训练模型、保存模型再加载精度损失

LSTM实现时间序列预测(PyTorch版)

为了训练数据,首先定义LSTM模型,然后再定义对应的损失函数,由于我们这里是风速预测,显然是个回归问题,所以采用回归问题常用的MESLoss(),如果可以的话,可以自定义损失函数,针对自己的项目需求定义对应的损失函数。对于优化器来讲,使用的也是目前常用的Adam优化器,对于新手来讲也可以多多尝试其它

如何让AI帮你干活-娱乐(2)

用AI生成一个视频

关于Attention的超详细讲解

文章目录一、动物的视觉注意力二、快速理解Attention思想三、从Encoder-Decoder框架中理解为什么要有Attention机制四、Attention思想步骤五、Self-Attention5.1 Self-Attention的计算步骤5.2 根据代码进一步理解Q、K、V5.3 再来一个

GhostNet v2(NeurIPS 2022 Spotlight)原理与代码解析

首先回顾下GhostNet,对于输入 \(X\in \mathbb{R}^{H\times W\times C}\),Ghost module将一个标准的卷积替换成两步。首先用一个1x1卷积生成intrinsic feature。

Python中函数参数传递方法*args, **kwargs,还有其他

本文将讨论Python的函数参数。我们将了解*args和**kwargs,/和*的都是什么,

大语言模型集成工具 LangChain

介绍:通过可组合性使用大型语言模型构建应用程序【背景】大型语言模型 (LLM) 正在成为一种变革性技术,使开发人员能够构建他们以前无法构建的应用程序,但是单独使用这些 LLM 往往不足以创建一个真正强大的应用程序,当可以将它们与其他计算或知识来源相结合时,就有真的价值了。LangChain 旨在协助

Python图像处理:频域滤波降噪和图像增强

快速傅里叶变换(FFT)是一种将图像从空间域变换到频率域的数学技术,是图像处理中进行频率变换的关键工具,本文将讨论图像从FFT到逆FFT的频率变换所涉及的各个阶段,并结合FFT位移和逆FFT位移的使用。

史上最全学习率调整策略lr_scheduler

学习率是深度学习训练中至关重要的参数,很多时候一个合适的学习率才能发挥出模型的较大潜力。所以学习率调整策略同样至关重要,这篇博客介绍一下Pytorch中常见的学习率调整方法。

机器学习:基于神经网络对用户评论情感分析预测

神经网络模型的思想来源于模仿人类大脑思考的方式。神经元是神经系统最基本的结构和功能单位,分为突起和细胞体两部分。突起作用是接受冲动并传递给细胞体,细胞体整合输入的信息并传出。人类大脑在思考时,神经元会接受外部的刺激,当传入的冲动使神经元的电位超过阈值时,神经元就会从抑制转向兴奋,并将信号向下一个神经

NoveAI本地环境搭建、AI作画

AI作画,总结下自己的操作过程