基于Wav2Lip+GFPGAN的高清版AI主播
继上一篇的内容之后很多小伙伴反应一个问题就是生成的AI人物并不是很清晰,尤其是放到编辑器里会出现明显的痕迹,因此这次带来的了高清版的内容,如果不太了解这个项目实做什么的可以来先看一下效果。该项目暂时没有中文介绍,我这个应该是首发。基于Wav2Lip自制高清版,用自己形象做数字人清楚多了虽然说是自制但
【图像异常检测】 Anomalib
图像异常检测综述
目标检测算法——YOLOv5/YOLOv7改进之结合ASPP(空洞空间卷积池化金字塔)
目标检测算法——YOLOv5/YOLOv7改进之结合ASPP。ASPP对所给定的输入以不同采样率的空洞卷积并行采样,相当于以多个比例捕捉图像的上下文。
【深度学习】——LSTM参数设置
LSTM的批大小可以根据训练数据集的大小和计算资源的限制来确定。一般而言,批大小,训练速度越快,但可能会导致过拟合和内存限制。批大小越小,训练速度越慢,但对于较大的数据集和内存限制较严格的情况下会更加稳定。在实践中,可以通过尝试不同的批大小来找到最优的批大小。一种常用的方法是开始使用较小的批大小,然
扩散模型与生成模型详解
详细介绍了扩散模型的原理及其使用
DenseNet代码复现+超详细注释(PyTorch)
DenseNet代码复现(PyTorch),每一行都有超详细注释,新手小白都能看懂,亲测可运行
涨点技巧:Detect系列---Yolov5/Yolov7加入ASFF特征金字塔融合方法,涨点明显
多尺度特征特别是特征金字塔FPN是解决目标检测中跨尺度目标的最常用有效的解决方法,特征金字塔融合方法ASFF与yolov5/yolov7结合可以有效涨点
ChatGPT的平替来了?一文总结 ChatGPT 的开源平替,你值得拥有
2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。再加上前段时间 GPT-4 的发布,ChatGPT 也有了更强大的推理和多模态能力,OpenAI 几乎不可能将其开源。然而,表现欠佳的「其他」阵营却一直在做开源方面的努力。本文总结了目前业界开源且适合中文
GPT-4 介绍
本文根据openAI的2023年3月的《GPT-4 Technical Report 》翻译总结的。原文确实没有GPT-4 具体的模型结构,openAI向盈利组织、非公开方向发展了。也没透露硬件、训练成本、训练数据、训练方法等。不过也透露了一些思想,比如提出了根据模型小的时候,预测模型大的时候的表现
使用YOLOV5训练自己的数据集(以王者荣耀为例)
使用yolov5训练自己的数据集
YOLOV8——快速训练指南(上手教程、自定义数据训练)
本篇主要用于说明如何使用自己的训练数据,快速在YOLOV8 框架上进行训练。当前(20230116)官方文档和网上的资源主要都是在开源的数据集上进行测试,对于算法“小白”或者“老鸟”如何快速应用到自己的项目中,这个单纯看官方文档显得有点凌乱,因为YOLOV8 不再致力于做一个单纯算法,而是想要做一个
模糊神经网络(FNN)的实现(Python,附源码及数据集)
本文对模糊神经网络(FNN)的理论基础及建模步骤进行介绍,之后使用Python实现基于FNN的数据预测,通俗易懂,适合新手学习,附源码及实验数据集。
Pytorch1.7复现PointNet++点云分割(含Open3D可视化)(文末有一个自己做的书缝识别项目代码)
毕设需要,复现一下PointNet++的对象分类、零件分割和场景分割,找点灵感和思路,做个踩坑记录。
RGB与Depth融合方法总结
RGB与Depth融合方法汇总
基于小波时频图和2D-CNN的滚动轴承故障检测
轴承故障诊断 附python和matlab代码
亲测有效解决torch.cuda.is_available()返回False的问题(分析+多种方案),点进不亏
文章目录解决torch.cuda.is_available()返回False出现返回False的原因问题1:版本不匹配问题2:错下成了cpu版本的(小编正是这种问题)解决方案方案一方案二解决torch.cuda.is_available()返回False出现返回False的原因问题1:版本不匹配电脑
对比学习MoCo损失函数infoNCE理解(附代码)
对比学习MoCo损失函数infoNCE理解
机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)
余弦距离(Cosine Distance)也可以叫余弦相似度。 几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。nnn维空间中的余弦距离为:cos(x,y)=x⋅y∣x∣⋅∣y∣=
SA的空间注意力和通道注意力
包括空间注意力和通道注意力,目的是选择细粒度的重要像素点,是pixel级。:是 local 注意力,致力于搜索粗糙的潜在判别区域,它们是region级。一般来说对于同一像素点不同通道求均值,再经过一些卷积和上采样的运算得到spitial attention mask,空间特征每层像素点被赋予不同的权
【图像分割】Segment Anything(Meta AI)论文解读
Segment Anything(SA)项目:一个图像分割新的任务、模型和数据集。建立了迄今为止最大的分割数据集,在11M许可和尊重隐私的图像上有超过1亿个mask。该模型的设计和训练是灵活的,因此它可以将zero-shot(零样本)转移到新的图像分布和任务。实验评估了它在许多任务上的能力,发现它的