pytorch复习笔记--nn.Embedding()的用法

nn.Embedding()产生一个权重矩阵weight,其shape为(num_embeddings, embedding_dim),表示生成num_embeddings个具有embedding_dim大小的嵌入向量;输入input的形状shape为(batch_size, Seq_len),ba

使用Dino+SAM+Stable diffusion 自动进行图片的修改

SAM 可以准确识别和提取图像中的对象,与Stable Diffusion 相结合,可以对分割后的图像进行细微的更改。

vscode运行.ipynb代码时提示需要安装ipykernel包的解决办法

此文目的是为了记录遇到的一些问题,也希望能帮助到和我一样遇到困难的同学。如需转载,请注明出处。在使用vscode运行.ipynb文件中提示需要安装ipykernel包的提示,在网上查询了很多方法之后也是终于解决了问题。写下这篇博客也希望能帮到大家。

Swin Transformer之相对位置编码详解

Swin Transformer中非常核心之一即为相对位置编码,在此我将试图将其掰开了揉碎了进行讲解,尽可能以比较形象的方式进行理解。

PyTorch深度学习实战 | 基于深度学习的电影票房预测研究

基于深度学习的映前票房预测模型(Cross&Dense网络结构模型),该模型通过影片基本信息如:电影类型、影片制式、档期和电影的主创阵容和IP特征等信息对上映影片的票房进行预测。本篇采用451部电影作为训练模型,最后再在194部影片上进行测试,模型的绝对精度为55%,相对精度为92%。该模型在使用相

阿里巴巴达摩院通义千问【附申请链接】阿里版ChatGPT

阿里云作为数一数二的全球云平台,阿里的大语言模型通义千问还是值得期待的,凭借强大的算力支持还是有机会赶上人工智能发展浪潮。早前阿里巴巴达摩院关于人工智能机器人的研讨信息引起不少关注,当时达摩院也对比测试百度的文心一言。现在阿里巴巴自己的人工智能机器人也上线开测,正式名称为通义千问,由阿里巴巴达摩院研

stable diffusion打造自己专属的LORA模型

通过Lora小模型可以控制很多特定场景的内容生成。但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。甚至可以训练一个专属家庭版的模型(family model),非常有意思。将自己的训练好的Lora模型放到stableDiffusion lora 目录中,同时

一键式AI绘画,让你也能体验当画师的魅力(附原理分析)

AI绘画无疑在最近掀起了一阵热潮,本篇文章首先提供了一个一键式的AI绘画功能包,能够轻松让大家完成AI绘画的操作,在演示之后也分析AI绘画内部所蕴含的AI知识原理。

多模态模型学习1——CLIP对比学习 语言-图像预训练模型

学了一些多模态的知识,CLIP算是其中最重要也是最通用的一环,一起来看一下吧。CLIP的全称是Contrastive Language-Image Pre-Training,中文是对比语言-图像预训练,是一个预训练模型,简称为CLIP。该模型是 OpenAI 在 2021 年发布的,最初用于匹配图像

深度学习中的各种数据增强方法大全

深度学习中的各种数据增强方法大全

yolov7环境搭建——Windows

Windows下深度学习环境搭建

GPT-4 VS ChatGPT:训练、性能、能力和限制的探索

GPT-4是一种改进,但是应该适当降低期望当OpenAI在2022年末推出ChatGPT时,震惊了全世界。这个新的生成式语言模型预计将彻底改变包括媒体、教育、法律和技术在内的整个行业。简而言之,ChatGPT听起来可以颠复一切。甚至在我们没有时间真正设想一个ChatGPT后的世界之前,OpenAI又

DeepSpeed配置参数 - 快速上手

针对DeepSpeed的几组重要的参数进行说明

Pytorch运行过程中解决出现内存不足的问题

1. 前提利用Transformer模型进行O3浓度的反演2. 问题2.1 速度慢一开始模型是在CPU上面跑的,为了加快速度,我改成了在GPU上跑方法如下:1、验证pytorch是否存在GPU版本在Pycharm命令行输入import torchprint(torch.cuda.is_availab

chat gpt 常见角色及对应的提示词汇总

提示词的存在让ChatGPT能够扮演特定的角色,对用户的回答更加专业对口。

Segment Anything阅读笔记

这篇文章最近有点火,已经有1万多star了。

机器学习数据集----训练集、测试集以及验证集

其中,Ytrain为正确的标签,y_score为输出概率值,thresholds1为阈值,当 y_score>thresholds1时预测为正样本;随机将样本划分为训练集(70%)和测试集(30%),用训练集训练模型,用测试集验证模型及参数。接着再把样本打乱,重新选择训练集和测试集,继续训练模型和验

【个人记录 | UNet | 整理ing】

和UNet做好朋友:代码/框架/整理/阅读

CVPR2023论文及代码合集来啦~

80、半监督学习、弱监督学习/无监督学习/自监督学习。36、行为识别/动作识别/检测/分割/定位。46、场景重建/视图合成/新视角合成。74、迁移学习/domain/自适应。23、图像复原/图像增强/图像重建。26、图像去噪/去模糊/去雨去雾。32、人脸生成/合成/重建/编辑。35、图像&视频检索/

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈