ChatGLM-6B (介绍以及本地部署)
ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和ChatGLM相同的技术,针对中文问答和对话进行了优化。经过约 1T
AI自主图像生成 之 stable-diffusion—运行效果展示
这几天跑省外出差被隔离在酒店,不过随身带了个主机和显示器(笔记本太差跑不了项目程序,只能随身带主机,一言难尽…),正巧又刷到stable-diffusion开源的消息,现在就来试试搭建这个试试水。硬件环境:显卡3060 12G显存,内存32G 主要就这两,cpu没太大要求,除非你想用cpu跑深度学习
[九]深度学习Pytorch-transforms图像增强(剪裁、翻转、旋转)
深度学习Pytorch-transforms图像增强(剪裁、翻转、旋转)
图像风格迁移 CycleGAN原理
CycleGAN是一种很方便使用的用于进行图像风格转换的模型。它的一大优势就在于不需要成对的数据集就可以进行训练。比如我们只需要随便一大堆真人图像和随便另一大堆动漫图像,就可以训练出这两类风格互相转换的模型。 CycleGAN进行风格转换的原理是这样的:在CycleGAN模型中有两个生成器和两个判别
Vision Transformer模型与预训练权重简析
ViT (Vision Transformer) 是首次成功将 Transformer引入到视觉领域的尝试,开辟了视觉Transformer的先河。这里先对ViT的原理进行阐述,并对预训练文件ViT-B_16.npz的内容做一个简要介绍。
AI - AI绘画的精准控图(ControlNet)
想让 AI 绘制出自己满意的图片并不容易,甚至多次调整提示词(Prompt)也生成不出来我们想要的画面。这时你需要一个大杀器 ControlNet,可以做到精准控图了
(一)PaddlePaddle(深度学习框架)的搭建、使用
PaddlePaddle(深度学习框架)的搭建、使用
SKnet论文解读
本文讲述sknet的核心部分:自适应性的注意力编码机制SKNet对不同输入使用的卷积核感受野不同,参数权重也不同,可以自适应的对输出进行处理注:本人才疏学浅,文章难免有疏漏之处,仅给初学者阅读交流,大牛轻喷.开始之前的题外话 说来也算有趣,最近读了几个关于CV领域的paper,有的号称其id
【自然语言处理】从词袋模型到Transformer家族的变迁之路
本文简要介绍了 BOW、TF-IDF、Word2Vec、Transformer、BERT、GPT、RoBERTa、 XLM、Reformer、ELECTRA、T5 等模型。
LLaMA:7B参数量的Baby版ChatGPT窥探
本文通过造一些prompt初步窥探了7B版本的LLaMA,所生成的结果比较依赖于prompt的质量,有资源可以尝试65B参数量的版本。
yolo-pose环境搭建及训练和测试
扔掉学术偏见,拥抱工程化的Yolo。由于一直没有使用过yolo,因此本文旨在从0基础配置yolo环境并训练和测试。论文地址代码地址有问题欢迎+vx: wulele2541612007,后续有空会出yolo-pose的源码解读,敬请期待。......
ChatGPT开源平替——OpenChatKit(前OpenAI团队打造)
OpenChatKit是一个由前OpenAI研究员共同打造的开源聊天机器人平台。它包含了训练好的大型语言模型、定制配方和可扩展的检索系统,可以帮助用户快速构建高精度、多功能的聊天机器人应用。其中,最核心的组件是一个经过微调的、具有200亿参数的语言模型——GPT-NeoXT-Chat-Base-20
GPT-4:关于下一代人工智能模型的事实、谣言和期望
在深入细节之前,有必要描述一下 GPT 是什么。GPT(生成式预训练转换器)是一种文本生成 AI 模型,根据互联网上可用的数据进行训练。GPT 旨在生成类似人类的文本。将 GPT 视为按需智能。您可以在需要解决通常需要人工参与的问题时使用它。GPT模型的应用是无穷无尽的。它可以用于问答、文本摘要、翻
【半监督医学图像分割 2023 CVPR】UCMT 论文翻译
高质量的伪标签对于半监督语义分割是必不可少的。一致性正则化和基于伪标记的半监督方法利用来自多视图输入的伪标记进行协同训练。然而,这种协同训练模型往往在训练过程中早期收敛到一致,从而导致模型退化到自我训练模型。另外,多视点输入是通过对原始图像的扰动或增强而产生的,这不可避免地会在输入中引入噪声,导致低
Intel Realsense D435i各类标定教程
在之前的实验中用到了realsense-D435i,为了提高精度使用之前必须要进行标定。本篇文章就介绍下各类标定方法。因为我最终的目的是完成IMU和双目的联合标定,整个流程都是围绕整个目的展开的。过程中包括:RGB标定、单目标定、IMU标定、双目标定、IMU-双目标定 标定使用了kalibr标
vision transformer的位置编码总结
视觉transformer位置编码
爱因斯坦求和约定 含代码einsum
爱因斯坦求和约定(Einstein summation convention)是一种标记的约定, 又称为爱因斯坦标记法(Einstein notation), 可以基于一些约定简写格式表示多维线性代数数组操作,让表达式更加简洁明了。
一文弄懂什么是对比学习(Contrastive Learning)
有的paper将对比学习称为自监督学习(Self-supervised learning),有的将其称为无监督学习(Unsupervised Learning , UL)。自监督学习是无监督学习的一种形式。自监督学习(Self-supervised learning)可以避免对数据集进行大量的标签标
三维重建(知识点详细解读、主要流程)
基于本人大创项目所学习三维建模过程的笔记。1.概念:三维重建是指对三维物体建立适合计算机表示和处理的数学模型,是在计算机环境下对其进行处理、操作和分析其性质的基础,也是在计算机中建立表达客观世界的虚拟现实的关键技术。2.三维重建的分类:根据采集设备是否主动发射测量信号,分为两类:基于主动视觉理论和基
机器学习、深度学习、神经网络还傻傻分不清吗?
目录一.人工智能、机器学习、深度学习、神经网络是什么二.机器学习的分类一.人工智能、机器学习、深度学习、神经网络是什么 简单来说,人工智能的概念是最大最空的;机器学习其次,它是实现人工智能的一个重要途径;深度学习是机器学习中的一类方法,而深度学习是从神经网络基础上发展得到的,核心还是人工神经网