CVPR 2023 | OpenGait: 步态识别开源框架介绍

如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!同时欢迎添加小编微信: cv_huber,备注CSDN,加入官方学术|技术|招聘交流群,一起探讨更多有趣的话题!

【深度学习】Stable Diffusion AI 绘画项目搭建详解,并运行案例

先把人家的git放过来:https://github.com/CompVis/stable-diffusion40.7k 的stars, flask 和 django 两个web框架也不过如此数量级吧。就是给一段文字,它能按照文字描述给你画画。画出来的还挺好看,是一个text-to-image di

机器学习-朴素贝叶斯过滤垃圾邮件

什么是朴素贝叶斯算法:用贝叶斯定理来预测一个未知类别的样本属于各个类别的可能性,选择可能性最大的一个类别作为该样本的最终类别。用这个算法处理垃圾邮件就可以理解为:用贝叶斯定理来预测一封由若干个单词组成的不知道是否为垃圾邮件的邮件,它是垃圾邮件或是正常邮件的可能性,如果算法预测出垃圾邮件的可能性更高,

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

推荐一个在本地部署中文类ChatGPT大模型的开源项目

YOLOv5图像分割中的NMS处理

在上一篇文章有讲到图像经过YOLOv5网络后得到的输出形式,主要是调用了BaseModel类下的forward得到的输出,输出的shape为【batch,25200,117】,这里的25200相当于总的anchors数量【以640*640的输入为例,共有anchors=80*80*3+40*40*3

在浏览器集成AI(chatgpt、new bing、bard )的必备扩展插件

本篇文章的插件大都基于Google浏览器,其他浏览器请自行尝试。本文中的插件链接就贴“”吧,方便其他浏览器也能找到同样的插件。一个可以在各大搜索引擎搜索的时候同时集成chatGPT搜索或在任意网站轻松访问chatGPT的插件,可以通过ChatGPT Sidebar官方提供的服务进行搜索,也可以使用自

智能优化算法之灰狼优化算法(GWO)的实现(Python附源码)

使用Python编程语言实现灰狼优化算法用于优化问题的求解,分别从实现思路、算法步骤以及实例这三个部分展开介绍,附源码,操作简单,适合新手学习。

FasterNet

更高FLOPS才是更快更强的底气,作者重新审视了现有的操作符,特别是DWConv的计算速度——FLOPS。作者发现导致低FLOPS问题的主要原因是频繁的内存访问。然后,作者提出了PConv作为一种竞争性替代方案,它减少了计算冗余以及内存访问的数量。论文链接:https://paperswithcod

常见传统算法实现DOA估计总结CBF、Capon、MUSIC、ESPRIT、OMP

常见传统算法实现DOA估计总结包括CBF、Capon、MUSIC、ESPRIT、OMP等方法的数学原理

Opencv——图像添加椒盐噪声、高斯滤波去除噪声原理及手写Python代码实现

我们将常会听到平滑(去噪),锐化(和平滑是相反的),那我们就会有疑惑?什么是噪声呢?图像噪声是指存在于图像数据中不必要的或多余的干扰信息,噪声的存在严重影响了图像的质量。噪声在理论上是”不可预测“的,所以我们只能用概率论方法认识“随机误差”

踩坑记录2——RK3588跑通YOLO v5+DeepSORT

上篇说到RK3588编译OpenCV, 这篇记录一下跑通YOLO v5+DeepSORT的愉(chi)快(shi)历程.

人工智能、ChatGPT等火爆的当下 AI大模型爆发

4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。可以在医学、环保、教育等领域发

ChatGLM-6B:颠覆聊天AI的全新模型

ChatGLM-6B是一个基于GPT-3的生成式对话模型。它由清华大学的研究团队开发,旨在改进聊天机器人的生成质量和对话逻辑。ChatGLM-6B采用了全新的训练方法,通过在大规模对话数据集上进行预训练,提升了模型的生成能力和对话质量。

详细介绍NLP中文分词原理及分词工具

本文详细介绍了中文分词方法的原理,以及常用的分词工具。

什么是大语言模型?

背景最近chagpt3|4非常火,导致业界很多人都觉得强人工智能很快就要取代我们这些工程师了,根据了解的确大语言模型建设的人工智能在未来的确可以取代一部分岗位,但是这是否意味着可以放慢脚步?什么是大语言模型?大语言模型 (LLM),全称:Large Language Models,LLMs, 代表着

【已解决】探究CUDA out of memory背后原因,如何释放GPU显存?

本文探究CUDA的内存管理机制,总结RuntimeError: CUDA out of memory的背后原因,并给出解决方案

经典分类模型回顾4-Resnet实现图像分类(matlab)

ResNet(Residual Network)是由Microsoft Research团队提出的一种深度卷积神经网络结构,它在ImageNet图像分类比赛中获得了第一名的成绩。ResNet的主要特点是引入了残差块(Residual Block)的概念,使得网络可以更深,并且训练效果更好。在ResN

Cesium三维数据格式以及生产流程详解(glb,osgb,obj,bim,ifc)等

统一是指不管你什么格式,你都必须符合我的标准,我的标准是考虑到浏览器的垃圾性能而制定的。手工模型最常见的是gltf格式的模型。这种数据是一种二进制文件,osgb数据由两部分组成,第一部分是结构信息,内部存储了文件的lod(层级信息),以及三维顶点数据结构,第二部分是纹理信息,包含结构内部的纹理。这一

BML CodeLab 使用技巧

BML CodeLab 使用方法

Word2Vec模型——将文本转换成向量的方法

用Word2Vec模型提取单词的特征向量