扩散模型训练太难?来看看Meta AI最新提出的KNN-Diffusion

我们总会发现,我们迸发出的每一个想法都是从脑海中相似的印象中复制的

如何测试一个AI系统?

如上是智能系统和非智能系统测试中的最显著不同的部分以及对应的方法和实践,但是针对文章开头的四个主要领域的智能系统还是有一些显著差异的,这些显著差异是应用领域的场景不同所导致的,我们会在后续继续学习和研究。

HyperLPR3车牌识别-五分钟搞定: 中文车牌识别光速部署与使用

基于深度学习高性能中文车牌识别 High Performance Chinese License Plate Recognition Framework.快速上手教程

盘点5种最频繁使用的检测异常值的方法(附Python代码)

在统计学中,异常值是指不属于某一特定群体的数据点。它是一个与其他数值大不相同的异常观测值,与良好构成的数据组相背离。例如,你可以清楚地看到这个列表里的异常值:[20, 24, 22, 19, 29, 18, 4300, 30, 18].当观测值仅仅是一堆数字并且是一维时,很容易识别出异常值。但是,当

基于opencv的边缘检测方法

介绍6种基于opencv的边缘检测的方法

【实战篇】是时候彻底弄懂BERT模型了(收藏)

如何弄懂BERT模型,当然是理论+实战了。本文就告诉大家如何实战BERT模型。

深度学习之concatenate和elementwise操作(二)

一、深度学习里面的element-wise特征相乘和相加到底有什么区别?很多深度学习模型在设计时,中间特征在分支处理后,然后可能会采用element-wise相乘或相加,不知道这个乘和加的细微区别?答:相加的两个tensor通常都是具有特征意义的tensor,相乘的话,一般来说,其中一个tensor

多模态融合技术

多模态融合的主要目标是缩小模态间的异质性差异,同时保持各模态特定语义的完整性,并在深度学习模型中取得较优的性能。

ChatGPT详解

ChatGPT详解

中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本

ChatGLM是一个具备问答和对话功能的语言模型,目前处于内测阶段,已经开启邀请制,并且将逐步扩大内测范围。此外,ChatGLM也已经开源了最新的中英双语对话模型ChatGLM-6B,结合模型量化技术,用户可以在消费级显卡上进行本地部署。ChatGLM-6B共经过约1T标识符的中英双语训练,辅以监督

GELU激活函数

GELU激活函数简介

AI画图 Disco-diffusion 本地搭建测试

Disco Diffusion图像生成网络,输入文字输出美图。

微信小程序 | 人脸识别的最终解决方案

不要再看那些乱七八糟的教程了,一文总结了小程序人脸识别的全部方案!只求最优解!

Torchtext快速入门(一)——Vocab

深入解读torchtext.vocab.Vocab

chatGPT 使用场景

chatGPT 应用场景介绍

Blender 物理属性 (四)流体

1 流体用于模拟水流,烟雾等效果2 流体一共有三种类型,域,流,效果器。

(Note)优化器Adam的学习率设置

从统计的角度看,Adam的自适应原理也是根据统计对梯度进行修正,但依然离不开前面设置的学习率。如果学习率设置的过大,则会导致模型发散,造成收敛较慢或陷入局部最小值点,因为过大的学习率会在优化过程中跳过最优解或次优解。同时神经网络的损失函数基本不是凸函数,而梯度下降法这些优化方法主要针对的是凸函数,所

face_recognition库的使用

​face_recognition库基于dlib的使用,包含dlib的安装,及face_recognition库各个方法的使用

MFCC特征提取

在语音识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。 MFCC的提取过程包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。