机器学习中的数学——距离定义(八):余弦距离(Cosine Distance)

余弦距离(Cosine Distance)也可以叫余弦相似度。 几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。nnn维空间中的余弦距离为:cos⁡(x,y)=x⋅y∣x∣⋅∣y∣=

SA的空间注意力和通道注意力

包括空间注意力和通道注意力,目的是选择细粒度的重要像素点,是pixel级。:是 local 注意力,致力于搜索粗糙的潜在判别区域,它们是region级。一般来说对于同一像素点不同通道求均值,再经过一些卷积和上采样的运算得到spitial attention mask,空间特征每层像素点被赋予不同的权

【图像分割】Segment Anything(Meta AI)论文解读

Segment Anything(SA)项目:一个图像分割新的任务、模型和数据集。建立了迄今为止最大的分割数据集,在11M许可和尊重隐私的图像上有超过1亿个mask。该模型的设计和训练是灵活的,因此它可以将zero-shot(零样本)转移到新的图像分布和任务。实验评估了它在许多任务上的能力,发现它的

【AI前沿】chatgpt还有哪些不足?

本篇CSDN博客讨论了ChatGPT作为一种强大的自然语言处理工具,存在的一些不足之处。首先提到了ChatGPT的速度问题和实时性问题,因为它需要大量的计算资源和时间来完成响应的生成,这限制了它的响应速度和实时性。其次,我将谈到了ChatGPT存在的知识局限性和文本处理问题,因为它缺乏对特定领域的知

时间序列多步预测经典方法总结

本篇文章将讲解时间序列中的经典问题:多步预测,所谓多步预测就是利用过去的时间数据来预测未来多个状态的时序数据,举个例子就是利用过去30天的数据来预测未来2天的数据。

4个令人惊艳的ChatGPT项目,开源了!AIGC也太猛了...

4个令人惊艳的ChatGPT项目

Gumbel-Softmax完全解析

本文对大部分人来说可能仅仅起到科普的作用,因为Gumbel-Max仅在部分领域会用到,例如GAN、VAE等。笔者是在研究EMNLP上的一篇论文时,看到其中有用Gumbel-Softmax公式解决对一个概率分布进行采样无法求导的问题,故想到对Gumbel-Softmax做一个总结,由此写下本文整个过程

【生成模型】Stable Diffusion原理+代码

Stable diffusion是一个基于(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。具体来说,得益于的计算资源支持和在LAION-5B的一个子集数据支持训练,用于文图生成。通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像,让文图生成能够

【机器学习】GRU 讲解

GRU RNN LSTM 长期依赖问题 前向传播 重置门 更新门 输入门 输出门 遗忘门

ESP32-CAM AI THINKER 引脚排列:GPIO 用法说明

ESP32-CAM 是一款开发板,带有一个 ESP32-S 芯片、一个 OV2640 摄像头、microSD 卡插槽和几个用于连接外设的 GPIO。在本指南中,我们将介绍 ESP32-CAM GPIO 以及如何使用它们。引脚排列图下图显示了ESP32-CAM AI-Thinker的引脚排列图。电路原

ChatGPT检测器(Detector)

chatGPT检测器

Informer:比Transformer更有效的长时间序列预测

目录AAAI 2021最佳论文:比Transformer更有效的长时间序列预测BackgroundWhy attentionMethods:the details of InformerSolve_Challenge_1:最基本的一个思路就是降低Attention的计算量,仅计算一些非常重要的或者说

大型语言模型的推理演算

本文详细阐述了大型语言模型推理性能的几个基本原理,不含任何实验数据或复杂的数学公式,旨在加深读者对相关原理的理解。此外,作者还提出了一种极其简单的推理时延模型,该模型与实证结果拟合度高,可更好地预测和解释Transformer模型的推理过程。为了更好地阅读本文,读者需了解一些Transformer模

智能算法系列之遗传算法

本篇是[智能算法(Python复现)]专栏的第一篇文章,主要介绍遗传算法`(Genetic Algorithm, GA)`的思想,`python`实现及相关应用场景模拟。

AI面题 | 谈谈目标检测中两阶段和单阶段方法的特点和区别

大家好,我是起床敲代码,本期给大家带来一道深度学习领域的面题:目标检测中两阶段和单阶段方法的特点和区别。

手把手教你用Yolov5 (v6.2) 训练分类模型 基于《Kaggle猫狗大战》案例

在8月17日晚上,YOLOv5官方发布了v6.2版本,v6.2版本支持分类模型训练、验证、预测和导出;v6.2版本的推出使得训练分类器模型变得超级简单!

本地从0搭建Stable Diffusion WebUI及错误记录

将下载的v2-1_768-ema-pruned.ckpt复制到models/Stable-diffusion模型文件夹下。取消勾选NVIDIA GeForce和Driver components,当前版本已经比安装的要高了,就不安装低版本了。下载NVIDIA Studio驱动程序,下载前查看NVID

【Paraview教程】第一章安装与基础介绍

ParaView基本的交互式可视化功能,主要包括数据加载,数据处理,参数调整和数据交互等功能。如切割,剪裁,轮廓,探测都能通过paraview实现。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈