跟李沐学AI:卷积层

卷积是一个特殊的全连接层。卷积神经网络是包含卷积层的一类特殊的神经网络。在深度学习研究社区中,𝑉被称为卷积核(convolution kernel)或者滤波器(filter),亦或简单地称之为该卷积层的权重,通常该权重是可学习的参数。当图像处理的局部区域很小时,卷积神经网络与多层感知机的训练差异可

使用CLIP模型进行零样本图像分类的分步指南

我们首先介绍零样本学习的概念及其在现代AI应用中的重要性

【大模型应用开发 动手做AI Agent】Agent即服务

【大模型应用开发 动手做AI Agent】Agent即服务作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming关键词:Agent即服务,AI Agent,API接口,云计算,大规模语言模型

【LangChain编程:从入门到实践】模型内容安全

【LangChain编程:从入门到实践】模型内容安全作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming关键词:LangChain, 模型内容安全,

【Datawhale AI夏令营】电力需求预测挑战赛 Task03

以两层为例,第一层由多个基学习器组成,其输入为原始训练集,第二层的模型则是以第一层基学习器的输出作为特征加入训练集进行再训练,从而得到完整的stacking模型。进行模型融合的前提是有多个模型的输出结果,比如使用catboost、xgboost和lightgbm三个模型分别输出三个结果,这时就可以将

AI Agent: AI的下一个风口 NLP

AI Agent: AI的下一个风口 NLP作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLMAI Agent: AI的下一个风口 NLP

Spark SQL原理与代码实例讲解

Spark SQL原理与代码实例讲解1. 背景介绍在大数据时代,数据处理和分析成为了一个重要的课题。Apache Spark作为一种快速、通用的大规模数据处理引擎,凭借其优秀的性能和易用性,在企业和学术界获得了广泛的应用。Spark SQL作为Spark的一个重要模块,为结构化数据

开源模型应用落地-qwen模型小试-Zero/One/Few Shot-进阶篇(九)

理解何为Zero-Shot/One-Shot/Few-Shot,以及如何正确使用

结合傅里叶变换和传统特征提取方法,通过XGBoost检测计算机生成图像

我们这里要介绍的很多过程是特征工程而不是分类。这个过程包括几个步骤,看起来很复杂,但实际上他们的核心很简单。

AI、ML、DL 和 DS 之间的区别

人工智能 数据分析 数据科学 深度学习 机器学习 神经网络在本文中,我们将了解 AI(人工智能)、ML(机器学习)、DL(深度学习)和 DS(数据科学)之间的区别。这些术语经常互换使用,但实际上,它们指的是计算机科学和数据分析领域内的不同概念。

人工智能背后的图灵测试(TuringTest)是什么?

图灵测试作为AI领域的经典测试方法,为我们提供了评估机器智能的一个重要基准。尽管存在一定的局限性,但它依然激励着研究人员不断追求更高水平的人工智能。通过深入理解图灵测试的原理和背后公式,以及具体的样例,我们可以更好地认识机器智能的发展现状和未来前景。随着大规模语言模型的发展,图灵测试也在不断演进,面

Spark DAG原理与代码实例讲解

Spark DAG原理与代码实例讲解1. 背景介绍1.1 大数据处理的挑战在大数据时代,我们面临着海量数据处理的巨大挑战。传统的数据处理方式已经无法满足实时性、高吞吐量的需求。Spark作为一个快速、通用的大规模数据处理引擎,为

手把书教你使用YOLOv9训练自己的数据集(附YOLOv9网络结构图)

YOLOv9通过研究数据传输时的信息丢失问题,提出了可编程梯度信息(PGI)和通用高效层聚合网络(GELAN)架构,提高了参数利用率和模型性能。与SOTA方法相比,GELAN仅使用传统卷积算子即可实现更好的参数利用率。PGI适用于从轻型到大型的各种模型,使从头开始训练的模型能够获得更好的结果。YOL

大语言模型VRAM估算指南和工具介绍

在本文中,我们将深入研究如何计算执行LLM推理所需的VRAM数量。确定在LLM上运行或执行推理所需的GPU VRAM通常是一个挑战。

ReadAgent,一款具有要点记忆的人工智能阅读代理

ReadAgent的工作流程,包括分页、主旨压缩和交互式查找Figure 1展示了 ReadAgent 的工作流程,这是一个模仿人类阅读习惯设计的系统,旨在有效处理和理解长文本。分页(Episode Pagination):系统将长文本分解为一系列较小的、逻辑上连贯的文本块,即“剧集”,类似于将一本

【AI大数据计算原理与代码实例讲解】ElasticSearch

作者:禅与计算机程序设计艺术Artificial Intelligence; 大数据: Big Data; Elasticsearch: 数据检索引擎背景介绍 - Introduction在当今这个数据爆炸的时代,企业及个人越来越依赖于数据分析和处理能力。面对海量的数据集,传统的数据库系统往

使用vLLM在一个基座模型上部署多个lora适配器

在本文中,我们将看到如何将vLLM与多个LoRA适配器一起使用。我将解释如何将LoRA适配器与离线推理一起使用,以及如何为用户提供多个适配器以进行在线推理。

Spark Streaming原理与代码实例讲解

随着大数据时代的到来,对实时数据处理的需求日益增加。传统的批处理模式已经无法满足业务对实时性的要求。Spark Streaming作为一种基于Spark的流式计算框架,能够以接近实时的速度处理大规模的数据流,并提供了丰富的流式计算API,为用户提供了一种简单易用的流式数据处理方案。Spark Str

Spark Stage原理与代码实例讲解

Spark采用DAG(有向无环图)结构来表示计算任务,DAG中的每个节点代表一个操作,边表示数据依赖。Spark Stage划分算法根据DAG结构,将DAG分解为最小的并行可执行单元,即Stage。每个Stage对应一个独立的内存空间,用于存储中间结果和执行计算任务。通过深入研究Spark Stag

用PyTorch 从零开始构建 BitNet 1.58bit

我们手动实现BitNet的编写,并进行的一系列小实验证实,看看1.58bit 模型是否与全精度的大型语言模型相媲美!

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈