Dynamic ReLU:根据输入动态确定的ReLU

这是我最近才看到的一篇论文,它提出了动态ReLU (Dynamic ReLU, DY-ReLU),可以将全局上下文编码为超函数,并相应地调整分段线性激活函数

CLIP:一种基于视觉和语言相互关联的图像分类模型

近年来,计算机视觉领域的发展非常迅速,其中图像分类是一项非常重要的任务。然而,传统的图像分类模型在面对大规模图像分类任务时存在很多局限性,例如需要大量标注数据、难以泛化到新的图像类别等问题。为了解决这些问题,近年来出现了一种新的图像分类模型——CLIP(Contrastive Language-Im

torch安装找不到版本报错

torch安装找不到版本报错的4种解决办法,可按顺序来

理解图傅里叶变换和图卷积

图神经网络(GNN)代表了一类强大的深度神经网络架构。本文将介绍图卷积的理论基础。深入研究图傅立叶变换的复杂性及其与图卷积的联系

扩散模型原理+DDPM案例代码解析

扩散模型 DDPM 代码实现 从数学公式到代码一步步理解

ClearML入门:简化机器学习解决方案的开发和管理

ClearML 是一个开源平台(之前叫TRAINS),可为全球数千个数据科学团队自动化并简化机器学习解决方案的开发和管理。它被设计为端到端的MLOps套件,允许您专注于开发ML代码和自动化,而ClearML确保您的工作可重复和可扩展。仅用 2 行代码跟踪和上传指标和模型创建一个机器人,每当模型的准确

2023mathorcup本科组C题电商物流网络包裹应急调运与结构优化问题保姆级思路

2023mathorcup本科组C题电商物流网络包裹应急调运与结构优化问题思路

StableVideo:使用Stable Diffusion生成连续无闪烁的视频

使用Stable Diffusion生成视频一直是人们的研究目标,但是我们遇到的最大问题是视频帧和帧之间的闪烁,但是最新的论文则着力解决这个问题。

nn.TransformerEncoderLayer中的src_mask,src_key_padding_mask解析

注意,不同版本的pytorch,对nn.TransformerEncdoerLayer部分代码差别很大,比如1.8.0版本中没有batch_first参数,而1.10.1版本中就增加了这个参数,笔者这里使用pytorch1.10.1版本实验。

数模笔记14-元胞自动机

由于在S中具体采用什么符号并不重要,它可取 {0,1},{-1,1},{静止,运动} 等等,重要的是S所含的符号个数,通常我们将其记为 {0,1}。在CA模型中,散布在规则格网 (Lattice Grid)中的每一元胞(Cell)取有限的离散状态,遵循同样的作用规则,依据确定的局部规则作同步更新。把

逻辑回归(Logistic Regression)原理(理论篇)

logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。

Pandas字符串操作的各种方法速度测试

由于LLM的发展, 很多的数据集都是以DF的形式发布的,所以通过Pandas操作字符串的要求变得越来越高了,所以本文将对字符串操作方法进行基准测试,看看它们是如何影响pandas的性能的。因为一旦Pandas在处理数据时超过一定限制,它们的行为就会很奇怪。

第十四届中国大学生服务外包大赛细品,巧用AI共克“记账”难题

前言熟悉我的小伙伴应该知道我在大学时期参与了很多竞赛,我向来对比赛是比较热枕的,以我个人观点,我认为可以通过竞赛激发学习激情和检验自己的技能水平掌握情况,大学生很少有机会能够了解到课堂之外市场的需求,外包服务竞赛就是一个很好的机会能够帮助大学生接触到市场需要何种服务以及人才需求,而且大学的很多比赛都

探索人工智能 | 模型训练 使用算法和数据对机器学习模型进行参数调整和优化

模型训练是指使用算法和数据对机器学习模型进行参数调整和优化的过程。模型训练一般包含以下步骤:数据收集、数据预处理、模型选择、模型训练、模型评估、超参数调优、模型部署、持续优化。

探索大语言模型垂直化训练技术和应用-陈运文

产品化的是请垂直领域的专家,针对每项垂直任务,来设计用于生成 prompt 的产品,由专家编写大量不同的 prompt,评估或输出好的 prompt 后,进行片段切分,形成相应的产品,这对未来 AIGC 任务会起到很好的作用。由上往下,当计算机做一个长文档的规划协作生成的内容,我们让相应的其他模型做

对yolov5的数据集进行划分【训练集、验证集、测试集】7:2:1和【训练集、验证集】8:2

对yolov5的数据集进行划分【训练集、验证集、测试集】7:2:1和【训练集、验证集】8:2

FlashAttention算法详解

这篇文章的目的是详细的解释Flash Attention,它无需任何近似即可加速注意力计算并减少内存占用

【深入探究人工智能】:常见机器学习算法总结

本篇文章对一些常见的机器学习算法做了归纳总结

openai模型个性化训练Embedding和fine-tuning区别

现在基于自然语言和文档进行对话的背后都是使用的基于嵌入的向量搜索。OpenAI在这方面做的很好,它的Cookbook(github.com/openai/openai-cookbook)上有很多案例,最近他们对文档做了一些更新。GPT擅长回答问题,但是只能回答它以前被训练过的问题,如果是没有训练过的