论文推荐:大型语言模型能自我解释吗?
这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法,一种是做出预测,然后解释它,另一种是产生解释,然后用它来做出预测。
人工智能、机器学习、深度学习之间的关系是什么?
人工智能(Artificial Intelligence,AI)是指通过计算机技术来实现人类的智能行为和智能思维的一种技术手段。它的传统研究方向是从人类的智能角度出发,通过模拟和实现人类的智能能力,比如语言理解、图像识别、推理、决策等。而机器学习则是人工智能的一个重要分支,是指计算机通过学习数据和样
PaDiM 原理与代码解析
文中使用马氏距离 \(M(x_{ij})\) 来计算测试图片在位置 \((i,j)\) 处的异常分数,\(M(x_{ij})\) 表示测试图片的嵌入向量 \(x_{ij}\) 和学习到的分布 \(\mathcal N(\mu_{ij},{\textstyle \sum_{ij}^{}} )\) 之
MAMBA介绍:一种新的可能超过Transformer的AI架构
屹立不倒的 Transformer 迎来了一个强劲竞争者。CMU、普林斯顿研究者发布的MAMBA架构,解决了Transformer核心注意力层无法扩展的致命bug,推理速度直接飙升了5倍!一个时代终于要结束了?
AI生成中Transformer模型
在深度学习中,有很多需要处理时序数据的任务,比如语音识别、文本理解、机器翻译、音乐生成等。Transformer模型由Vaswani等人在2017年的论文《Attention Is All You Need》中首次提出,它在自然语言处理领域引起了巨大变革。该模型摒弃了传统的循环网络结构,转而使用自注
一维pytorch注意力机制
最近在研究一维数据,发现目前网络上的注意力机制都是基于二维来构建的,对于一维的,没有查到什么可直接加在网络中的代码,因此本次文章主要介绍常用的三种注意力机制–SENet,CBAM和ECA其一维的代码。
一文总结经典卷积神经网络CNN模型
总结从1998年至今的优秀CNN模型,包括LeNet、AlexNet、ZFNet、VGG、GoogLeNet、ResNet、DenseNet、SENet、SqueezeNet、MobileNet。了解巨佬们的智慧结晶,学习算法上的思路和技巧,便于我们自己构建模型,也便于我们做迁移学习。
pinokio让你在本地轻松跑多种AI模型的神奇浏览器
就像一个网络浏览器,Pinokio本身不会做任何事情,但随着人们围绕它构建和分享应用、工作流和API,它将变得越来越有用。订阅我们的中文简报,深入解析最新的技术突破、实际应用案例和未来的趋势。Pinokio是一个浏览器,可以让您自动且轻松地安装、运行和自动化任何AI应用和模型。再也不需要打开终端。但
torch.einsum() 用法说明
这里,j 是求和下标,i 和 k 是输出下标(有关原因的更多详细信息,请参见下面的部分)。例外情况是,如果对相同的输入操作数重复下标,在这种情况下,此操作数的标有此下标的维度必须在大小上匹配,并且操作数将被其沿这些维度的对角线替换。,它将覆盖下标未覆盖的维度,例如,对于具有 5 维的输入操作数,等式
从头开始实现LoRA以及一些实用技巧
本文将首先深入研究LoRA,然后以RoBERTa模型例从头开发一个LoRA,然后使用GLUE和SQuAD基准测试对实现进行基准测试,并讨论一些技巧和改进。
【PaddleDetection】基于PaddleDetection的齿轮瑕疵检测:从模型训练到部署中的那些坑
本文的主要内容是一套利用百度飞桨深度学习平台下的目标检测套件实现目标检测任务(从模型训练到部署)的流程。本文中流程将最大限度地利用飞桨现有工具套件和API,以尽最大可能减少编程工作。本文所完成的任务来自“兴智杯”全国人工智能创新应用大赛:国产开发框架工程化应用赛,其主要内容为基于目标检测算法的齿轮瑕
2023年12月 论文推荐
12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。
17届全国大学生智能汽车竞赛 中国石油大学(华东)智能视觉组 国特开源
所有开源代码已上传到我的[GitHub仓库](https://github.com/shuoshuof/17-openmv-)。 因为寒假回家,大部分的代码都在实验室主机上。所以开源的代码大部分重新编写过,没有经过上车测试。如果发现问题,请及时给我留言或者提issue。 希望我的开
【头歌平台】人工智能-深度学习初体验
神经网络中也有神经元,这些神经元也会与其他神经元相连接,这样就形成了神经网络,而且这种网络我们称之为。如下图所示():从图可以看出,神经网络由一层一层的神经元所构成的,并且不同的层有不同的名字。其中表示用来接收数据输入的一组神经元。表示用来输出的一组神经元。表示介于输入层与输出层之间的一组神经元。
pytorch实战5——DataLoader数据集制作
DataLoader数据集制作
经典文献阅读之--Orbeez-SLAM(单目稠密点云建图)
对于现在的VSLAM而言,现在越来越多的工作开始聚焦于如何将深度学习结合到VSLAM当中,而最近的这个工作就给出了一个比较合适的方法。》这篇文章,可以轻松适应新的场景,而不需要预先训练,并实时为下游任务生成密集的地图。它成功地与隐式神经表示法(NERF)和视觉里程法相结合,实现了只需要RGB输入即可
使用LM Studio在本地运行LLM完整教程
LM Studio是一个免费的桌面软件工具,它使得安装和使用开源LLM模型非常容易。
神经网络实验报告-tensorflow基础
NumPy是Python中最重要的科学计算库之一,提供了多维数组、矩阵等数值计算功能,具有良好的数据处理能力和高效的计算性能,并且拥有丰富的函数库,可以进行数据加工、处理、筛选等操作。而TensorFlow则是一个由Google开发的机器学习框架,可以用来构建和训练神经网络等深度学习模型,提供灵活的
BERT+TextCNN实现医疗意图识别项目
BERT+TextCNN实现医疗意图识别项目
一种用于心音分类的轻量级1D-CNN+DWT网络
利用离散小波变换(DWT)得到的多分辨率域特征对1D-CNN模型进行心音分类训练。