大模型-基于大模型的数据标注
法来自于这篇论文:Can Generalist Foundation Models Outcompete Special-Purpose Tuning?
Ubuntu 20.04版本快速安装 Miniconda(宝宝级攻略)
我在学习深度学习时,安装Miniconda时踩过了一些坑,浪费了很多的时间,现在想出一个宝宝级的攻略,希望能够帮助大家节约时间,规避一些毒教程的糟粕。不管是双系统还是虚拟机这个攻略都是完美适配的,请大家放心使用。
通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析
本文将深入探讨何时以及为何启用这一设置,帮助你优化 PyTorch 中的内存管理和数据吞吐量。
深入浅出之CSPNet网络
CSPNet(Cross Stage Partial Network)的提出背景主要源于对现有计算机视觉模型的分析和挑战。在计算资源受限的情况下,轻量级神经网络模型越来越受到关注,但这类模型在轻量化的同时往往会牺牲模型的准确性。此外,现有的模型在推断过程中存在计算瓶颈和内存开销较大的问题,这限制了模
【AI论文精读5】知识图谱与LLM结合的路线图-P2
该论文提出了一个将大型语言模型(LLMs)与知识图谱(KGs)相结合的路线图。这是我对论文第2部分的解读。
Tokenformer:基于参数标记化的高效可扩展Transformer架构
本文是对发表于arXiv的论文 "TOKENFORMER: RETHINKING TRANSFORMER SCALING WITH TOKENIZED MODEL PARAMETERS" 的深入解读与扩展分析。
【动物识别系统】Python+卷积神经网络算法+人工智能+深度学习+机器学习+计算机课设项目+Django网页界面
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实
CLIP中的logit_scale参数
这行代码定义并初始化了一个可训练的参数,用于在计算图像和文本特征的相似度时进行缩放。通过这种方式,模型可以在训练过程中调整相似度的动态范围,以便更好地学习图像和文本特征之间的匹配关系。
基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践
本文是LangChain的一个代码贡献者编写的文章,将对这些内容进行详细介绍,文章最后还包含了作者提供的源代码
如何用云服务器跑GitHub深度学习项目(保姆级手把手教程)
文章借助Github开源实例,细致讲解了如何用pycharm实现在云服务器训练深度学习模型,并利用visdom实现训练结果可视化。
【大模型 AI 学习】大模型 AI 部署硬件配置方案(本地硬件配置 | 在线GPU)
最近想部署一个开源深度学习项目,但是小编的笔记本电脑是8G的集成显存,且没有GPU,性能肯定是不够的。于是小编在小po站上粗浅了解了一下当前: 1. 大模型 AI本地硬件配置和 2. 云上申请GPU算力的两种方式。
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio
使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。
大模型应用中一个 Token 占多少汉字?答案超乎想象!
原创 Soyoger AI技术研习社 2024年07月14日 09:00 美国先说答案:不同模型可能采用各自的切分方法,因此,一个 Token 所对应的汉字数量也会有所不同。如腾讯1token≈1.8个汉字,通义千问、千帆大模型等1token=1个汉字,对于英文文本来说,1个token通常对应3至4
Nature新晋子刊!一年直升1区TOP,IF还在蹭蹭涨!赶紧抓住扩刊红利期
而言当然是低很多,但是预计明年IF值能破10分,现在有扩刊趋势,各位同领域的学者们可考虑一下这本潜力新刊!此刊作为Nature旗下的新晋期刊,在影响力和排名上表现良好,影响因子8.1分,属于地球科学1区Top期刊。《通讯地球与环境》创办于2020年,是Nature旗下的新晋期刊,位于中科院1区Top
LLM Continue Pretrain(2024版)
deepseek的开源moe,也做得非常不错,应该是国内开源top了,他们的pretrain团队做得挺棒的 但算法为主的,做pretrain,往往就是洗数据了。尴尬的点是,预训练洗数据,因为数据量大,往往都是搞各种小模型+规则,很难说明你做的事情的技术含量,只能体现你对数据的认知很好。语言类的dom
极市平台 | 无人机相关开源数据集资源汇总
本文介绍几个无人机有关的开源数据集,内附下载链接。
2区TOP审稿“超亲民”!平均5天就上线!硕博友刊不是吹的~
的理论贡献,包括但不限于:架构、学习方法、网络动态分析、学习理论、计算学习理论、模糊逻辑、遗传算法、信息论、机器学习、神经生物学和模式识别的跨学科主题。期刊自2015年突破1000篇后,就“刹不住车”,曾一度直线上升到1800+后,本以为会持续扩刊,可是后续经过积极地调整,最近一年的发文量又回归了。
【果蔬识别】Python+卷积神经网络算法+深度学习+人工智能+机器学习+TensorFlow+计算机课设项目+算法模型
果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜(‘土豆’, ‘圣女果’, ‘大白菜’, ‘大葱’, ‘梨’, ‘胡萝卜’, ‘芒果’, ‘苹果’, ‘西红柿’, ‘韭菜’, ‘香蕉’, ‘黄瓜’),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,
论文研读:TransMorph—用于无监督医学图像配准的Transformer
在过去,卷积神经网络(ConvNets)一直是医学图像分析领域的研究热点。但是它的缺点是很少关注图像中的远程空间关系。最近,人们提出Transformer来解决ConvNet的缺点,并在许多医学成像应用中产生了最先进的性能,因为其大得多的感受野能够更精确地理解运动图像和固定图像之间的空间对应关系。在
人工智能——深度学习
深度学习是一种基于人工神经网络的机器学习方法,其核心思想是通过多层次的神经网络来模拟人脑的神经元之间的连接。深度学习的特点是可以通过大规模的数据来训练模型,并且可以自动学习到数据的特征表示。上图就是一个神经网络的基本结构图,X1到Xn是输入,O1到Oj是输出,圆圈是神经元(也称感知机),连线带权重参