CLIP中的logit_scale参数

这行代码定义并初始化了一个可训练的参数,用于在计算图像和文本特征的相似度时进行缩放。通过这种方式,模型可以在训练过程中调整相似度的动态范围,以便更好地学习图像和文本特征之间的匹配关系。

基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践

本文是LangChain的一个代码贡献者编写的文章,将对这些内容进行详细介绍,文章最后还包含了作者提供的源代码

如何用云服务器跑GitHub深度学习项目(保姆级手把手教程)

文章借助Github开源实例,细致讲解了如何用pycharm实现在云服务器训练深度学习模型,并利用visdom实现训练结果可视化。

【大模型 AI 学习】大模型 AI 部署硬件配置方案(本地硬件配置 | 在线GPU)

最近想部署一个开源深度学习项目,但是小编的笔记本电脑是8G的集成显存,且没有GPU,性能肯定是不够的。于是小编在小po站上粗浅了解了一下当前: 1. 大模型 AI本地硬件配置和 2. 云上申请GPU算力的两种方式。

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio

使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。

大模型应用中一个 Token 占多少汉字?答案超乎想象!

原创 Soyoger AI技术研习社 2024年07月14日 09:00 美国先说答案:不同模型可能采用各自的切分方法,因此,一个 Token 所对应的汉字数量也会有所不同。如腾讯1token≈1.8个汉字,通义千问、千帆大模型等1token=1个汉字,对于英文文本来说,1个token通常对应3至4

Nature新晋子刊!一年直升1区TOP,IF还在蹭蹭涨!赶紧抓住扩刊红利期

而言当然是低很多,但是预计明年IF值能破10分,现在有扩刊趋势,各位同领域的学者们可考虑一下这本潜力新刊!此刊作为Nature旗下的新晋期刊,在影响力和排名上表现良好,影响因子8.1分,属于地球科学1区Top期刊。《通讯地球与环境》创办于2020年,是Nature旗下的新晋期刊,位于中科院1区Top

LLM Continue Pretrain(2024版)

deepseek的开源moe,也做得非常不错,应该是国内开源top了,他们的pretrain团队做得挺棒的 但算法为主的,做pretrain,往往就是洗数据了。尴尬的点是,预训练洗数据,因为数据量大,往往都是搞各种小模型+规则,很难说明你做的事情的技术含量,只能体现你对数据的认知很好。语言类的dom

极市平台 | 无人机相关开源数据集资源汇总

本文介绍几个无人机有关的开源数据集,内附下载链接。

2区TOP审稿“超亲民”!平均5天就上线!硕博友刊不是吹的~

的理论贡献,包括但不限于:架构、学习方法、网络动态分析、学习理论、计算学习理论、模糊逻辑、遗传算法、信息论、机器学习、神经生物学和模式识别的跨学科主题。期刊自2015年突破1000篇后,就“刹不住车”,曾一度直线上升到1800+后,本以为会持续扩刊,可是后续经过积极地调整,最近一年的发文量又回归了。

【果蔬识别】Python+卷积神经网络算法+深度学习+人工智能+机器学习+TensorFlow+计算机课设项目+算法模型

果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜(‘土豆’, ‘圣女果’, ‘大白菜’, ‘大葱’, ‘梨’, ‘胡萝卜’, ‘芒果’, ‘苹果’, ‘西红柿’, ‘韭菜’, ‘香蕉’, ‘黄瓜’),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,

论文研读:TransMorph—用于无监督医学图像配准的Transformer

在过去,卷积神经网络(ConvNets)一直是医学图像分析领域的研究热点。但是它的缺点是很少关注图像中的远程空间关系。最近,人们提出Transformer来解决ConvNet的缺点,并在许多医学成像应用中产生了最先进的性能,因为其大得多的感受野能够更精确地理解运动图像和固定图像之间的空间对应关系。在

人工智能——深度学习

深度学习是一种基于人工神经网络的机器学习方法,其核心思想是通过多层次的神经网络来模拟人脑的神经元之间的连接。深度学习的特点是可以通过大规模的数据来训练模型,并且可以自动学习到数据的特征表示。上图就是一个神经网络的基本结构图,X1到Xn是输入,O1到Oj是输出,圆圈是神经元(也称感知机),连线带权重参

基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例

**Torchtune**是由PyTorch团队开发的一个专门用于LLM微调的库。它旨在简化LLM的微调流程,提供了一系列高级API和预置的最佳实践,使得研究人员和开发者能够更加便捷地对LLM进行调试、训练和部署。

【高录用|24-25年EI会议推荐】计算机科学、通信、图像、人工智能、算法、应用技术、电子信息工程等多领域征稿参会

【高录用|24-25年EI会议推荐】计算机科学、通信、图像、人工智能、算法、应用技术、电子信息工程等多领域征稿参会

【SPIE出版,EI检索稳定】2024年人机交互与虚拟现实国际会议(HCIVR 2024,11月15-17日)

2024年人机交互与虚拟现实国际会议(HCIVR 2024)2024 International Conference on Human-Computer Interaction and Virtual Reality

月之暗面科技有限公司(Moonshot AI)内推

加入月之暗面 (Moonshot AI),你将有机会参与到前沿的人工智能技术研究与产品开发中。来和 kimi 一起登月吧!

01 服务器or本地项目部署全流程及常见问题

同志们大家好,今天出一期在windows、linux & ubantu系统中部署yolo or rtdetr项目的流程,供小白快速入门!(声明:以下流程均在蓝耘GPU平台和魔鬼面具的rtdetr项目下进行,其他项目如yolo系列均可使用该方法)其他相关链接附文章末尾。

【AI大模型】Transformer模型构建指南:轻松掌握核心技术

通过本专栏的博文,我们已经完成了所有组成部分的实现, 接下来就来实现完整的编码器-解码器结构. 接着将基于以上结构构建用于训练的模型.🍔 Tansformer模型构建过程的代码分析 nn.init.xavier_uniform演示:🍔 小结 学习并实现了编码器-解码器结

【人工智能】线性回归

一、使用正规化方法计算下列样本的预测函数1. 没有归一化之前2. 归一化之后二、读取ex1data2.txt中的数据,建立样本集,使用正规化法获取(房屋面积,房间数量)与房屋价格间的预测函数1. 读取数据,建立样本集2. 设置X、y3. 计算theta三、读取ex1data1.txt中的数据,建立样

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈