【古诗生成AI实战】之四——模型包装器与模型的训练

中存储的正是这些词的概率。为了生成文本,我们提取每个位置上概率最高的词的索引,然后根据这些索引在词典中查找对应的词。此外,为了提高配置的灵活性和可维护性,我们将所有的配置项(如批量大小、数据集地址、训练周期数、学习率等)抽取出来,统一放置在一个名为。为此,我们采取了进一步的措施:在模型外面再套上一个

RoSA: 一种新的大模型参数高效微调方法

随着语言模型不断扩展到前所未有的规模,对下游任务的所有参数进行微调变得非常昂贵,PEFT方法已成为自然语言处理领域的研究热点。PEFT方法将微调限制在一小部分参数中,以很小的计算成本实现自然语言理解任务的最先进性能。

从零开始使用MMSegmentation训练Segformer

写在前面:最新想要用最新的分割算法如:Segformer or SegNeXt 在自己的数据集上进行训练,但是有不是搞语义分割出身的,而且也没有系统的学过MMCV以及MMSegmentation。所以就折腾了很久,感觉利用MMSegmentation搭建框架可能比较系统,但是对于不熟悉的或者初学者非

基于协方差矩阵自适应演化策略(CMA-ES)的高效特征选择

特征选择是指从原始特征集中选择一部分特征,以提高模型性能、减少计算开销或改善模型的解释性。

人工智能详细笔记:深度学习解决图像分割问题(FCN Unet Deeplab)

图像分割是指将一幅数字图像分成若干个部分或者对象的过程。该任务的目标是将图像中的每个像素分配给其所属的对象或者部分,因此它通常被视为一种像素级别的图像分析。

Transformer模型详解

transformer结构是google在2017年的Attention Is All You Need论文中提出,在NLP的多个任务上取得了非常好的效果,可以说目前NLP发展都离不开transformer。最大特点是抛弃了传统的CNN和RNN,整个网络结构完全是由Attention机制组成。 由于

使用Mixtral-offloading在消费级硬件上运行Mixtral-8x7B

在本文中,将解释Mixtral-offloading的工作过程,使用这个框架可以节省内存并保持良好的推理速度,我们将看到如何在消费者硬件上运行Mixtral-8x7B,并对其推理速度进行基准测试。

AI:09-基于深度学习的图像场景分类

图像场景分类是计算机视觉领域的重要任务之一,它涉及将图像分为不同的场景类别,如城市街景、山脉风景、海滩等。本文将介绍基于深度学习的图像场景分类方法,并提供相应的代码实例,展示了深度学习在图像场景分类中的技术深度和应用前景。图像场景分类是计算机视觉中的一项关键任务,对于图像内容理解、图像检索和自动标注

17- TensorFlow中使用Keras创建模型 (TensorFlow系列) (深度学习)

Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow , CNTK 或者 Theano 作为后端运行。在Keras的官方github上写着"Deep Learning for humans", 主要是因为它能简单快速的创建神经网络,而不需要像Tensorfl

在Colab上测试Mamba

本文整理了一个能够在Colab上完整运行Mamba代码,代码中还使用了Mamba官方的3B模型来进行实际运行测试。

使用CLIP和LLM构建多模态RAG系统

在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标,这样可以避免更多的框架依赖。

AI:08-基于深度学习的车辆识别

基于深度学习的车型识别是一个复杂的任务,上述代码示例只是一个简单的示意,并不能涵盖所有的细节和技术深度。在实际应用中,可能还需要进行模型调优、模型融合、迁移学习等操作来提高识别的准确性和鲁棒性。

探索AI技术的奥秘:揭秘人工智能的核心原理

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站今天的干货分享到这里就结束啦!如果觉得文章还可以的话,希望能给个三连支持一下,阿Q的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是作者前进的最大动力!

感知与认知的碰撞,大模型时代的智能文档处理范式

第十九届中国图象图形学学会青年科学家会议上,合合信息带来了关于多模态大模型赋能文档处理的相关内容,欢迎感兴趣的同学了解~

AI:02-基于深度学习的动物图像检索算法的研究

本文介绍了一种基于深度学习的动物图像检索算法,采用ResNet50作为特征提取器,通过计算特征向量之间的相似度,实现了高效准确的图片检索。我们提供了相应的代码实现,供读者参考。首先,该算法的核心思想是使用深度学习模型提取图片的特征向量,然后通过计算这些特征向量之间的相似度,实现对于动物图片的快速检索

使用PyTorch实现混合专家(MoE)模型

在本文中,我将使用Pytorch来实现一个MoE模型。在具体代码之前,我们先简单介绍混合专家的体系结构。

经典神经网络论文超详细解读(八)——ResNeXt学习笔记(翻译+精读+代码复现)

ResNeXt论文(《Aggregated Residual Transformations for Deep Neural Networks》)超详细解读。翻译+总结。文末有代码复现

MobileOne(CVPR 2023)原理与代码解析

针对移动设备的高效深度学习架构的设计和部署已经取得了很大进展,很多轻量模型在减少浮点操作(floating-point operations, FLOPS)和参数量(parameter count)的同时不断提高精度。但是就延迟latency而言,这些指标没有很好的与模型的效率关联起来,像FLOPs

深度学习-瓶颈结构(Bottleneck)

深度学习-瓶颈结构(Bottleneck)