21 种 AI 小模型

小型语言模型通过为广泛的应用程序提供高效、可扩展和高性能的解决方案,正在改变 AI 的格局。它们紧凑的尺寸和减少的资源需求使其成为在计算能力和内存有限的环境中部署的理想选择。许多 slm 是通过知识蒸馏创建的,在这个过程中,较小的模型学习模仿较大模型的行为,保留了原始模型的大部分性能。许多小的语言模

使用大型语言模型进行文档解析

此处定义了上述每个属性,其中包含要包含的信息及其格式策略的具体详细信息。例如,多年来,正则表达式一直是我解析文档的首选工具,我相信对于许多技术人员和行业也是如此。尽管正则表达式在某些情况下非常强大,但它们常常在面对真实世界文档的复杂性和多样性时缺少灵活性。另一方面,大型语言模型提供了一种更强大、更灵

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-使用Lora权重(三)

使用vLLM框架集成Lora权重,以实现高效的推理过程。

开源模型应用落地-baichuan2模型小试-入门篇(三)

在linux环境下,使用transformer设置模型参数/System Prompt/历史对话

开源模型应用落地-glm模型小试-glm-4-9b-chat-压力测试(六)

通过压力测试,评估模型在高负载或极端条件下的表现。

在Windows上轻松部署本地大语言模型:Ollama与Open-WebUI的完整指南

本教程专注于指导读者如何使用Ollama和Open-WebUI在本地部署大型语言模型,以通义千问大模型为例。我们将提供简单易懂的步骤,专门为机器学习小白设计,确保您能够轻松上手,顺利完成模型的安装与使用。

开源模型应用落地-qwen模型小试-入门篇(四)

使用gradio,构建Qwen-1_8B-Chat测试界面

【AI大模型】大型语言模型LLM基础概览:技术原理、发展历程与未来展望

大语言模型 (英文:Large Language Model,缩写LLM) 是一种人工智能模型, 旨在理解和生成人类语言. 大语言模型可以处理多种自然语言任务,如文本分类、问答、翻译、对话等等.

【有啥问啥】什么是Foundation Models(基础模型)?

Foundation Models代表了人工智能发展的一个重要方向,凭借其强大的泛化能力和广泛的应用前景,已经成为AI研究和应用的核心工具。未来,随着技术的不断进步,我们有理由相信Foundation Models将为更多行业带来变革性的影响。希望本文对您了解Foundation Models有所帮

Ferret-UI——于移动用户界面的多模态大规模语言模型

移动应用程序已成为我们日常生活中不可或缺的工具,涉及信息搜索、预订和娱乐等多个领域。我们通常会目测屏幕,然后根据自己的目的执行必要的操作。将这一过程自动化可以让用户更轻松地实现目标。自动化还可应用于无障碍改进、用户界面导航、应用程序测试和可用性研究等不同领域。要顺利实现用户界面感知和交互的自动化,需

【论文速读】| APILOT:通过避开过时API陷阱,引导大语言模型生成安全代码

论文提出了一种名为APILOT的系统,它通过实时更新过时API的数据集,并结合增强生成方法,引导LLMs生成版本感知的安全代码。

天工AI:统一像素级视觉LLM发布

如何构建一个统一的像素级视觉大语言模型(LLM),以理解和执行多种视觉任务?论文提出了VITRON,一个统一的像素级视觉LLM,通过引入混合指令传递方法和跨任务协同模块,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务。

【LLM论文日更】LongReward:利用人工智能反馈改进长上下文大语言模型

未来的工作将致力于训练更小的长上下文奖励模型,探索更长序列和更大规模模型的长上下文对齐。总体而言,LongReward方法不仅显著提高了长上下文LLMs的性能,还增强了其遵循短指令的能力,并且可以与标准的短上下文DPO结合使用,不会影响各自方法的性能。:将LongReward与离线RL算法DPO结合

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio

使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。

学大模型必看!手把手带你从零微调大模型!

今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。今天这篇文章,就手把手带你从零微调一个大模型。大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇文章仅从零开始,手把手带你走一遍微调大模型的过程,并不会涉及过多技术细节。希望通过本文,你可以了解微调大模型的流

人工智能(四)-大模型搭建

上一篇讲了人工智能是怎么学习的,这一期开始作者会开始讲实践,首先就是要在本地搭建一个预训练的大模型,后面才可以进一步的对他进行微调、搭载agent、向量数据库,完成自己想要的模型。

开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本

使用CPU将Qwen2.5-7B-Instruct模型与vLLM框架进行有效整合(使用vLLM框架,能为模型推理提供强有力的支持,使得在CPU上执行的模型不仅能保持较高的准确率,还能在资源有限的条件下,实现快速响应,充分释放潜在价值)

人工智能 (AI) 应用:一个异常肺呼吸声辅助诊断系统

本文提出的Multi-breath模型在ICBHI 2017数据集上取得了59.2%的Score,优于现有轻量级模型,可以很好地提高自动异常呼吸音分类的准确性。

本地搭建AI开发平台Dify并使用Ollama添加大语言模型保姆级教程

本篇文章介绍如何将Dify本地私有化部署,并且接入Ollama部署本地模型,实现在本地环境中部署和管理LLM,再结合cpolar内网穿透实现公网远程访问Dify。

人工智能大模型工作原理(包括数据收集与预处理、大模型训练、大模型部署与应用)

人工智能大模型工作原理(包括数据收集与预处理、大模型训练、大模型部署与应用)

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈