【有啥问啥】什么是Foundation Models(基础模型)?
Foundation Models代表了人工智能发展的一个重要方向,凭借其强大的泛化能力和广泛的应用前景,已经成为AI研究和应用的核心工具。未来,随着技术的不断进步,我们有理由相信Foundation Models将为更多行业带来变革性的影响。希望本文对您了解Foundation Models有所帮
Ferret-UI——于移动用户界面的多模态大规模语言模型
移动应用程序已成为我们日常生活中不可或缺的工具,涉及信息搜索、预订和娱乐等多个领域。我们通常会目测屏幕,然后根据自己的目的执行必要的操作。将这一过程自动化可以让用户更轻松地实现目标。自动化还可应用于无障碍改进、用户界面导航、应用程序测试和可用性研究等不同领域。要顺利实现用户界面感知和交互的自动化,需
【论文速读】| APILOT:通过避开过时API陷阱,引导大语言模型生成安全代码
论文提出了一种名为APILOT的系统,它通过实时更新过时API的数据集,并结合增强生成方法,引导LLMs生成版本感知的安全代码。
天工AI:统一像素级视觉LLM发布
如何构建一个统一的像素级视觉大语言模型(LLM),以理解和执行多种视觉任务?论文提出了VITRON,一个统一的像素级视觉LLM,通过引入混合指令传递方法和跨任务协同模块,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务。
【LLM论文日更】LongReward:利用人工智能反馈改进长上下文大语言模型
未来的工作将致力于训练更小的长上下文奖励模型,探索更长序列和更大规模模型的长上下文对齐。总体而言,LongReward方法不仅显著提高了长上下文LLMs的性能,还增强了其遵循短指令的能力,并且可以与标准的短上下文DPO结合使用,不会影响各自方法的性能。:将LongReward与离线RL算法DPO结合
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现推理加速的正确姿势-Gradio
使用Gradio快速体验Qwen2.5-7B-Instruct与vllm集成推理的效果。
学大模型必看!手把手带你从零微调大模型!
今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。今天这篇文章,就手把手带你从零微调一个大模型。大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇文章仅从零开始,手把手带你走一遍微调大模型的过程,并不会涉及过多技术细节。希望通过本文,你可以了解微调大模型的流
人工智能(四)-大模型搭建
上一篇讲了人工智能是怎么学习的,这一期开始作者会开始讲实践,首先就是要在本地搭建一个预训练的大模型,后面才可以进一步的对他进行微调、搭载agent、向量数据库,完成自己想要的模型。
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本
使用CPU将Qwen2.5-7B-Instruct模型与vLLM框架进行有效整合(使用vLLM框架,能为模型推理提供强有力的支持,使得在CPU上执行的模型不仅能保持较高的准确率,还能在资源有限的条件下,实现快速响应,充分释放潜在价值)
人工智能 (AI) 应用:一个异常肺呼吸声辅助诊断系统
本文提出的Multi-breath模型在ICBHI 2017数据集上取得了59.2%的Score,优于现有轻量级模型,可以很好地提高自动异常呼吸音分类的准确性。
本地搭建AI开发平台Dify并使用Ollama添加大语言模型保姆级教程
本篇文章介绍如何将Dify本地私有化部署,并且接入Ollama部署本地模型,实现在本地环境中部署和管理LLM,再结合cpolar内网穿透实现公网远程访问Dify。
人工智能大模型工作原理(包括数据收集与预处理、大模型训练、大模型部署与应用)
人工智能大模型工作原理(包括数据收集与预处理、大模型训练、大模型部署与应用)
开源模型应用落地-Qwen2.5-7B-Instruct与sglang实现推理加速的正确姿势
Qwen2.5-7B-Instruct集成sglang,构建多样化的语言模型应用。
新质技术之生成式AI、大模型、多模态技术开发与应用研修班
在当前的科技飞速发展的时代,生成式人工智能、大模型、多模态技术的出现正为企业的数字化转型带来革命性变革。该研修班特别设计了为期四天的课程,从生成式AI的核心概念入手,逐步深入探讨大模型的应用开发以及多模态技术的集成运用。通过此次研修班,学员不仅能获得最新的AI技术知识,还能获得行业权威机构的职业技能
MetaAI最新开源Llama3.2亮点及使用指南
Llama大模型是由Meta的人工智能研究团队开发并开源的大型语言模型,继Llama2+模型之后,Meta进一步推出了性能更卓越的Meta Llama3系列语言模型,包括一个80亿参数模型和一个700亿参数模型。lama370B的性能媲美Gemini1.5Pro,全面超越Claude大杯,而Llam
个性化大语言模型:PPlug——让AI更懂你
在当今数字化转型的时代,大型语言模型(LLMs)已经成为了不可或缺的工具,它们在自然语言理解、生成和推理方面展现了非凡的能力。然而,这些模型普遍采用的是“一刀切”的方式,即对于相同的输入给予所有用户相似的响应。这种方式虽然能够满足大多数情况下的需求,但在需要根据个人偏好定制内容的情境下就显得力不从心
真免费!10 款必备的语言类 AI 大模型
通义千问是阿里云推出的一个大型语言模型,它是通义系列的最新成果,能够回答问题、创作文字,还能表达观点、撰写代码,具备丰富的知识和强大的语言生成能力。它拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领
如何在Windows和Linux系统中通过ollama部署qwen大语言模型,并实现open-webui的访问
如何在Windows和Linux系统中通过ollama部署qwen大语言模型,并实现open-webui的访问
大语言模型与ChatGPT:深入探索与应用
这篇博客的内容围绕大语言模型的工作原理、架构、应用、挑战及未来发展,旨在帮助读者全面了解ChatGPT等大语言模型的实际应用及其发展方向。
GPT大模型翻译质量完胜传统机器翻译引擎
为了评估三种不同的机器翻译工具的翻译质量,我们将采用以下五个评价指标来进行量化评分。