智体AI在多模态交互领域的综述(上)
24年1月论文“Agent AI: surveying the horizons of multimodal interaction“,来自斯坦福、微软、UCLA和华盛顿大学。
docker部署本地词向量模型
会先去下载 docker 镜像,然后运行容器。特别要强调的是:model 的路径可不是随便写的。在我的这个例子中,启动 docker 时,映射的路径是。,因此 model 的路径必须以/data 开头,不然的话是找不到模型的。,大家可以参考我的路径来调整 model 和 volume 变量的值。
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-玩转ollama-历史消息记录管理(三)
使用`Message`参数明确用户意图,提高模型生成文本的相关性和准确性,确保输出符合特定对话风格或主题
【默子带读】Qwen2.5 最近的开源王炸模型(代码生成)
Qwen2.5是阿里巴巴发布的专注于代码生成、补全、错误修复和数学推理任务的开源模型。该系列模型涵盖了六种参数规模(从0.5B到32B),从轻量级应用到高性能推理,适配多样化的任务需求。模型架构基于Qwen系列的通用语言模型,但在多个关键任务上进行了优化,以更好地处理代码相关的生成与推理工作。💡凭
Open WebUI项目源码学习记录(从0开始基于纯CPU环境部署一个网页Chat服务)
学习开源项目Open WebUI过程中的一点笔记记录。通过本文,您可以了解:Open WebUI项目的基本信息和架构; 通过ollama部署大模型、通过docker镜像和源码运行Open WebUI项目的方法;项目后端代码在多情景(普通提问、联网搜索提问、上传PDF文件且联网提问、上传PDF文件非联
探索 Meta AI 的多模态语言模型 Spirit LM:融合语音与文本的创新应用
Spirit LM 是 Meta AI 开发的多模态语言模型,无缝集成语音和文本数据,具备跨模态生成、语义表达和少量样本学习能力,应用于语音助手、ASR、TTS 等场景。
当下最热门的AI工具,你喜欢哪一款?
这些 AI 工具在各个领域中发挥着重要作用,不仅提高了效率和准确性,还带来了许多创新和便利。随着技术的不断进步,AI 工具的应用范围将进一步扩大,对社会和经济的影响也将更加深远。我相信总有一款工具能帮助到你。
搞人工智能开源大语言模型GPT2、Llama的正确姿势
目前我们每一小节的内容都讲解得非常慢,因为这是人工智能研发中的最基础知识。如果我们不能扎实掌握这些知识,将很难理解后续更复杂且实用的概念。因此,我们甚至采用一个概念一节的方式来编排内容,区分得清清楚楚、明明白白,以便大家能够非常明确地了解各知识点之间的关联关系和界限。本节将讲述一种在人工智能领域中被
南科大:中文安全数据基准ChineseSafe
如何评估大语言模型(LLM)在处理中文内容时的安全性?论文构建了一个名为ChineseSafe的中文基准数据集,用于全面评估LLM在中文场景中的安全性,并引入了三个新的安全问题类别。
【面试】解释一下什么是人工智能中的黑箱问题
1.1 什么是黑箱?在人工智能中,黑箱指的是那些内部机制对用户或开发者而言不可见或难以理解的系统或模型。对于黑箱模型,我们可以观察其输入和输出,但模型内部如何处理这些输入并得出输出的过程是复杂且不透明的。例如,一个深度神经网络在图像分类任务中,可以高效地将一张图像分类为“猫”或“狗”,但是人们很难解
大模型中文问答场景下的模型选择
C-MTP综合了标注数据和未标注数据,来自于多种来源,如Wudao语料库、科学文献、XLSUM-Zh、Wiki-Atomic-Edit、AmazonReviews-Zh等,确保了数据的大规模、多样性和质量。架构:BGE-Large-zh模型是基于BERT-like(类BERT)架构,特别是在特殊的[
大语言模型安全威胁
大语言模型安全威胁
21 种 AI 小模型
小型语言模型通过为广泛的应用程序提供高效、可扩展和高性能的解决方案,正在改变 AI 的格局。它们紧凑的尺寸和减少的资源需求使其成为在计算能力和内存有限的环境中部署的理想选择。许多 slm 是通过知识蒸馏创建的,在这个过程中,较小的模型学习模仿较大模型的行为,保留了原始模型的大部分性能。许多小的语言模
使用大型语言模型进行文档解析
此处定义了上述每个属性,其中包含要包含的信息及其格式策略的具体详细信息。例如,多年来,正则表达式一直是我解析文档的首选工具,我相信对于许多技术人员和行业也是如此。尽管正则表达式在某些情况下非常强大,但它们常常在面对真实世界文档的复杂性和多样性时缺少灵活性。另一方面,大型语言模型提供了一种更强大、更灵
开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-使用Lora权重(三)
使用vLLM框架集成Lora权重,以实现高效的推理过程。
开源模型应用落地-baichuan2模型小试-入门篇(三)
在linux环境下,使用transformer设置模型参数/System Prompt/历史对话
开源模型应用落地-glm模型小试-glm-4-9b-chat-压力测试(六)
通过压力测试,评估模型在高负载或极端条件下的表现。
在Windows上轻松部署本地大语言模型:Ollama与Open-WebUI的完整指南
本教程专注于指导读者如何使用Ollama和Open-WebUI在本地部署大型语言模型,以通义千问大模型为例。我们将提供简单易懂的步骤,专门为机器学习小白设计,确保您能够轻松上手,顺利完成模型的安装与使用。
开源模型应用落地-qwen模型小试-入门篇(四)
使用gradio,构建Qwen-1_8B-Chat测试界面
【AI大模型】大型语言模型LLM基础概览:技术原理、发展历程与未来展望
大语言模型 (英文:Large Language Model,缩写LLM) 是一种人工智能模型, 旨在理解和生成人类语言. 大语言模型可以处理多种自然语言任务,如文本分类、问答、翻译、对话等等.