智谱AI——智能体开发探索

使用智谱AI探索大语言模型智能体开发。

Qwen大模型简介

Qwen系列大模型的参数规模为18亿(1.8B)、70亿(7B)、140亿(14B)和720亿(72B),包括基础模型Qwen,即Qwen-1.8B、Qwen-7B、Qwen-14B、Qwen-72B,以及对话模型Qwen-Chat,即Qwen-1.8B-Chat、Qwen-7B-Chat、Qwen

240810-Gradio自定义Button按钮+事件函数+按钮图标样式设定

margin: 0;/* 可调整最大宽度 */"""# 自定义的 JavaScript,用于捕捉按钮点击并触发 Gradio 按钮的 click 事件"""# Gradio 应用# 输入文本# 输出文本# 默认带icon的按钮# 隐藏真实按钮# 自定义 HTML 按钮"""# 显示自定义按钮# 绑定

【AI落地应用实战】Amazon SageMaker JumpStart 体验零一万物的 Yi 1.5 模型

Amazon SageMaker JumpStart 是 Amazon SageMaker 平台的一部分,旨在帮助用户更快、更轻松地启动和开发机器学习项目。这是亚马逊云科技提供的一个非常实用的工具,特别适合那些希望迅速启动和开发机器学习项目的用户。SageMaker JumpStart 可以视为 S

最新大模型架构TTT模型代码解析(一)

这项来自斯坦福大学、加州大学伯克利分校、加州大学圣迭戈分校和 Meta 的研究提出了一个新颖的序列建模方法,称为测试时训练(Test-Time Training, TTT)层。TTT 层通过用机器学习模型取代 RNN 的隐藏状态,并使用输入 token 的实际梯度下降来压缩上下文。研究表明,这种方法

LLM端侧部署系列 | 手机上运行47B大模型?上交推理框架PowerInfer-2助力AI手机端侧部署

近日,上海交大为大模型能够在智能手机上部署提出PowerInfer-2,该框架是专为智能手机设计且高度优化的推理框架。目前PowerInfer-2支持的最大模型是Mixtral 47B MoE模型,在inference的时候每秒可生成11.68个token,这比其他最先进的框架快22倍。即使是使用7

理性看待、正确理解 AI 中的 Scaling “laws”

在这种模式中,物种的形态在长时间的稳定期(equilibrium)之后,会经历短暂的、快速的形态变化(punctuation),这些变化可能伴随着物种的灭绝和新物种的产生。))进行改进的使用场景。但考虑到其中大部分视频并没有实用的音频内容(可能是音乐、静态图片或游戏视频等),实际可用的数据量可能远低

调用百度的大模型API接口实现AI对话!手把手教程!

本文介绍如何使用百度的大模型API接口实现一个AI对话项目。

Chainlit快速实现AI对话应用将聊天数据的持久化到Mongo非关系数据库中

默认情况下,Chainlit应用不会保留其生成的聊天和元素。即网页一刷新,所有的聊天记录,页面上的所有聊天记录都会消失。但是,存储和利用这些数据的能力可能是您的项目或组织的重要组成部分。之前写过一篇文章,这个技术方案的优点是,不需要自己在安装数据库,创建表结构等操作,缺点是,只适合用户量比较少的情况

Google最新开源大语言模型:Gemma 2介绍及其微调(上篇)

2024年6月27日,Google DeepMind发布了Gemma 2,这是Gemma系列轻量级开放语言模型的最新成员。Gemma 2在架构和训练方法上都有重大创新,在多项基准测试中取得了显著进步,甚至可以与参数规模大2-3倍的模型相媲美。本文将对Gemma 2技术报告的主要内容进行解读,包括模型

深入 Dify 源码,洞察 Dify RAG 核心机制

之前深入源码对 Dify 的完整流程进行了解读,基本上梳理了 Dify 的实现流程与主要组件。但是在实际部署之后,发现 Dify 现有的 RAG 检索效果没有那么理想。因此个人结合前端页面,配置信息与实现流程,深入查看了私有化部署的 Dify 的技术细节。将核心内容整理在这边,方便大家根据实际的业务

240713-Xinference模型下载、管理及测试

Xinference模型下载、管理及测试

书生.浦江大模型实战训练营——(四)书生·浦语大模型全链路开源开放体系

视频时间不长,30分钟,详细介绍了书生.浦语大模型的全链路开发体系,以及一些关键的大模型技术,收获颇多,后面想继续KG和RAG以及LLM长文本,基于图神经网络的LLM方向的进一步学习,欢迎大家交流!下面将详细介绍视频的内容。

基于人工智能的口试模拟、LLM将彻底改变 STEM 教育

本文开发了一个基于大规模语言模型的原型,模拟了高等教育中的口试,探索了大规模语言模型在教育环境中的潜力,展示了将人工智能引入教育的广泛可能性。尽管作为一项研究还处于早期阶段,但它为大规模语言模型在这一新应用领域的能力和局限性提供了重要见解,而最新版本的 OpenAI API 及其助手在为不同学生定制

基于AutoGen的多Agent AI系统实践

AutoGen是一个由Microsoft开源的框架,专为构建和优化大型语言模型(LLM)工作流程而设计。它提供了多Agent会话框架、应用程序构建工具以及推理性能优化的支持。基于AutoGen框架使得能够方便地使用多Agent开发LLM应用程序。以下将介绍如何基于AutoGen构建和定制多Agent

提升20%!京东广告模型系统负载均衡揭秘

负载均衡策略作为分布式服务架构的永恒话题之一,对于提高在线集群的资源利用率和服务稳定性十分必要。本文将从京东广告在线模型系统负载均衡策略的演进历程出发,并聚焦于系统最优算力调度下,异构硬件集群负载均衡问题解决策略的相关技术实践。

AI 情感聊天机器人之旅 —— 多轮对话存在的问题与数据积累

在 QA、逻辑推理等领域,多跳问答比单跳问答难得多。同理可得,多轮对话比单轮对话也难得多,模型需要结合历史对话和用户当前内容生成合适的响应。现有的指令数据大都是单轮或者两轮的对话,模型在对话轮数较少时,还能很好地遵循指令、记住历史信息以及输出合适的内容。但对话轮数多了后,模型的输出往往会变得不可控,

详解基于 RAG 的 txt2sql 全过程

本文使用通义千问大模型和 ChromaDB 向量数据库来实现一个完整的 text2sql 的项目,并基于实际的业务进行效果的展示。

使用Gradio搭建聊天UI实现质谱AI智能问答

1、获取api_key智谱AI开放平台网址:2、安装库3、执行一下代码,调用质谱api进行问答。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈