详解基于 RAG 的 txt2sql 全过程

本文使用通义千问大模型和 ChromaDB 向量数据库来实现一个完整的 text2sql 的项目,并基于实际的业务进行效果的展示。

使用Gradio搭建聊天UI实现质谱AI智能问答

1、获取api_key智谱AI开放平台网址:2、安装库3、执行一下代码,调用质谱api进行问答。

Qwen2本地web Demo

千问2前段时间发布了,个人觉得千问系列是我用过最好的中文开源大模型,所以这里基于streamlit进行一个千问2的web搭建,来进行模型的测试。

万字长文解析AI Agent技术原理和应用

深入剖析了AI Agent这一前沿科技领域的全貌。从基础概念的澄清,到技术原理的细致解构,再跨越至丰富多样的应用场景探索。

Llama(二):Open WebUI作为前端界面,使用本机的llama3

Open WebUI是一个可扩展、功能丰富、用户友好的自托管WebUI,旨在完全离线操作。它支持各种LLM运行程序,包括Ollama和OpenAI兼容的API。

LLM时代中的AI推理优化

毫无疑问,AI是当下最热的话题之一,而大模型又是当前AI的主角。几年前,正当深度学习进入瓶颈时,以GPT为首的LLM的横空出世让之似乎又找到了“第二增长曲线”。当模型规模大到一定程度时,它所表现出来的涌现能力(Emergent ability)是之前在小模型中所不曾见过的。这种大模型所特有的推理、计

AI 音乐生成器 MusicGPT,同声传译StreamSpeech!Web短视频平台Sharine

AI 音乐生成器 MusicGPT,同声传译StreamSpeech!Web短视频平台Sharine。

AnythingLLM 的 Docker 使用

AnythingLLM是使用大语言模型LLM的一站式简便框架。

【AI落地应用实战】如何高效检索与阅读论文——302.AI学术论文工具评测

在浩瀚的学术海洋中,如何快速、准确地找到我们需要的论文,就像是航海家如何在茫茫大海中找到正确的航线。海量的学术资源、复杂的检索系统、不断更新的研究热点,都为我们设置了重重障碍。最近,我就收到了不少同学私信说他们检索并阅读完一篇论文所花费的时间,甚至比追完一季电视剧还要长,那么:- 如何快速检索找到那

【工具】秘塔AI搜索|推荐一个现在还免费的AI聚合搜索工具

可以帮忙制作PPT,还支持学术搜索

大模型应用:大模型AI Agent在企业应用中的6种基础类型,企业智慧升级必备

大模型应用:大模型AI Agent在企业应用中的6种基础类型,企业智慧升级必备

[译文] LLM安全:3.网络LLM攻击及提示注入知识普及(PortSwigger)

上一篇文章讲解Sysdig威胁研究团队最近观察到一种新型攻击——LLMjacking。这篇文章将详细描述网络LLM攻击(Web LLM attacks),这些攻击利用模型访问数据、API或用户信息。主要内容包括如何利用LLM的APIs、函数和插件、间接提示注入、泄露敏感训练数据,以及如何防护LLM攻

【AI落地应用实战】LLM + TextIn文档解析技术实测 暨基于TextIn文档解析 + Kimi的智能文档解析助手

文档解析技术是从这些海量且复杂的数据中高效准确地提取有价值信息的关键。它从输入文档图像开始,经过图像处理、版面分析、内容识别和语义理解等流程,最终输出结构化电子文档或语义信息。通过文档解析技术,我们能够深入理解文档的结构、内容和主题,使得信息更易于检索、分析和利用。

AI实践与学习4_大模型之检索增强生成RAG实践

论文Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (知识密集型 NLP 任务的检索增强生成)作者们探讨了如何通过结合预训练的语言模型和非参数记忆(即检索机制)来提高自然语言处理(NLP)任务的性能,特别是在需要大量知

【第1节】书生·浦语大模型全链路开源开放体系

书生·浦语 InternLM介绍InternLM 是在过万亿 token 数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。在此基础上,通过高

Text-to-SQL小白入门(十)RLHF在Text2SQL领域的探索实践

本文主要介绍了Text2SQL的基本概念,以及RLHF的概念和框架,最后结合DB-GPT-Hub项目,将RLHF方法应用于Text2SQL任务进行实践探索。

2024 年学习 AI 路线图

黑客和程序员学习人工智能的免费课程

vLLM:由伯克利大学LMSYS组织开源的大语言模型高速推理框架-显著提高了大型语言模型(LLM)的服务效率

vLLM是一个由伯克利大学LMSYS组织开源的大语言模型高速推理框架,旨在提升实时场景下语言模型服务的吞吐与内存使用效率134。它是一个快速且易于使用的库,能够与HuggingFace无缝集成134。vLLM的核心是PagedAttention算法,这是一种新颖的注意力算法,通过引入操作系统的虚拟内

OrangePi Kunpeng Pro 开发板测评 | AI 边缘计算 & 大模型部署

香橙派联合华为发布了基于昇腾的 OrangePi Kunpeng Pro 开发板,具备 8TOPS 的 AI 算力,能覆盖生态开发板者的主流应用场景,具备完善的配套软硬件。开发板的整体体验远超出预期,作为低功耗 AI 边缘计算开发板,支持Ubuntu、openEuler操作系统,能够满足大多数AI算

利用AI Agent革新Text2SQL应用

的语义理解能力,能够准确识别出用户是想查询在任意连续两个月内都有订单的客户,而不是简单地查找在最近两个月内有订单的客户。:Agent的Memory组件负责存储和检索对话历史和关键信息,确保在交互过程中信息的连贯性。然而,面对复杂的查询需求,传统方法仍显不足。的设计灵感来源于人类或其他智能体的行为和决

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈