大白话聊聊“深度学习”和“大模型”

非人工智能专业也能读得懂的大白话~

[NLP]如何训练自己的大型语言模型

大型语言模型,如OpenAI的GPT-4或谷歌的PaLM,已经在人工智能领域掀起了一场风暴。然而,大多数公司目前没有能力训练这些模型,而且完全依赖少数几家大型科技公司作为技术提供者。在Replit,我们已经大量投资于所需的基础设施,以从头开始训练我们自己的大型语言模型。在这篇博文中,我们将概述我们如

用LangChain构建大语言模型应用

LangChain 是一个开源 Python 库,任何可以编写代码的人都可以使用它来构建 LLM 支持的应用程序。 该包为许多基础模型提供了通用接口,支持提示管理,并在撰写本文时充当其他组件(如提示模板、其他 LLM、外部数据和其他工具)的中央接口。

《Stable Diffusion WebUI如何下载模型》

如何下载丰富的模型,在自己的stable diffusion上

自学大语言模型的应用程序框架Langchain(初入门)

LangChain 是一个用于开发由语言模型驱动的应用程序的框架。Be data-aware:将语言模型连接到其他数据源Be agentic:允许语言模型与其环境交互使用语言模型是迈出的重要第一步。通常,在应用程序中使用语言模型时,你并不会直接将用户输入发送给语言模型。相反,你可能会将用户输入组合成

大语言模型也是知识库:基于知识的对话大模型综述

©PaperWeekly 原创 ·作者 | 缥缈孤鸿影引言ChatGPT 的横空出世,在整个自然语言处理乃至人工智能领域均掀起波澜。不同于普通的闲聊式机器人和任务型智能客服仅局限于固定场景,ChatGPT 具有相当丰富的知识储备,对于很多冷门的知识,它亦能对答如流,堪称当代“百晓生”。因此,将语言模

[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

部署大模型LLaMA的过程中安装量化工具包bitsandbytes问题解决

Meta 推出的 LLaMA 大语言模型部署教程

meta 推出的可以比肩chatGPT-3.5的 LLaMA 大语言模型的下载和部署流程

推演语言模型的大小与计算开销

2020年,OpenAI提出了在增加模型尺寸与提高模型性能之间的扩展定律,指出人们应该将大部分预算用于扩大模型规模。这篇论文直接推动了增大模型规模的浪潮。然而,在预算和内存有限的情况下,盲目扩大模型规模并不是提升模型性能的最佳选择。2022年,DeepMind团队发表了一篇论文(https://ar

基于闻达(wenda+chatGLM-6B),构建自己的知识库小助手

ChatGLM-6B是清华团队+智谱AI开发的,一个开源的、支持中英双语的对话语言模型,具有 62 亿参数。被很多人视为ChatGPT的平替。但是由于ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性。解决这一问题的方式大体上有两种:一种是使用更大规模的模型来提升整体能力,提升其自我认知

本地化部署大语言模型 ChatGLM

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGP

案例告诉你 ChatGPT 最有可能取代哪些职业

你的职业领域会被 ChatGPT 取代吗?

如何在 Python 开发环境中调用 ChatGPT 模型?

python 开发环境调用 ChatGPT 模型详解。

LangChain与大型语言模型(LLMs)应用基础教程:角色定义

在和让大型语言模型(LLM)如ChatGPT等对话时,为了要让LLM能准确回答我们的问题,我们应该在对话之前给LLM设定一个角色,这样当LLM知道自己的角色定位以后,它的回答将会符合自己的角色,而不会天马行空,自由发挥。

LangChain与大型语言模型(LLMs)应用基础教程:神奇的Agent

今天我们学习了LangChain的agent功能,它可以通过语言指令的方式执行各种数据分析、汇总、统计以及预测等功能,如果你是一个不会编程的小白,那可以尝试一下agent。

NLP领域大语言模型汇总

大语言模型是近年来人工智能领域重要研究方向之一。它们是基于深度学习技术构建的神经网络,可以自动学习和生成自然语言文本,如文章、对话、诗歌、代码等等。本文主要真针对目前比较火热的自然语言大语言模型,进行简单介绍,LLM包括了OpenAI的ChatGPT、百度文心一言、清华的GLM等模型。

体验讯飞星火认知大模型,据说中文能力超越ChatGPT

科大讯飞发布了讯飞星火认知大模型,据传是国产最强AI,讯飞董事长在发布会说:在目前可测试的国内AI大模型中,星火认知大模型是明显遥遥领领先的,中文已经超越ChatGPT,英文已接近,总体和ChatGPT还有细微差距,目前正在进一步优化中。我作为一个对人工智能感兴趣的开发者,当然不会错过这样一个强大的

ChatGPT及各种AI网站集合清单!(免费!免费!免费!)

ChatGPT集合清单!几十个AI网站甚至GPT4免费使用[⭐建议收藏⭐]

一文看懂多模态大型语言模型GPT-4

GPT-4是OpenAI公司3月推出的新一代人工智能预训练AI模型,是一个多模态大型语言模型,使用了1.5万亿个参数,是GPT-3.5的10倍之多,当然它也是世界上最大的人工智能模型。

清华 ChatGLM-6B 中文对话模型部署简易教程

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatG

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈