【自然语言处理】【大模型】GLM-130B:一个开源双语预训练语言模型

​ 大语言模型(LLMs),特别是参数超过100B的模型呈现出诱人的scaling laws,其会突然涌现出zero-shot和few-shot能力。具有175B参数的GPT-3率先对100B尺度的LLM进行了研究:在各种基准上,使用32个标注示例可以显著超越全监督的BERT-Large模型。然而,

什么是大语言模型?

背景最近chagpt3|4非常火,导致业界很多人都觉得强人工智能很快就要取代我们这些工程师了,根据了解的确大语言模型建设的人工智能在未来的确可以取代一部分岗位,但是这是否意味着可以放慢脚步?什么是大语言模型?大语言模型 (LLM),全称:Large Language Models,LLMs, 代表着

大型语言模型的推理演算

本文详细阐述了大型语言模型推理性能的几个基本原理,不含任何实验数据或复杂的数学公式,旨在加深读者对相关原理的理解。此外,作者还提出了一种极其简单的推理时延模型,该模型与实证结果拟合度高,可更好地预测和解释Transformer模型的推理过程。为了更好地阅读本文,读者需了解一些Transformer模

开源大语言模型(LLM)汇总(持续更新中)

随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。

轻松玩转开源大语言模型bloom(一)

文字生成?知识问答?手把手带你体验人人都能玩的开源大语言模型。

ChatGPT 本地部署及搭建

​ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于General Language Model (GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGP

【人工智能AI】Meta开源AI语言模型NLLB-200

虽说这些翻译工具支持的语言只有 100 多种,再加上全世界一半以上的人口所使用的语言就那么十几二十种,翻译工具是能够满足大部分用户的使用需求的,但这对那些使用低资源语言(特别是在非洲)的用户来说就十分不友好,导致这些语言的使用者和他们希望消费的内容之间的交流受到了阻碍。测试表明,新的 NLLB-20

AIGC、ChatGPT、GPT系列?我的认识

简要介绍AIGC,科普ChatGPT知识,介绍GPT系列的发展历程和具体模型网络结构。(我的认识,部分资料来自网络)

【OpenAI | ChatGPT“超进化”】打造AI生态

作为本轮AI浪潮的领头羊,ChatGPT在迅速迭代发展的同时,再次带来了令人振奋的好消息——ChatGPT支持第三方插件了!这将让我们的用户体验更加便捷,功能更加实用,为广大用户提供更多聪明、高效的解决方案。ChatGPT支持第三方插件了,能联网获取新知识,可与5000+个应用交互,而且一口气上架了

GPT-4发布:人工智能新高度,以图生文技术震撼,短时间内挤爆OpenAI模型付费系统

GPT-4是人工智能领域的一个新里程碑,它拥有强大的多模态能力和创造力,可以处理各种类型的数据和任务,为我们提供了无限的可能性和机会。它将给我们带来许多便利和乐趣,比如帮助我们学习、工作、娱乐、创作等等。它也将给我们带来许多挑战和责任,比如保护隐私、防止滥用、维护公平、促进发展等等。我们应该积极地探

【自然语言处理】【大模型】BLOOM:一个176B参数且可开放获取的多语言模型

​ 预训练语言模型已经成为了现代自然语言处理pipeline中的基石,因为其在少量的标注数据上产生更好的结果。随着ELMo、ULMFiT、GPT和BERT的开发,使用预训练模型在下游任务上微调的范式被广泛使用。随后发现预训练语言模型在没有任何额外训练的情况下任务能执行有用的任务,进一步证明了其实用性

什么是让ChatGPT爆火的大语言模型(LLM)

AI 应用程序正在总结文章、撰写故事和进行长时间对话——而大型语言模型正在承担繁重的工作。大型语言模型或 LLM 是一种深度学习算法,可以根据从海量数据集中获得的知识来识别、总结、翻译、预测和生成文本和其他内容。大型语言模型是 Transformer 模型最成功的应用之一。 它们不仅用于教授 AI

中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本

ChatGLM是一个具备问答和对话功能的语言模型,目前处于内测阶段,已经开启邀请制,并且将逐步扩大内测范围。此外,ChatGLM也已经开源了最新的中英双语对话模型ChatGLM-6B,结合模型量化技术,用户可以在消费级显卡上进行本地部署。ChatGLM-6B共经过约1T标识符的中英双语训练,辅以监督

升级篇:超详细ChatGPT(GPT 4.0)论文润色指南+最全提示词——持续更新

不看后悔!ChatGPT 4.0一站式论文助攻指南,革新论文写作方式。

大语言模型集成工具 LangChain

介绍:通过可组合性使用大型语言模型构建应用程序【背景】大型语言模型 (LLM) 正在成为一种变革性技术,使开发人员能够构建他们以前无法构建的应用程序,但是单独使用这些 LLM 往往不足以创建一个真正强大的应用程序,当可以将它们与其他计算或知识来源相结合时,就有真的价值了。LangChain 旨在协助

一文带你了解爆火的Chat GPT

​OpenAI近期发布聊天机器人模型ChatGPT,迅速出圈全网。它以对话方式进行交互。以更贴近人的对话方式与使用者互动,可以回答问题、承认错误、挑战不正确的前提、拒绝不适当的请求。高质量的回答、上瘾式的交互体验,圈内外都纷纷惊呼。

Encoder-Decoder 模型架构详解

文章目录概述Seq2Seq( Sequence-to-sequence )Encoder-Decoder的缺陷Attention 机制的引入Transformer中的Encoder-Decoder概述Encoder-Decoder 并不是一个具体的模型,而是一个通用的框架。Encoder 和

【自然语言处理(NLP)】基于ERNIE语言模型的文本语义匹配

【自然语言处理(NLP)】基于ERNIE语言模型的文本语义匹配,基于百度飞桨开发,参考于《自然语言处理实践》所作。

到底有多厉害?ChatGPT初探(多图)

到底有多厉害?ChatGPT初探

Encoder-Decoder 模型架构详解

文章目录概述Seq2Seq( Sequence-to-sequence )Encoder-Decoder的缺陷Attention 机制的引入Transformer中的Encoder-Decoder概述Encoder-Decoder 并不是一个具体的模型,而是一个通用的框架。Encoder 和

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈