0


ChatGPT底层原理及教程

一、发展历史

1. 什么是ChatGPT

ChatGPT,美国OpenAI研发的聊天机器人程序,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文 等任务。

2. 什么是GPT

GPT(Generative Pre-training Transformer,生成预训练变压器)是由OpenAI在2018年开发的一种语言模型【和Bert是类似的】,在广泛的自然语言处理任务中取得了最先进的结果。它最初由Alec Radford, Karthik Narasimhan, Tim Salimans和Ilya Sutskever在2017年的一篇论文中介绍。

GPT的关键思想是在大量文本数据上以无监督的方式预训练一个大型变压器模型,然后在下游任务上使用较少的标记数据进行微调。这种方法在语言翻译、语言生成和问答等任务中已被证明非常有效。

GPT自初次发布以来经历了几次重大修订。GPT-2是2019年发布的一个更大、更强大的版本,具有超过15亿个参数。GPT-3是2020年发布的,更大,具有175亿个参数,能够以高精度执行各种各样的任务。

GPT还启发了许多后继模型的开发,比如Google于2018年推出的BERT(Bidirectional Encoder Representations from Transformers,双向编码器表示来自变压器),该模型也在许多自然语言处理任务中取得了最先进的结果。

3


本文转载自: https://blog.csdn.net/m0_51339444/article/details/129049696
版权归原作者 Emiliano Martínez 所有, 如有侵权,请联系我们删除。

“ChatGPT底层原理及教程”的评论:

还没有评论