Prompt Engineering 入门（一）

什么是大语言模型（LLM）？

大语言模型 (LLM) 是一种基于Transformer的深度学习模型，可以处理大量的自然语言文本，并从中学习知识和语言规律，从而提高对自然语言的理解和生成能力。LLM可以用于各种自然语言处理 (NLP)任务，如文本生成、阅读理解、常识推理等，这些任务在传统的方法下很难实现。LLM还可以帮助开发人员构建更强大和更智能的应用程序，如聊天机器人、智能搜索引擎等。随着ChatGPT的火爆，LLM得到了很多关注。LLM的规模和性能在近年来不断提高，但也面临着训练和部署的挑战。本文将介绍OpenAI中的一些基本概念和 Prmpt的最佳实践，以及如何使用OpenAI来帮助开发人员构建更强大和更智能的应用程序。

基本概念

再开始之前，我们先来了解一下OpenAI的一些基本概念。

提示（Prompt）

Prompt是一种指令，它告诉人工智能模型要执行什么任务或生成什么样的输出。在机器学习和自然语言处理中，Prompt通常是一些文本或语言，被输入到训练好的模型中，用于指示模型生成一个相应的输出。Prompt可以是一个问题、一个句子或一段话，其作用是引导人工智能模型生成我们想要的文本类型和内容。

例如，在一个智能语音助手应用程序中，当用户说“今天天气如何？”时，应用程序将“今天天气如何？”作为Prompt输入到自然语言处理模型中，该模型将生成一个回答，比如“今天是晴天，最高气温将达到25度”。在这个例子中，Prompt是“今天天气如何？”

补全（Completion）

Completion是指机器学习模型在接收到一个Prompt后，根据训练数据和模型的权重参数生成的一段自动完成的文本。这个文本是基于Prompt的上下文和语义，由模型自动预测出来的。

例如，在之前的例子中，“今天天气如何？”做为Prompt输入到语言处理模型中。它可能会自动完成这句话，生成一个完整的回答，如“今天天气晴朗，最高气温将达到25度。” 这里的回答就是Completion。

标记（Token）

在自然语言处理中，Token是指一个具有独立语义的最小文本单位，可以是单词、短语、标点符号或其他任何单独的符号。在自然语言处理任务中，将文本分解成Token是非常重要的预处理步骤，这有助于将原始文本转换成模型可以处理的形式。

例如，考虑一句话“我正在学习自然语言处理。”，如果将其分解成Token，可能得到以下结果：

“我”
“正在”
“学习”
“自然语言”
“处理”
“。”
每个Token都代表一个独立的单元，具有一定的语义含义，并且可以被模型处理。在很多自然语言处理任务中，包括文本分类、命名实体识别、机器翻译等等，Token都是非常重要的组成部分。

在OpenAI的API使用中，对于Token是有限制的，更具模型的不同，Token的长度也不同。因此，在使用OpenAI的API时，需要注意Token的长度限制。可以通过这个Token工具来查看一段文本的Token长度。
OpenAI官方给出了一个初略估算的方式：对于英文，一个Token差不多为3/4的一个单词。也就是说，100个Token大约等于75个单词。

模型（Model）

Model是指一种数学模型或算法，它被设计用来解决特定的任务或问题。模型通常由输入、输出和学习参数组成，其中输入是模型需要处理的数据，输出是模型产生的结果，学习参数是模型根据数据进行学习和优化的参数。在OpenAI的API中，提供了多种不同的模型，可以用来解决不同的任务。主要有以下几种：达芬奇（Davinci），巴贝奇（Babage），埃达（Ada），居里（Curie）。每种模型都有自己的特点，可以根据具体的任务和应用场景来选择合适的模型。

如果您对OpenAI和Prompt Engineer有兴趣，那么请关注我的账号，我会分享更多有趣的技巧和经验，还会附赠一些冷笑话和梗，让您的学习过程更加轻松愉快！

标签：人工智能机器学习自然语言处理

本文转载自: https://blog.csdn.net/HappyHongHong/article/details/129301963
版权归原作者 HappyHongHong 所有，如有侵权，请联系我们删除。

Prompt Engineering 入门（一）

什么是大语言模型（LLM）？

基本概念

提示（Prompt）

补全（Completion）

标记（Token）

模型（Model）

发表评论

“Prompt Engineering 入门（一）”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航