大语言模型 - overfit.cn

使用GPT-4生成训练数据微调GPT-3.5 RAG管道

我们现在可以使用GPT-4生成训练数据，然后用更便宜的API（gpt-3.5 turbo）来进行微调，从而获得更准确的模型，并且更便宜。

Deephub 2023-09-06 10:11:47 0 收藏

是否在业务中使用大语言模型？

但LLM究竟是什么，它们如何使你的企业受益?它只是一种炒作，还是会长期存在?

Deephub 2023-08-31 10:12:46 0 收藏

Prompt、RAG、微调还是重新训练？选择正确的生成式 AI 的方法指南

overfit同步小助手 2023-08-28 02:01:44 0 收藏

微调llama2模型教程：创建自己的Python代码生成器

本文将演示如何使用PEFT、QLoRa和Huggingface对新的lama-2进行微调，生成自己的代码生成器。所以本文将重点展示如何定制自己的llama2，进行快速训练，以完成特定任务。

Deephub 2023-08-25 10:13:58 0 收藏

使用GGML和LangChain在CPU上运行量化的llama2

Meta AI 在本周二发布了最新一代开源大模型 Llama 2。对比于今年 2 月发布的 Llama 1，训练所用的 token 翻了一倍，已经达到了 2 万亿，对于使用大模型最重要的上下文长度限制，Llama 2 也翻了一倍。在本文，我们将紧跟趋势介绍如何在本地CPU推理上运行量化版本的开源Ll

overfit同步小助手 2023-08-16 11:02:18 0 收藏

Prompt、RAG、微调还是重新训练？如何选择正确的生成式AI的使用方法

生成式人工智能正在快速发展，许多人正在尝试使用这项技术来解决他们的业务问题。本文将试图根据一些常见的可量化指标，为选择正确的生成式人工智能方法提供建议。

Deephub 2023-08-16 09:36:55 0 收藏

【AI实战】开源大语言模型LLMs汇总

开源大语言模型LLM汇总

overfit同步小助手 2023-08-02 12:02:10 0 收藏

2023年发布的25个开源大型语言模型总结

本文总结了当前可用的开源llm的全部（几乎全部）列表，以及有关其许可选项和源代码存储库的信息，希望对你有所帮助

Deephub 2023-07-26 10:02:05 0 收藏

LLM-Blender：大语言模型也可以进行集成学习

LLM-Blender是一个集成框架，可以通过利用多个开源大型语言模型(llm)的不同优势来获得始终如一的卓越性能。

Deephub 2023-07-24 09:15:10 0 收藏

【AI实战】训练一个自己的ChatGPT

使用 Alpaca-LoRA 来训练一个自己的 ChatGPT

overfit同步小助手 2023-07-21 04:02:03 0 收藏

开源教育对话大模型 EduChat

教育是一项对人类身心发展产生影响的社会实践活动，旨在从内在激发人们固有或潜在的素质。因此，我们必须坚持以人为本的教育理念，重点关注个性化、引导式和身心全面发展。EduChat 是华东师范大学计算机科学与技术学院的EduNLP 团队开发的开源教育对话大模型。该项目主要研究以预训练大模型为基底的教育对话

overfit同步小助手 2023-07-16 01:05:06 0 收藏