ChatGLM-6B 模型介绍及训练自己数据集实战
ChatGLM-6B 模型介绍及训练实战
ChatGPT的实现原理
ChatGPT实现原理
NLP大模型微调答疑
我理解ChatGLM-6B模型是走完 “预训练-SFT-RLHF” 过程训练后的模型,其SFT阶段已经有上千指令微调任务训练过,现在我们只是新增了一类指令数据,相对大模型而已,微调数据量少和微调任务类型单一,不会对其原有的能力造成大的影响,所以我认为是不会导致灾难性遗忘问题,我自己微调模型也没出现此
NLP--知识图谱总结
知识图谱是一种以图形方式展示知识结构和知识关系的工具。它不同于普通的知识库,知识图谱采用的是图形数据库,能够更加高效地处理大量的知识和关系。组成知识图谱主要由三部分组成:实体、属性和关系。实体指具体的事物或概念,属性指实体的特征,关系指实体之间的联系。例如,一个人可以是实体,他的姓名、性别、年龄等就
自然语言处理—文本分类综述/什么是文本分类
最近在学习文本分类,读了很多博主的文章,要么已经严重过时(还在一个劲介绍SVM、贝叶斯),要么就是机器翻译的别人的英文论文,几乎看遍全文,竟然没有一篇能看的综述,花了一个月时间,参考了很多文献,特此写下此文。思维导图https://www.processon.com/mindmap/61888043
国内怎么玩chatGPT-chatGPT中文版入口
目前,国内有一些可用的ChatGPT模型和平台,可以方便用户使用。以下是一些代表性的中文ChatGPT模型和平台:THU Transformer: 清华大学自然语言处理实验室开发的中文自然语言处理模型,基于GPT模型架构进行研发,提供了文本生成、问答、文本分类等功能。百度PaddleNLP:百度开发
LangChain与大型语言模型(LLMs)应用基础教程:角色定义
在和让大型语言模型(LLM)如ChatGPT等对话时,为了要让LLM能准确回答我们的问题,我们应该在对话之前给LLM设定一个角色,这样当LLM知道自己的角色定位以后,它的回答将会符合自己的角色,而不会天马行空,自由发挥。
【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)
【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)
LangChain与大型语言模型(LLMs)应用基础教程:神奇的Agent
今天我们学习了LangChain的agent功能,它可以通过语言指令的方式执行各种数据分析、汇总、统计以及预测等功能,如果你是一个不会编程的小白,那可以尝试一下agent。
GPT是如何工作的?应用场景有哪些?
比如,给定“我想看陈赫演的爱”,语言模型可能会预测“情”字的概率较高,“乐”字的概率略低,“莲”字的概率也较低。你可能听说过GPT这个词,它是一种人工智能技术,可以生成各种各样的文本,比如小说、诗歌、新闻、对话等。那么,它是如何工作的呢?现实应用场景:GPT可以作为AI生活助手、AI售后客服、办公场
transformers包介绍——nlp界最顶级的包——可以不用 但不能不知道——python包推荐系列
transformers包介绍——nlp界最顶级的包——可以不用 但不能不知道——python包推荐系列
NLP领域大语言模型汇总
大语言模型是近年来人工智能领域重要研究方向之一。它们是基于深度学习技术构建的神经网络,可以自动学习和生成自然语言文本,如文章、对话、诗歌、代码等等。本文主要真针对目前比较火热的自然语言大语言模型,进行简单介绍,LLM包括了OpenAI的ChatGPT、百度文心一言、清华的GLM等模型。
【自然语言处理】主题建模:BERTopic(理论篇)
在我的博客中已经写了很多关于主题建模的内容,当你准备了解 BERTopic 时,默认你已经知道了 LSA、pLSA、NFM、LDA 等传统的主题建模方法。关于主题建模的前置知识我在这里不做赘述,感兴趣的同学可以看看我前几篇博客。学习 BERTopic 需要一定的机器学习基础,让我们一起开始吧!
前沿探索,AI 在 API 开发测试中的应用
Apikit 是结合 API 设计、文档管理、自动化测试、监控、研发管理和团队协作的一站式 API 生产平台,可以快速、规范地管理所有 API,已经成为当前 API 研发管理的主流产品。
清华 ChatGLM-6B 中文对话模型部署简易教程
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatG
Prompt Engineering 入门(一)
大语言模型 (LLM) 是一种基于Transformer的深度学习模型,可以处理大量的自然语言文本,并从中学习知识和语言规律,从而提高对自然语言的理解和生成能力。LLM可以用于各种自然语言处理 (NLP)任务,如文本生成、阅读理解、常识推理等,这些任务在传统的方法下很难实现。LLM还可以帮助开发人员
HuggingFace简明教程
什么是huggingface?huggingface是一个开源社区,它提供了先进的NLP模型,数据集,以及其他便利的工具。这些数据集可以根据任务、语言等来分类官方文档:主要的模型:自回归:GPT2、Transformer-XL、XLNet自编码:BERT、ALBERT、RoBERTa、ELECTRA
解决ChatGPT 总是打不开,显示不可用,网站崩溃,聊几句话就报错,plus会员无法升级始终不成功的问题
为什么你的chat gpt总是打不开,显示不可用,网站崩溃,聊几句话就报错,plus会员无法升级始终不成功?
使用思维链(Chain-of-thoughts)提示在大型语言模型中引出推理
“思维链提示”的方法,通过生成一系列中间推理步骤或思维链来提高法LLM 的复杂推理能力。
用 Python 从单个文本中提取关键字的四种超棒的方法
到这里我们已经一起学习了在提取关键字/关键短语领域使用的四种最棒的技术,并提供了简单代码实现。这四种方法各有千秋。并且每个都成功地提取了与作者指定的关键字相同或接近并与该领域相关的关键字。