【自然语言处理】从词袋模型到Transformer家族的变迁之路

本文简要介绍了 BOW、TF-IDF、Word2Vec、Transformer、BERT、GPT、RoBERTa、 XLM、Reformer、ELECTRA、T5 等模型。

LLaMA:7B参数量的Baby版ChatGPT窥探

本文通过造一些prompt初步窥探了7B版本的LLaMA,所生成的结果比较依赖于prompt的质量,有资源可以尝试65B参数量的版本。

本手、妙手、俗手?我用AI写2022高考全国作文题,会被看出来?

自然语言处理是人工智能领域的前沿学科和热点方向,本文试着用NLP文章生成模型写了2022年高考作文题,有点意思

Meta最新模型LLaMA细节与代码详解

本文对Facebook Meta AI最新提出的大语言模型LLaMA进行简单的介绍,以及对其开源出的代码和细节进行了详细的说明。

NLP工具——doccano标注系统自动标注功能使用

本文以序列标注为例,介绍doccano标注系统中,自动标注功能的使用。doccano是一个轻量的开源数据标注平台,采用Django实现,其主要优点在于部署和使用十分简便,个人认为比brat要方便很多。并且它支持自动标注和多人协同标注。...

ChatGPT介绍以及一些使用案例

ChatGPT就是一个高级的聊天机器人,跟微软的小冰、苹果的Siri、小米的小爱同学和阿里的天猫精灵等比较类似。之所以最近这么火爆,主要原因是依赖其大量的语料的训练和人工的标注调整(RLHF),它已经能达到甚至超越真人的水平了,而人类生成一段文本可能需要比较长时间的思考,而ChatGPT却只需要不到

【文心一言】什么是文心一言,如何获得内测和使用方法。

文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检

使用Python Seaborn绘制热力图(heatmap)的时候怎么改变配色

【代码】使用Python Seaborn绘制热力图(heatmap)的时候怎么改变配色。

自然语言处理概述 NLP基本流程

自然语言处理(Natural Language Processing,NLP)是指利用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输人、输出、识别、分析、理解、生成等进行操作和加工的过程。

扩散模型训练太难?来看看Meta AI最新提出的KNN-Diffusion

我们总会发现,我们迸发出的每一个想法都是从脑海中相似的印象中复制的

【实战篇】是时候彻底弄懂BERT模型了(收藏)

如何弄懂BERT模型,当然是理论+实战了。本文就告诉大家如何实战BERT模型。

中文ChatGPT平替——ChatGLM:全新对话模型内测,手把手调教开源单卡版本

ChatGLM是一个具备问答和对话功能的语言模型,目前处于内测阶段,已经开启邀请制,并且将逐步扩大内测范围。此外,ChatGLM也已经开源了最新的中英双语对话模型ChatGLM-6B,结合模型量化技术,用户可以在消费级显卡上进行本地部署。ChatGLM-6B共经过约1T标识符的中英双语训练,辅以监督

ChatGPT平替版本推荐以及试用体验

随着ChatGPT的爆火,一些区域对ChatGPT的封杀,大家对ChatGPT的使用门槛越来越高,部分同学想访问ChatGPT缺因为门槛无法访问,现在给大家推荐一些ChatGPT的平替版本,后续我也会更新我自己的使用体验,也欢迎大家讲自己的体验通过评论或者留言的方式告诉我。

ChatGPT介绍

ChatGPT是一种基于人工神经网络和自然语言处理技术的大型语言模型,由OpenAI公司开发。它的目标是模拟人类的对话方式,并能够生成准确、流畅、自然的文本响应。ChatGPT是建立在Transformer模型上的,它通过处理大量的自然语言数据,学习自然语言的规则和模式,并能够生成与给定输入相匹配的

时间序列数据预测结果为一条直线原因总结

时间序列数据预测结果为一条直线原因总结

使用微软新必应(New Bing)AI机器人生成树莓派Pico W开发板MicroPython应用程序

微软新必应是一款由人工智能驱动的AI搜索引擎(基于Chat GPT4.0自然语言生成模型),它能与用户进行流畅、自然、有趣的对话,并提供可靠、及时的搜索结果,以及回答用户的各种问题。我们可以使用新必应生成程序代码、诗歌、故事、歌词等内容,或者模仿名人发表段子、推文等内容。树莓派Pico W开发板是树

【自然语言处理】Word2Vec 词向量模型详解 + Python代码实战

如下图所示,在神经网络初始化的时候,我们会随机初始化一个 N×K 的矩阵,其中 N 是 词典的大小,K 是词向量的维数(一个自行设定的超参数)。下面提出了一个初始解决方案:假设,传统模型中,我们输入 not ,希望输出是 thou,但是由于语料库庞大,最后一层 SoftMax 太过耗时,所以我们可以

ChatGPT 简介

ChatGPT 现在还处于测试阶段,可以看出在未来它可以极大地提升人类的生产力。但由于这是一个新鲜事物,还没有完善的法规和政策对它进行约束和规范,所以可能会存在一些数据安全等问题。要想实现ChatGPT以及类似产品在国内的落地与商业化,还有很长的路要走。

AI遮天传 NLP-词表示

NLP-词表示

升级篇:超详细ChatGPT(GPT 4.0)论文润色指南+最全提示词——持续更新

不看后悔!ChatGPT 4.0一站式论文助攻指南,革新论文写作方式。