0


什么是大语言模型?

背景

最近chagpt3|4非常火,导致业界很多人都觉得强人工智能很快就要取代我们这些工程师了,根据了解的确大语言模型建设的人工智能在未来的确可以取代一部分岗位,但是这是否意味着可以放慢脚步?

什么是大语言模型?

大语言模型 (LLM),全称:Large Language Models,LLMs, 代表着 AI 领域的重大进步,并有望通过习得的知识改变该领域。在过去几年中,LLM 的规模每年增加 10 倍,而且随着这些模型的复杂程度和规模的增加,其性能也在不断发展。然而,LLM 的开发与维护并非易事,这使得大多数企业都无法使用 LLM。---英伟达

个人理解:类似于不同国家间的交流,通过翻译进行沟通。而大语言模型就类型中间这个翻译,将现有人类至今的语言文字进行收集、抽象成自已的一套模型,该模型是可以不断完善、可以理解各种语言及语义的关系,并且基于当前文明的底层逻辑进行自动学习和迭代,通过数据+人工进行辅助完善实现可以理解、自动学习的强人工智能。

大语言模型有哪些?

类型

描述

备注

GPT-3|4 (Generative Pretrained Transformer 3|4)

由openApi研发的GPT-3|4 (Generative Pretrained Transformer 3|4)。

chatGPT就是该产品

GPT3参数达1750亿个,GPT4参数达3.5万亿个~。

参考:https://openai.wiki/news-gpt4model-317.html

BERT(Bidirectional Encoder Representation from Transformers)

由google研发双向Transformer的Encoder,因为decoder是不能获要预测的信息的。

参考:https://baijiahao.baidu.com/s?id=1651912822853865814&wfr=spider&for=pc

XLNet (eXtreme Language understanding NETwork)

由CMU和Google共同开发的预训练语言模型,拥有1.5亿个参数,能够进行自然语言处理任务,如文本分类、问答等

参考:https://zhuanlan.zhihu.com/p/147250033

ERNIE Bot(文心一言)

由百度开发的全新一代知识增强大语言模型

参考

https://baike.baidu.com/item/%E6%96%87%E5%BF%83%E4%B8%80%E8%A8%80/62642976

T5(Text-to-Text Transfer Transformer)

也是由谷歌开发的预训练语言模型

参考:

https://zhuanlan.zhihu.com/p/89719631

...

还有非常多,可以自行了解

最后

个人认为人工智能的奇点已到或已过,已经慢慢可以代替部分人类的工作,比如写作这事,最近有些一论文的工作室辞退不少这方面的老师,因为原来指导写一篇论文要最少几周或几个月,而有chatgpt有些学生通过这种方式半小时不到就搞了一篇原创,还有一些脚本写作等相关的岗位据我这边了解都受到了影响,当然细心了解的同学可能也有了解过ai绘图这种,最近导致很多美工被取代了这里绝对是真人真事,我不是为了制造紧张,而只是想说随着未来ai的普及我们很大一部分工作是会被取代掉的,我们应该在接下来学会如何更高效的学习以及如何利用ai在工作中更好的提升效率。不过我还是比较感觉恐惧的,哪天真的ai拥有意识,那么不受管控那不是分分钟把人当草木

最后问一下各位,在未来人工智能对我们的取代性多吗?有哪些岗位可以干到终身?

相关文献:

https://mp.weixin.qq.com/s?__biz=MzI4NzkwODM3NA==&mid=2247487817&idx=1&sn=de593d87d508e34b1388317e180784be&chksm=ebc72630dcb0af26875462b513544500ec1193f3b315682bb823a8ffd4cbb91b4d53bf8c903a&scene=27

https://wenxin.baidu.com/

https://wenku.baidu.com/view/00f6ccdfe63a580216fc700abb68a98270feac1b.html?_wkts_=1679881096196&bdQuery=%E4%BB%80%E4%B9%88%E6%98%AF%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B

https://www.163.com/news/article/I01RQEEF00019UD6.html

https://zhuanlan.zhihu.com/p/52061158

https://baijiahao.baidu.com/s?id=1651912822853865814&wfr=spider&for=pc

https://blog.csdn.net/fs1341825137/article/details/120247499

https://blog.csdn.net/anonymous_me/article/details/129812778

https://blog.csdn.net/WUTab/article/details/73657905

相关论文:

https://www.docin.com/p-2163732292.html

https://www.jianshu.com/p/8d6341ded7eb

https://arxiv.org/pdf/1409.0473.pdf

https://arxiv.org/pdf/1706.03762.pdf

https://arxiv.org/pdf/2203.15556.pdf

https://arxiv.org/pdf/1810.04805.pdf

https://arxiv.org/pdf/1706.03762.pdf

https://baijiahao.baidu.com/s?id=1760876469298017714&wfr=spider&for=pc

https://blog.csdn.net/u011414416/article/details/51057789


本文转载自: https://blog.csdn.net/qq_16498553/article/details/129920343
版权归原作者 逍遥壮士 所有, 如有侵权,请联系我们删除。

“什么是大语言模型?”的评论:

还没有评论