0


盘点AI大模型

AI大模型以一种野蛮的方式,闯入你我的生活之中,而且进步的速度一日千里,从问答对话到辅助编程,从图画解析到自主创作,AI所展现出来的能力,超出了多数人的预料,让不少人惊呼:“未来是属于AI的”。

随着ChatGPT的公布,全球主要的科技企业都开始加快AI大模型的研发,为这个崭新的领域带来无限的可能,接下来,我们将盘点在过去的一年里,创新性、应用领域、AI性能均排名前列的十个AI大模型,让大家可以轻松了解目前AI大模型最前沿的实力。(以下排名不分先后,以首字母(拼音)顺序进行排列)。

1.ChatGPT:AI大模型「开山祖师」

ChatGPT被誉为AI大模型的始祖,由OpenAI开发并在2022年11月首次对外公布,作为首个现象级AI模型,ChatGPT如今已经迭代到了4.0版本,拥有远超ChatGPT 3.5的处理能力,而且支持插件加载、实时网络连接等多个功能。

目前,人们已经为ChatGPT 4.0设计了成千上万个不同功能的插件,从编程到画画,从写诗到编曲,ChatGPT可以说样样精通。当然,能够实现这些功能,主要还是因为ChatGPT本身就是一个多模态AI模型,可以识别并分析多种数据。

ChatGPT也是目前多数人可以接触到的最强AI模型。

2.Claude:OpenAI「后花园」

Claude的名字大家或许比较陌生,不过背后的团队却大有来头,创始人Dario Amodei为前OpenAI副总裁,带领部分员工创办了Anthropic,经过一系列的改进与升级,如今的Claude被认为是仅次于ChatGPT的AI模型,并且更擅长处理长语言文本。

Claude在近期经过升级后,最大可支持200k的文字输入,远超ChatGPT 4.0 Turbo的128K,不过,相对于ChatGPT活跃的用户生态,Claude的使用人数和应用范围都相对小很多。

但是,在前段时间的OpenAI内部动乱期间,Claude还是成为许多企业的备用选择。因为Claude的团队核心成员大多来自OpenAI,所以某种程度上可以视为ChatGPT的弱化版,虽然综合性能上不如ChatGPT强大,但是在长文本阅读、回答等方面有一定的优势。

3.Gemini:背靠巨头的「小萌新」

从发布时间来看,Gemini无疑是AI模型领域的“萌新”,但是从官方描述来看,其实力之强恐怕只有ChatGPT可以与其扳手腕。Gemini是谷歌AI实验室的作品,同时也是一个多模态模型,可以同时处理文字、音频、图像等多种数据,使得Gemini拥有出色的多任务处理能力。

不过,Gemini发布没多久就闹出了笑话,在回答中称自己是百度开发的文心一言(中文语境下)或OpenAI开发的ChatGPT(英文语境下),虽然后续谷歌对Gemini进行了紧急维护,封堵了漏洞,但是依然引发了网友的热烈讨论。

目前Gemini还处在测试阶段,谷歌的这个多模态大模型能否超越ChatGPT仍然是个未知数,但是至少从体验来看,Gemini综合了谷歌旗下不少AI模型的优点,在实际使用中或许能够给你带来惊喜。

4.华为云盘古:全生态AI引领者

华为云的盘古AI大模型虽然在普通人中知名度不高,但是在行业中的商业化道路却是走得最远、最广的,盘古AI大模型包括了NLP大模型、CV大模型、科学计算大模型等多个AI大模型在内的合集,使其可以被应用到科学研究、教育、交通、工业等多个行业中。

为了更好的发挥AI大模型性能,华为结合自身的产业及产品优势,让盘古AI大模型进入到矿山、政务、金融、气象等多个领域中,并且已经落地部署了多种应用。此外,盘古AI大模型还是首个训练参数超千亿的中文大模型,整体实力名列前茅且在工业领域的应用已然领先。

5.LLaMA 2:人气超群的「元宇宙」玩家

LLaMA 2是由互联网巨头Meta开发的AI模型,作为一个开源的AI模型,LLaMA 2能够提供参数量从7B到65B的不同AI模型,为不同需求的用户提供服务。得益于LLaMA 2出色的效率,即使在参数量较低的情况下,其依然能够表现出不错的性能,使得其在小型及移动设备上的本地化部署更有优势。

相较于LLaMA,LLaMA 2在多语言处理方面有所增强,同时强化了自然对话能力和长文本理解能力,生成的内容连贯性更强,降低了出现错误内容的几率,结合开源特性,使其可以得到快速的应用和普及。

在多项测试中,LLaMA 2的实际成绩都在开源模型中名列前茅,使其成为最受欢迎的开源AI模型之一,虽然LLaMA 2距离ChatGPT等头部AI模型还有不小距离,但是它仍然是AI爱好者及中小企业的不错选择。

6.通义:直面用户、贴地飞行

通义是由阿里推出的中文AI大模型系列,同时也是小雷熟悉的模型之一,目前通义旗下有通义千问、通义万相、通义灵码等多个AI模型入口,可以帮助解决许多问题,比如通义千问就是一个自然对话AI模型,并且提供基于文字的多种用途功能。

通义千问作为阿里的中文AI大模型,在商务信息等数据的查询上更有优势,准确率也更高。目前,通义2.0已经升级为拥有千亿参数量的AI模型,在语言理解、问题判断等方面都有更好的表现,接下来,阿里打算让其接入钉钉等旗下App,为用户提供实时的在线AI支持,甚至支持AI下单等多样化功能,

基于阿里的产品生态矩阵,通义大模型已经在多个App中落地并为用户提供服务,可以说是国产大模型中与用户关系最紧密的一个,从钉钉到淘宝你都能看到通义大模型的身影,感兴趣的朋友不妨去试试淘宝的淘宝问问功能,会有不少惊喜。

7.文心一言:谷歌都要「学习」的中文大模型佼佼者

文心一言是由百度推出的新一代知识增强大语言模型,得益于百度在AI技术领域的长期投入和搜索引擎市场的领导地位,文心一言是国内进步速度最快的AI大模型,在各类写作、文案创意、问答、咨询、代码等方面都有出色的表现,而且能够提供更契合中文语境的内容。

目前,文心一言网页端的一言百宝箱中提供丰富的应用场景和prompt模板,基本覆盖国内网友的日常需求,还有丰富的插件商城,包括PPT助手,长文档摘要问答,学术检索助手、思维导图等拓展大模型的能力。

不得不说,文心一言在对用户的需求探知上做得很不错,提供了许多有意思的功能,目前文心一言已经免费开放,是基于文心3.5版本,如果想体验更强大的文心大模型4.0版本,则需要开通会员,不过就小雷的体验来说,性价比还是很高的。

8.讯飞星火:AI领域的「翻译官」

讯飞星火,看名字就知道是谁的产品,讯飞作为国内头部人工智能企业,在语音合成识别、多语种、认知智能等方面具有显著优势,在涉足AI模型领域后也将自己的优势发挥得淋漓尽致,在语音对话、翻译、文案撰写等方面的表现非常不错,而且基于星火大模型,讯飞也在整合旗下的多款硬件产品,让用户可以随身携带和使用星火大模型。

目前,讯飞星火的参数量级已经突破千亿,并且在测试中领先于ChatGPT,不过依然落后于ChatGPT 4.0,按照讯飞的计划,星火AI大模型将在2024年上半年达到ChatGPT 4.0的水平。

此外,讯飞星火还推出了内容大师等客户端及App,帮助用户建立更直接、方便的使用方案,辅佐用户更好的管理内容发布、创作、审核等工作,在AI的帮助下,我们的工作效率正在得到显著提升。

9.有道子曰:智慧化教育的「紫薇星」

子曰是有道推出的教育大模型,这是有道针对教育场景所研发的垂直品类大模型,也是首批获得国家相关认证的大模型之一。网易有道此前推出了大模型翻译、作文指导、语法精讲、虚拟人口语教练、AIBox、等六大创新应用,并已经落地到有道词典、有道词典笔、有道学习机等多种软硬件产品中。

子曰是少见的针对性垂直大模型,相对于通用类大模型,在教育领域的应用表现尤为突出。这款模型结合了先进的自然语言处理技术,特别适用于教育环境,能够提供个性化学习体验和增强教学效果。

通过将教育大模型与软硬件产品的结合,子曰大模型的应用场景得到了广泛的拓展,其用户体验在很多方面超越了通用大模型。与通用大模型相比,子曰在教育领域能够为学习者提供个性化的学习体验,帮助获得更高效的学习成果。随着在线教育日益受到重视,子曰大模型的发展前景非常广阔。

10.智谱AI:手机、车载领域的新宠儿

智谱AI虽然名气没有通义、文心、星火等大厂模型大,但是背后的团队却是最早进入AI模型领域的力量之一。智谱AI早在2020年就发布了自研的GLM-10B百亿参数模型,2023年研发了双语千亿级超大规模预训练模型GLM-130B,并且在今年10月发布了第三代基座大模型ChatGLM3,国内首推代码交互能力,支持图像处理、数学计算、数据分析等多个场景,并支持昇腾、海光DCU等10余种国产硬件适配。

作为国内最早开源的AI模型之一,智谱AI对国内的AI模型发展贡献了很多力量,目前也依然出于领先地位,相对于其它AI模型,智谱AI在效率、国产适配等方面都有这出色的表现,加上开源生态,使其成为国内不少企业的合作对象。

标签: 人工智能 chatgpt

本文转载自: https://blog.csdn.net/zhangjunli/article/details/136182187
版权归原作者 zhangjunli 所有, 如有侵权,请联系我们删除。

“盘点AI大模型”的评论:

还没有评论