作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《EffectiveJava》独家解析》专栏作者。
热门文章推荐:
- (1)《为什么很多人工作 3 年 却只有 1 年经验?》
- (2)《从失望到精通:AI 大模型的掌握与运用技巧》
- (3)《AI 时代,程序员的出路在何方?》
- (4)《如何写出高质量的文章:从战略到战术》
- (5)《我的技术学习方法论》
- (6)《我的性能方法论》
- (7)《AI 时代的学习方式: 和文档对话》
- (8)《人工智能终端来了,你还在用过时的 iterm?》
一、背景
自从 ChatGPT 出现以后,国内大模型如雨后春笋般不断出现。
在我看来国外最好用的是 New Bing 和 ChatGPT,国内最好用的是天工大模型、讯飞星火、通义千问。
但是,由于众所周知的原因,暂时国内不能直接使用 ChatGPT 、New Bing 、Bard 、Claude 等国外相对先进的模型。
本文主要盘点一下,自己使用过的还不错的大模型,还没有用过大模型的同学可以体验体验。
二、模型推荐
在我看来国内大语言模型能够超过 GPT3.5 的几乎没有,目前用最顺手的是天工 AI 搜索、天工 AI 助手、其次是讯飞星火大模型和通义千问,其他的模型用的较少。
2.1 天工大模型
AI 搜索:https://search.tiangong.cn/
天工 AI 搜索可以理解为 中国版本的 New Bing ,根据问题搜索国内的主要站点,然后通过大模型能力总结回答,用起来比较靠谱,最近用的比较多。
AI 助手:https://neice.tiangong.cn/interlocutionPage
天工大模型是由昆仑万维与奇点智源联合研发的国内首个对标ChatGPT的双千亿级大语言模型,它通过自然语言与用户进行问答式交互,能够满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。
天工大模型具有以下特点:
- 它拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
- 它是基于自研双千亿级大语言模型,包括千亿预训练基座模型和千亿 RLHF 模型,具有更高阶的自主学习和智能涌现能力。
- 它具有独特的全球化场景优势,支持现代汉语、文言文、英语、日语、韩语、德语等多种语言相互翻译。
- 它可以面向更多垂直领域开展应用探索,如金融、医疗、法律等,并且可以进一步提升模型的多样性和适应性,为企业自动化解决文本处理方面提供帮助,降低企业成本、提高工作效率。
2.2 讯飞星火
讯飞星火认知大模型是由科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,提供语言理解、知识问答、逻辑推理、数学题解答、代码理解与编写等多种能力。
讯飞星火认知大模型具有以下特点:
- 它是基于深度学习的、以中文为核心的自然语言处理模型,具备在跨领域多任务上类人的理解和生成能力,可实现基于自然对话方式的用户需求理解与任务执行,用一句话来概括就是“只需一个指令便可以懂你所言、答你所问、创你所需、解你所难、学你所教”。
- 它是基于科大讯飞多年来在认知智能领域的技术积累和创新,结合国家平台和讯飞超脑计划的支撑,持续从海量数据和大规模知识中学习进化,实现从提出问题、规划问题到解决问题的全流程闭环。
- 它是基于讯飞开放平台的服务体系,提供了星火API、星火助手和星火插件三种开放方式,让开发者和用户可以快速接入和使用星火认知大模型的能力,打造独具价值的AI应用。
- 它是基于讯飞AI学习机的硬件载体,将星火认知大模型的能力嵌入到智能硬件中,为用户提供更加便捷和丰富的人机交互体验,实现智慧教育、智慧生活等场景的应用。
2.3 通义千问
网址:https://qianwen.aliyun.com/
通义千问是阿里巴巴发布的全球首个突破 100 万亿参数的AI大模型,它可以处理各种自然语言任务,包括翻译、摘要和对话等。通义千问的参数量超过了 OpenAI 的 GPT-3模型的 1750 亿参数,这是一个重大的里程碑,也让人们对大规模语言模型的未来有了更高的期望。
通义千问是一个专门响应人类指令的大模型,它具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能²。具体到应用上,通义千问可以跟人类进行多轮的交互,也融入了多模态的知识理解,有着非常强的文案创作能力,能够续写小说、编写邮件等,总之可以极大提高我们的工作效率。
通义千问是阿里大模型统一品牌,覆盖语言、听觉、多模态等领域,致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”。
2.4 豆包
字节的豆包大模型是一个AI对话产品,可以和用户进行多种类型的交互,比如聊天、问答、翻译、概括文章和分析情感等。它是基于字节跳动的自研大模型技术开发的,目前已经上线,可以在官网或者App商店下载使用。
豆包的目标是为用户提供有趣、有用、有价值的内容生成服务,帮助用户解决各种问题,提高用户的创造力和效率。豆包还可以自定义机器人,让用户根据自己的喜好和需求创建不同的AI朋友。
豆包和其他大模型产品,比如百度的“文心一言”、阿里的“通义千问”等有一定的区别,主要体现在以下几个方面:
- 豆包是一个独立的App,而不是嵌入在其他产品中,这意味着它更注重用户体验和交互设计,也更有可能形成自己的社区和生态。
- 豆包不仅可以生成文本,还可以生成图像和音频,这使得它能够提供更丰富和多样化的内容形式,也更适合与抖音等短视频平台结合。
- 豆包的数据更新比较及时,能够反映最新的信息和知识,这使得它能够更好地回答用户的问题,也更能跟上时代的变化。
2.5 文心一言
文心一言是百度开发的一款人工智能大语言模型,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
文心一言有以下几个特点:
- 基于 GLM-130B 模型,针对中文的预训练语言模型,具备跨模态、跨语言的深度语义理解与生成能力。
- 有五大能力,分别是文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。
- 可以应用于搜索问答、内容创作生成、智能办公等众多领域和场景。
- 通过百度智能云千帆大模型平台对外提供服务,支持大模型定制开发,生产专属大模型。
- 目前已开放用户申请加入体验,但现仅支持百度帐号绑定中国大陆电话号码的企业级用户和个人用户。
2.6 其他
百川智能(百川大模型)https://baichuan-ai.com
智谱AI(GLM大模型)https://chatglm.cn
中科院(昇思大模型)https://xihe.mindspore.cn
MiniMax(ABAB大模型)https://api.minimax.chat
上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn
华为(盘古大模型) https://pangu.huaweicloud.com/
三、总结
当然,不同人的诉求不同,不同模型擅长的领域也有所不同,但是不同的人看法不同。
本文提供自己接触过的还不错的国内大模型,仅供参考。
创作不易,如果本文对你有帮助,欢迎点赞、收藏加关注,你的支持和鼓励,是我创作的最大动力。
欢迎加入我的知识星球,知识星球ID:15165241 (已经营三年多,会持续经营)一起交流学习。
https://t.zsxq.com/Z3bAiea 申请时标注来自CSDN。
版权归原作者 明明如月学长 所有, 如有侵权,请联系我们删除。