0


遇见“Smaug-72B”:开源人工智能的新霸主

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

一个全新的开源语言模型荣登全球最佳宝座,根据领先的自然语言处理(NLP)研究和应用平台Hugging Face的最新排名显示。https://huggingface.co/abacusai/Smaug-72B-v0.1

这款名为“Smaug-72B”的模型,今天由帮助企业解决人工智能和机器学习领域难题的初创公司Abacus AI公开发布。技术上,Smaug-72B是“Qwen-72B”的优化版本,Qwen-72B是几个月前由阿里巴巴集团的研究团队Qwen发布的另一款强大的语言模型。

最值得注意的是,Smaug-72B在多个热门基准测试中超越了GPT-3.5和Mistral Medium,这两款是由OpenAI和Mistral分别开发的最先进的开源大型语言模型。Smaug-72B也在许多评估中大幅度超越了其衍生模型Qwen-72B。

根据Hugging Face开放语言模型(LLM)排行榜的数据,Smaug-72B现在是唯一一个在所有主要LLM评估中平均分超过80的开源模型。

Abacus AI的CEO Bindu Reddy在X.com上的一篇帖子中表示:“Abacus AI的Smaug-72B现已在Hugging Face上线,位于LLM排行榜之首,是第一个平均分达到80的模型!换句话说,它是世界上最优秀的开源基础模型。”

Smaug-72B尤其擅长于推理和数学任务,这得益于Abacus AI在微调过程中应用的技术。这些技术将在即将发布的研究论文中详细介绍,它们针对大型语言模型的弱点并增强了它们的能力。

Smaug-72B并不是近期唯一引起关注的开源语言模型。Qwen团队背后的Qwen-72B也发布了Qwen 1.5,这是一套从0.5B到72B参数不等的小型但强大的语言模型。

Qwen 1.5超越了如Mistral-Medium和GPT-3.5等流行的开源模型,具有32k的上下文长度,并且能够快速且本地地与各种工具和平台配合使用。Qwen还开源了Qwen-VL-Max,一款新的大型视觉语言模型,与Google和OpenAI分别开发的最先进的专有视觉语言模型Gemini Ultra和GPT-4V相媲美。

Smaug-72B和Qwen 1.5的出现在AI社区及更广泛的领域引发了极大的兴趣和讨论。许多专家和影响者赞扬了Abacus AI和Qwen的成就,并对他们对开源AI的贡献表示钦佩。

Smaug-72B和Qwen 1.5目前可以在Hugging Face上下载、使用和修改。Abacus AI和Qwen还宣布他们计划将他们的模型提交给llmsys人类评估排行榜,这是一个新的基准,用于评估语言模型在人类任务和场景下的表现。Abacus AI和Qwen还暗示了他们未来的项目和目标,包括创建更多的开源模型并将其应用于各种领域和应用。

Smaug-72B和Qwen 1.5代表了今年开源AI快速而显著的进化的最新例证。它们代表了AI创新和民主化的新浪潮,挑战了大型科技公司的主导地位和垄断,为每个人打开了新的可能性和机会。虽然目前还无法预测Smaug-72B将在Hugging Face排行榜上保持顶尖地位多久,但可以肯定的是,开源AI正迎来了年初的大时刻。


本文转载自: https://blog.csdn.net/2301_79342058/article/details/136074461
版权归原作者 新加坡内哥谈技术 所有, 如有侵权,请联系我们删除。

“遇见“Smaug-72B”:开源人工智能的新霸主”的评论:

还没有评论