遇见“Smaug-72B”：开源人工智能的新霸主

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

一个全新的开源语言模型荣登全球最佳宝座，根据领先的自然语言处理（NLP）研究和应用平台Hugging Face的最新排名显示。https://huggingface.co/abacusai/Smaug-72B-v0.1

这款名为“Smaug-72B”的模型，今天由帮助企业解决人工智能和机器学习领域难题的初创公司Abacus AI公开发布。技术上，Smaug-72B是“Qwen-72B”的优化版本，Qwen-72B是几个月前由阿里巴巴集团的研究团队Qwen发布的另一款强大的语言模型。

最值得注意的是，Smaug-72B在多个热门基准测试中超越了GPT-3.5和Mistral Medium，这两款是由OpenAI和Mistral分别开发的最先进的开源大型语言模型。Smaug-72B也在许多评估中大幅度超越了其衍生模型Qwen-72B。

根据Hugging Face开放语言模型（LLM）排行榜的数据，Smaug-72B现在是唯一一个在所有主要LLM评估中平均分超过80的开源模型。

Abacus AI的CEO Bindu Reddy在X.com上的一篇帖子中表示：“Abacus AI的Smaug-72B现已在Hugging Face上线，位于LLM排行榜之首，是第一个平均分达到80的模型！换句话说，它是世界上最优秀的开源基础模型。”

Smaug-72B尤其擅长于推理和数学任务，这得益于Abacus AI在微调过程中应用的技术。这些技术将在即将发布的研究论文中详细介绍，它们针对大型语言模型的弱点并增强了它们的能力。

Smaug-72B并不是近期唯一引起关注的开源语言模型。Qwen团队背后的Qwen-72B也发布了Qwen 1.5，这是一套从0.5B到72B参数不等的小型但强大的语言模型。

Qwen 1.5超越了如Mistral-Medium和GPT-3.5等流行的开源模型，具有32k的上下文长度，并且能够快速且本地地与各种工具和平台配合使用。Qwen还开源了Qwen-VL-Max，一款新的大型视觉语言模型，与Google和OpenAI分别开发的最先进的专有视觉语言模型Gemini Ultra和GPT-4V相媲美。

Smaug-72B和Qwen 1.5的出现在AI社区及更广泛的领域引发了极大的兴趣和讨论。许多专家和影响者赞扬了Abacus AI和Qwen的成就，并对他们对开源AI的贡献表示钦佩。

Smaug-72B和Qwen 1.5目前可以在Hugging Face上下载、使用和修改。Abacus AI和Qwen还宣布他们计划将他们的模型提交给llmsys人类评估排行榜，这是一个新的基准，用于评估语言模型在人类任务和场景下的表现。Abacus AI和Qwen还暗示了他们未来的项目和目标，包括创建更多的开源模型并将其应用于各种领域和应用。

Smaug-72B和Qwen 1.5代表了今年开源AI快速而显著的进化的最新例证。它们代表了AI创新和民主化的新浪潮，挑战了大型科技公司的主导地位和垄断，为每个人打开了新的可能性和机会。虽然目前还无法预测Smaug-72B将在Hugging Face排行榜上保持顶尖地位多久，但可以肯定的是，开源AI正迎来了年初的大时刻。

标签：人工智能语言模型自然语言处理

本文转载自: https://blog.csdn.net/2301_79342058/article/details/136074461
版权归原作者 新加坡内哥谈技术 所有，如有侵权，请联系我们删除。

遇见“Smaug-72B”：开源人工智能的新霸主

发表评论

“遇见“Smaug-72B”：开源人工智能的新霸主”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航