国产开源大模型都有哪些?

AGI Eval:微软发布的大模型基础能力评测基准,在2023年4月推出,主要评测大模型在人类认知和解决问题的一般能力,涵盖全球20种面向普通人类考生的官方、公共和高标准录取和资格考试,包含中英文数据。随着ChatGPT引领的大模型热潮,国内的公司开始相继投入研发自己的人工智能大模型,截止到2023

阿里Qwen2开源大模型本地部署及调试全攻略

阿里Qwen2开源大模型本地部署及调试全攻略#Qwen2系列大模型性能卓越,超越业界知名模型。开源后受到AI开发者关注,支持多种语言,提升多语言理解。在预训练和微调上优化,实现智能水平提升。Qwen2系列模型在各项能力上均领先,为全球开发者提供更多选择。通义千问 Qwen2,登顶国内第一大模型!相比

再谈Agent:Dify智能体实现Txet2SQL

什么是Agent?Agent的是能够在一定环境中自主运作并完成特定任务的程序或者系统。自主性:Agent能够在没有人为干预的情况下运行,并独立做出决策。适应性:Agent能够根据环境的变化调整自己的行为。反应性:Agent能够对环境中的变化做出快速反应。预动性:Agent不仅对环境做出反应,还能主动

调用百度的大模型API接口实现AI对话!手把手教程!

本文介绍如何使用百度的大模型API接口实现一个AI对话项目。

探索人工智能大模型在工业领域的应用与发展

探索人工智能大模型在工业领域的应用与发展

LivePortrait 数字人:开源的图生视频模型,本地部署和专业视频制作详细教程

数字人最近比较火,LivePortrait 是快手、中科大和复旦大学联合研发的开源的图生视频模型,比较适合个人、小团体和企业等用于生成自己的数字化人物视频。老牛同学尝试通过本教程,详细介绍如何在本地部署和生成专业视频……

【大模型】大模型中的稀疏与稠密——一场效率与性能的较量

稀疏模型与稠密模型,作为深度学习领域的两股重要力量,各自承载着不同的使命与愿景。在探索未知的征途中,它们既是竞争对手,也是合作伙伴,共同推动着人工智能技术向前迈进。未来,随着算法创新和硬件技术的进步,我们有理由相信,稀疏与稠密的融合将开启深度学习的新篇章,引领我们进入一个更加智能、高效、可持续的AI

斯坦福提出首个开源视觉语言动作大模型OpenVLA

现有的VLA(Vision-Language-Action )模型具有这些局限性:1)大多封闭且开放;2)未能探索高效地为新任务微调VLA的方法,而这是VLAs被采用的关键组成部分。为此本工作开发了OpenVLA,一个基于97万条Open X-Embodiment机器人任务的7B参数开源VLA模型,

Cube-Studio:开源大模型全链路一站式中台

Cube-Studio是由腾讯音乐开源的一款云原生一站式AI中台,覆盖机器学习/深度学习/LLM大模型,开发、训练、推理、应用,全链路。该项目目前已是国内最火的开源算法全链路中台,上千家企业私有化部署和项目交付,非常适合数据算法架构团队搭建公司级AI中台,以及toB企业算法中台类项目交付。

240713-Xinference模型下载、管理及测试

Xinference模型下载、管理及测试

大模型只是轮子,与其闭门重复造轮子,不如深耕场景应用

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举办。在产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏呼吁:“大家不要卷模型,要卷应用!”李彦宏认为,AI技术已经从辨别式转向了生成式,但技术本身并不是目的,真正的价值在于如何将这些技术应用于实际场景,解决实

一文让你搞懂什么是AI大模型

AI大模型(Large AI Models)是指具有大量参数和复杂结构的人工智能模型。这些模型通常基于深度学习技术,能够处理大量数据并从中学习复杂的模式和关系。大模型的出现,极大地提升了AI在各个领域的表现能力。通过本文的介绍,相信你已经对AI大模型有了全面的了解。无论是自然语言处理、图像识别,还是

快速上手AI指令:打造个性化智能交互体验的全面指南

快速上手AI指令:打造个性化智能交互体验的全面指南

提升20%!京东广告模型系统负载均衡揭秘

负载均衡策略作为分布式服务架构的永恒话题之一,对于提高在线集群的资源利用率和服务稳定性十分必要。本文将从京东广告在线模型系统负载均衡策略的演进历程出发,并聚焦于系统最优算力调度下,异构硬件集群负载均衡问题解决策略的相关技术实践。

SecGPT 全球首个网络安全开源大模型且可以在CPU上运行的网络安全大模型

SecGPT 网络安全大模型探索使用网络安全知识训练大模型,能达到怎样的能力边界。SecGPT的愿景是将人工智能技术引入网络安全领域,以提高网络防御的效率和效果。其使命是推动网络安全智能化,为社会提供更安全的数字生活环境。SecGPT可以作为基座安全模型,用于探索各种网络安全任务。以下是对SecGP

大模型【Qwen2-7B本地部署(WEB版)】(windows)

大模型是截止2024年上半年最强的AI,Qwen2是刚出来的号称国内最强开源大模型。这是大模型系列的第一篇文章,旨在快速部署看看最近出来的大模型效果怎么样,效果ok的话就微调自己的GPTs了。

清华大学、中关村实验室、蚂蚁集团等联合发布大模型安全实践白皮书

7月5日下午,清华大学、中关村实验室、蚂蚁集团等机构联合撰写的《大模型安全实践(2024)》白皮书在2024世界人工智能大会上正式发布。这也是国内首份“大模型安全实践”研究报告,为行业打造高价值参考体系。白皮书首次系统化提出安全实践总体框架,从安全性、可靠性、可控性等维度给到了技术实施方案,同时提供

github连接不上的解决方案(持续更新)

本文主要介绍github连接不上的解决方案(持续更新),希望对使用github的同学们有所帮助。文章目录1. 背景2. 解决方案

【AI教程-吴恩达讲解Prompts】第1篇 - 课程简介

欢迎来到面向开发者的提示工程部分,本部分内容基于吴恩达老师的《Prompt Engineering for Developer》课程进行编写。《Prompt Engineering for Developer》课程是由吴恩达老师与 OpenAI 技术团队成员 Isa Fulford 老师合作授课,I

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈