大模型 - overfit.cn

AI大模型在企业应用中的前沿技术与趋势

预训练模型（Pre-trained Models, PTMs）是近年来大模型技术中的重要突破，特别是在自然语言处理领域，预训练模型通过大规模数据的预训练，学习到了丰富的语言表示，再通过微调（fine-tuning）应用到具体任务中。大模型在数据分析中的应用越来越广泛，特别是在金融、零售等领域，通过大

overfit同步小助手 2024-09-09 12:01:18 0 收藏

Ollama+OpenWeb UI搭建最简单的大模型交互界面

Open WebUI是一个专为大型语言模型（LLMs）设计的Web用户界面。这个界面提供了一个直观、响应迅速且易于使用的平台，使用户能够与本地运行的语言模型进行交互，就像与云服务中的模型交互一样。可以非常方便的调试、调用本地模型。你能用它连接你在本地的大语言模型（包括 Ollama 和 OpenAI

overfit同步小助手 2024-08-31 15:04:37 0 收藏

国内唯一兼具AI+安全双重优势，三六零首推免费安全大模型

7月31日，在ISC.AI2024第十二届互联网安全大会上，三六零集团创始人周鸿祎表示，用AI重塑安全的本质是让安全做到“自动驾驶”，360首推安全大模型，对购买360标准产品的用户免费提供大模型标准能力，实现大模型普惠和安全行业新质生产力变革。

overfit同步小助手 2024-08-30 18:07:22 0 收藏

国产开源大模型都有哪些？

AGI Eval：微软发布的大模型基础能力评测基准，在2023年4月推出，主要评测大模型在人类认知和解决问题的一般能力，涵盖全球20种面向普通人类考生的官方、公共和高标准录取和资格考试，包含中英文数据。随着ChatGPT引领的大模型热潮，国内的公司开始相继投入研发自己的人工智能大模型，截止到2023

overfit同步小助手 2024-08-30 03:04:07 0 收藏

阿里Qwen2开源大模型本地部署及调试全攻略

阿里Qwen2开源大模型本地部署及调试全攻略#Qwen2系列大模型性能卓越，超越业界知名模型。开源后受到AI开发者关注，支持多种语言，提升多语言理解。在预训练和微调上优化，实现智能水平提升。Qwen2系列模型在各项能力上均领先，为全球开发者提供更多选择。通义千问 Qwen2，登顶国内第一大模型！相比

overfit同步小助手 2024-08-28 17:04:54 0 收藏

再谈Agent：Dify智能体实现Txet2SQL

什么是Agent?Agent的是能够在一定环境中自主运作并完成特定任务的程序或者系统。自主性：Agent能够在没有人为干预的情况下运行，并独立做出决策。适应性：Agent能够根据环境的变化调整自己的行为。反应性：Agent能够对环境中的变化做出快速反应。预动性：Agent不仅对环境做出反应，还能主动

overfit同步小助手 2024-08-23 16:01:44 0 收藏

一文搞懂LLM大模型！LLM从入门到精通万字长文（2024.7月最新）

LLM大模型从入门到精通

overfit同步小助手 2024-08-23 12:01:35 0 收藏

调用百度的大模型API接口实现AI对话！手把手教程！

本文介绍如何使用百度的大模型API接口实现一个AI对话项目。

overfit同步小助手 2024-08-20 21:01:30 0 收藏

探索人工智能大模型在工业领域的应用与发展

overfit同步小助手 2024-08-19 18:01:48 0 收藏

LivePortrait 数字人：开源的图生视频模型，本地部署和专业视频制作详细教程

数字人最近比较火，LivePortrait 是快手、中科大和复旦大学联合研发的开源的图生视频模型，比较适合个人、小团体和企业等用于生成自己的数字化人物视频。老牛同学尝试通过本教程，详细介绍如何在本地部署和生成专业视频……

overfit同步小助手 2024-08-19 16:04:08 0 收藏

【大模型】大模型中的稀疏与稠密——一场效率与性能的较量

稀疏模型与稠密模型，作为深度学习领域的两股重要力量，各自承载着不同的使命与愿景。在探索未知的征途中，它们既是竞争对手，也是合作伙伴，共同推动着人工智能技术向前迈进。未来，随着算法创新和硬件技术的进步，我们有理由相信，稀疏与稠密的融合将开启深度学习的新篇章，引领我们进入一个更加智能、高效、可持续的AI

overfit同步小助手 2024-08-17 13:01:48 0 收藏

斯坦福提出首个开源视觉语言动作大模型OpenVLA

现有的VLA(Vision-Language-Action )模型具有这些局限性：1)大多封闭且开放；2)未能探索高效地为新任务微调VLA的方法，而这是VLAs被采用的关键组成部分。为此本工作开发了OpenVLA，一个基于97万条Open X-Embodiment机器人任务的7B参数开源VLA模型，

overfit同步小助手 2024-08-17 09:01:07 0 收藏

Cube-Studio：开源大模型全链路一站式中台

Cube-Studio是由腾讯音乐开源的一款云原生一站式AI中台，覆盖机器学习/深度学习/LLM大模型，开发、训练、推理、应用，全链路。该项目目前已是国内最火的开源算法全链路中台，上千家企业私有化部署和项目交付，非常适合数据算法架构团队搭建公司级AI中台，以及toB企业算法中台类项目交付。

overfit同步小助手 2024-08-16 15:04:30 0 收藏

240713-Xinference模型下载、管理及测试

Xinference模型下载、管理及测试

overfit同步小助手 2024-08-16 14:04:53 0 收藏

大模型只是轮子，与其闭门重复造轮子，不如深耕场景应用

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议全体会议在上海世博中心举办。在产业发展主论坛上，百度创始人、董事长兼首席执行官李彦宏呼吁：“大家不要卷模型，要卷应用！”李彦宏认为，AI技术已经从辨别式转向了生成式，但技术本身并不是目的，真正的价值在于如何将这些技术应用于实际场景，解决实

overfit同步小助手 2024-08-16 09:01:53 0 收藏

一文让你搞懂什么是AI大模型

AI大模型（Large AI Models）是指具有大量参数和复杂结构的人工智能模型。这些模型通常基于深度学习技术，能够处理大量数据并从中学习复杂的模式和关系。大模型的出现，极大地提升了AI在各个领域的表现能力。通过本文的介绍，相信你已经对AI大模型有了全面的了解。无论是自然语言处理、图像识别，还是

overfit同步小助手 2024-08-16 04:01:39 0 收藏

快速上手AI指令：打造个性化智能交互体验的全面指南

overfit同步小助手 2024-08-13 17:01:38 0 收藏

提升20%！京东广告模型系统负载均衡揭秘

负载均衡策略作为分布式服务架构的永恒话题之一，对于提高在线集群的资源利用率和服务稳定性十分必要。本文将从京东广告在线模型系统负载均衡策略的演进历程出发，并聚焦于系统最优算力调度下，异构硬件集群负载均衡问题解决策略的相关技术实践。

overfit同步小助手 2024-08-08 06:06:21 0 收藏

SecGPT 全球首个网络安全开源大模型且可以在CPU上运行的网络安全大模型

SecGPT 网络安全大模型探索使用网络安全知识训练大模型，能达到怎样的能力边界。SecGPT的愿景是将人工智能技术引入网络安全领域，以提高网络防御的效率和效果。其使命是推动网络安全智能化，为社会提供更安全的数字生活环境。SecGPT可以作为基座安全模型，用于探索各种网络安全任务。以下是对SecGP

overfit同步小助手 2024-08-02 00:04:41 0 收藏

大模型【Qwen2-7B本地部署（WEB版）】（windows）

大模型是截止2024年上半年最强的AI，Qwen2是刚出来的号称国内最强开源大模型。这是大模型系列的第一篇文章，旨在快速部署看看最近出来的大模型效果怎么样，效果ok的话就微调自己的GPTs了。

overfit同步小助手 2024-07-26 15:02:46 0 收藏