LLaMA - overfit.cn

【大模型系列篇】本地问答系统-部署Ollama、Open WebUI

部署本地大模型，结合Ollama、Open WebUI以及本地RAG（Retrieval-Augmented Generation）可以为用户提供一个强大的本地知识库和交互式对话系统。

overfit同步小助手 2024-08-12 16:04:23 0 收藏

Meta发布Llama 3.1 405B模型：开源与闭源模型之争的新篇章

在人工智能领域，开源与闭源模型之争一直是热点话题。近日，Meta发布了最新的Llama 3.1 405B模型，以其强大的性能和庞大的参数规模，成为了开源模型中的佼佼者。本文将详细介绍Llama 3.1 405B模型的性能、功能及其在开源领域的影响，并探讨开源与闭源模型的未来发展。

overfit同步小助手 2024-08-10 21:04:34 0 收藏

AI多模态实战教程：面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理

MiniCPM-V 2.0，这是MiniCPM系列的多模态版本。MiniCPM-V 2.0显示出强⼤的OCR和多模态理解能⼒，在开源模型中的OCRBench上表现出⾊，甚⾄在场景⽂本理解上可以与Gemini Pro相媲美。MiniCPM-V 系列是专为视觉-语⾔理解设计的多模态⼤型语⾔模型（MLLM

overfit同步小助手 2024-08-10 11:01:20 0 收藏

扎克伯格：Llama将成AI界的Linux

Meta创始人兼CEO马克·扎克伯格在博文中阐述了Llama开源AI的愿景，认为其有潜力成为AI领域的Linux。他表示，开源AI能满足不同组织的需求，提供数据保护和经济实惠的解决方案，避免被封闭供应商锁定。Meta希望Llama成为长期标准的生态系统。

overfit同步小助手 2024-08-09 11:01:44 0 收藏

Llama-3.1 405B开源模型提前泄露，超越GPT-4o；Notion突破1亿用户里程碑 | AI头条

整理 | 王启隆出品 | AI 科技大本营（ID：rgznai100）一分钟速览新闻点！Llama-3.1 405B 提前泄露，首个超越 GPT-4o 的开源模型Notion 达成 1 亿用户里程碑，创始人回顾发展历程马斯克购十万张 H100 显卡打造超算集群，加速 AI 模型训练马斯克称 xAI

overfit同步小助手 2024-08-05 11:04:29 0 收藏

探索LLaMA模型：架构创新与Transformer模型的进化之路

LLaMA模型代表了一种先进的人工智能技术，能够在自然语言处理（NLP）任务上表现出卓越的能力，如文本生成、问答、对话交互、机器翻译以及其他基于语言的理解和生成任务。LLaMA模型家族的特点在于包含了不同参数规模的多个模型版本，参数量从70亿（7B）至650亿（65B）不等。这些模型设计时借鉴了Ch

overfit同步小助手 2024-08-02 20:08:23 0 收藏

LLAma-Factory框架详细使用方法-0.8.3版本

注：如果你的模型比较大，一台显卡无法加载你的模型，你可以选择使用deepspeed单机多卡，DeepSpeed stage选择zero3，如果你一张显卡能够微调，但你有多张显卡的话，这里建议你使用zero2，可以提高接近两倍的训练速度，也就是节省一半的时间。如果你的模型参数比较大，一张卡无法加载你的

overfit同步小助手 2024-08-02 20:08:08 0 收藏

【最新最热】开源引领未来：Llama 3.1震撼发布，405B参数超越闭源GPT-4，扎克伯格宣告AI分水岭到来

该论文不仅全面阐述了Llama 3.1的诞生历程，更深入剖析了预训练数据的筛选与过滤、退火技术的运用、合成数据的生成、缩放定律的遵循、训练基础设施的构建与优化、并行计算的高效实现、训练配方的精细调整、训练后适应的策略、各类工具的应用技巧、基准测试的全面覆盖、推理策略的精心设计、模型量化的技术挑战以及

overfit同步小助手 2024-08-01 19:04:20 0 收藏

Ollama+Open WebUI部署大模型在linux平台

本地使用Ollama+OpenWebUI部署大模型

overfit同步小助手 2024-08-01 16:04:31 0 收藏

使用 Llama-Agents、Qdrant 和 Kafka 进行高级实时 RAG

在当今数据驱动的世界中，实时处理和检索信息的能力至关重要。本文深入探讨了使用Llama-Agents、Qdrant 和 Kafka 的高级实时检索增强生成 (RAG)。通过集成这些强大的工具，我们创建了一个可以有效管理数据提取、处理和检索的代理系统。了解此架构如何动态处理用户查询、平衡工作负载并确保

overfit同步小助手 2024-07-29 19:03:29 0 收藏

一文速览Llama 3.1——对其92页paper的全面细致解读：涵盖语言、视觉、语音的架构、原理

llama3 刚出来时，其长度只有8K对于包括我司在内的大模型开发者是个小小的缺憾，好在很快，在7.23日，Meta发布了Llama 3.1，长度终于达到了128K这个长度使得可以直接通过我司的paper-review数据集去微调了如此，便有了本文：解读下llama3.1的paper，结果一看92页

overfit同步小助手 2024-07-28 23:02:20 0 收藏

服务器Ubuntu22.04系统下 ollama的详细部署安装和搭配open_webui使用

overfit同步小助手 2024-07-28 15:04:26 0 收藏

一文读懂Llama2的架构和推理过程

Meta公司发布了一众备受瞩目的Llama系列大模型，其中的佼佼者无疑是优化后的Llama 2系列该模型训练数据集2万亿token，上下文长度是由llama的2048扩展到4096，在各种基准集的测试上表现突出。深入了解Llama 2，可用于研究和商业用途。我们今天主要来了解一下该模型的整体结构和推

overfit同步小助手 2024-07-27 14:02:25 0 收藏

DeepMind CEO：AI可以发现室温超导；Llama 3.1算对9.9＞9.11 | AI头条

DeepMind CEO：AI 将增强科学，如设计新药、发现室温超导、破解数学猜想传谷歌、Meta 竞购雷朋眼镜母公司340 万浏览！Claude 编程引发开发者热潮可以解决“9.11 > 9.9”问题？Llama-3.1 模型即将发布尼克·博斯特罗姆：人工智能会超越人类智能ElevenLab

overfit同步小助手 2024-07-25 19:01:09 0 收藏

text-generation-webui在linux服务器上的部署和运行（保姆教程/踩坑记录）

本篇将以部署CodeLLama-7b模型为例，手把手记录该webui的部署实践过程。

overfit同步小助手 2024-07-24 11:02:35 0 收藏

【LLM】三、open-webui+ollama搭建自己的聊天机器人

前面的文章，我们已经学习了如何在本地搭建并调用自己大模型，今天我们的主要内容是通过open-webui+Ollama来搭建一个聊天机器人的前端页面。

overfit同步小助手 2024-07-17 03:04:02 0 收藏

AI初识--LLM、ollama、llama都是些个啥？

Ollama是一个开源的 LLM（大型语言模型）服务工具，用于简化在本地运行大语言模型，降低使用大语言模型的门槛，使得大模型的开发者、研究人员和爱好者能够在本地环境快速实验、管理和部署最新大语言模型，包括如Llama 3、Phi 3、Mistral、Gemma等开源的大型语言模型。library因此

overfit同步小助手 2024-07-16 19:01:51 0 收藏

【AI大模型应用开发】【LlamaIndex教程】1. 数据连接模块教程（附代码）

今天我们开始系统化学习LlamaIndex，首先看一下LlamaIndex的Load部分。Load部分负责文件数据链接。

overfit同步小助手 2024-07-15 07:01:26 0 收藏

Llama（二）：Open WebUI作为前端界面，使用本机的llama3

Open WebUI是一个可扩展、功能丰富、用户友好的自托管WebUI，旨在完全离线操作。它支持各种LLM运行程序，包括Ollama和OpenAI兼容的API。

overfit同步小助手 2024-07-10 22:04:25 0 收藏

【AI基础】大模型部署工具之ollama的安装部署以及api调用

ollama是大模型部署方案，对应docker，本质也是基于docker的容器化技术。ollama提供了openAI兼容的api，可以最大限度的减少理解和开发成本。

overfit同步小助手 2024-07-08 20:01:16 0 收藏