大语言模型 - overfit.cn

可视化FAISS矢量空间并调整RAG参数提高结果精度

在本文中，我们将使用可视化库renumics-spotlight在2-D中可视化FAISS向量空间的多维嵌入，并通过改变某些关键的矢量化参数来寻找提高RAG响应精度的可能性。

Deephub 2024-03-01 10:12:10 0 收藏

谷歌Gemma介绍、微调、量化和推理

这篇文章我们将介绍Gemma模型，然后展示如何使用Gemma模型，包括使用QLoRA、推理和量化微调。

Deephub 2024-02-29 10:24:08 0 收藏

LLMs之Gemma：Gemma(Google开发的新一代领先的开源模型)的简介、安装、使用方法之详细攻略

LLMs之Gemma：Gemma(Google开发的新一代领先的开源模型)的简介、安装、使用方法之详细攻略目录Gemma的简介Gemma的安装Gemma的使用方法Gemma的简介2024年2月21日，Gemma是由Google DeepMind推出的一系列开源的大型语言模型（LLM），基于Gemi

overfit同步小助手 2024-02-26 03:04:14 0 收藏

【AI视野·今日NLP 自然语言处理论文速览第七十九期】Thu, 18 Jan 2024

AI视野·今日CS.NLP 自然语言处理论文速览Thu, 18 Jan 2024Totally 35 papers👉上期速览✈更多精彩请移步主页Daily Computation and Language PapersDeciphering Textual Authenticity: A Gen

overfit同步小助手 2024-02-25 19:01:26 0 收藏

AI之Sora：Sora(文本指令生成视频的里程碑模型)的简介(能力/安全性/技术细节)、使用方法、案例应用之详细攻略

AI之Sora：Sora(文本指令生成视频的里程碑模型)的简介(能力/安全性/技术细节)、使用方法、案例应用之详细攻略目录相关文章Sora的简介Sora的使用方法Sora的案例应用相关文章AI之Sora：Sora(文本指令生成视频的里程碑模型)的简介(能力/安全性/技术细节)、使用方法、案例应用之

overfit同步小助手 2024-02-24 00:01:22 0 收藏

视频生成领域的发展概述:从多级扩散到LLM

在这篇文章中，我们将整理视频生成在最近几年是发展概况，模型的架构是如何发展的，以及现在面临的突出问题。

Deephub 2024-02-20 11:58:05 0 收藏

使用UMAP降维可视化RAG嵌入

在本文中，我们使用LangChain构建RAG应用，并在2D中可视化嵌入，分析查询和文档片段之间的关系和接近度。

Deephub 2024-02-11 10:08:10 0 收藏

从模型到前端，你应该知道的LLM生态系统指南

本文通过介绍这个生态系统的核心组成部分，来详细整理LLM的发展。

Deephub 2024-02-09 10:53:00 0 收藏

MoE-LLaVA:具有高效缩放和多模态专业知识的大型视觉语言模型

MoE-LLaVA利用了“专家混合”策略融合视觉和语言数据，实现对多媒体内容的复杂理解和交互。

Deephub 2024-02-07 10:03:42 0 收藏

使用Mamba和Qdrant数据库实现RAG的代码示例

我们今天来研究一下RAG、Mamba和Qdrant的协同工作，它们的有效组合保证了效率和可扩展性。

Deephub 2024-02-04 11:42:26 0 收藏

深入解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型

Mixtral 8X7B是Mistral AI公司在大语言模型领域的一次重大突破。它采用了一种名为"专家混合"（MoE）的架构，这种架构由8个专家组成，每个专家组有7个亿参数。这种高效的架构使得Mixtral能够在多个领域表现出色，具有出色的处理能力。Mistra l对持续优化的坚定承诺，将确保Mi

overfit同步小助手 2024-02-04 04:01:40 0 收藏

大语言模型的三种主要架构 Decoder-Only、Encoder-Only、Encoder-Decoder

f基于 Transformer 模型以非灰色显示：decoder-only 模型在蓝色分支，encoder-only 模型在粉色分支，encoder-decoder 模型在绿色分支。模型在时间线上的垂直位置表示它们的发布日期。开源模型由实心方块表示，而闭源模型由空心方块表示。右下角的堆积条形图显示了

overfit同步小助手 2024-02-03 21:02:18 0 收藏