大语言模型 - overfit.cn

AI大模型低成本快速定制法宝：RAG和向量数据库

当今人工智能领域，最受关注的毋庸置疑是大模型。然而，高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下，向量数据库凭借其独特的优势，成为解决低成本快速定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技术。它采用高效的索引和查询算法，实现了

overfit同步小助手 2023-11-17 09:01:19 0 收藏

大语言模型量化方法对比：GPTQ、GGUF、AWQ

在过去的一年里，大型语言模型(llm)有了飞速的发展，在本文中，我们将探讨几种(量化)的方式，除此以外，还会介绍分片及不同的保存和压缩策略。

Deephub 2023-11-16 10:24:42 0 收藏

AI大模型低成本快速定制秘诀：RAG和向量数据库

当今人工智能领域，最受关注的毋庸置疑是大模型。然而，高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下，向量数据库凭借其独特的优势，成为解决低成本快速定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技术。它采用高效的索引和查询算法，实现了

overfit同步小助手 2023-11-15 09:01:25 0 收藏

XoT：一种新的大语言模型的提示技术

这是微软在11月最新发布的一篇论文，它增强了像GPT-3和GPT-4这样的大型语言模型(llm)解决复杂问题的潜力。

Deephub 2023-11-12 09:28:26 0 收藏

LoRAShear:微软在LLM修剪和知识恢复方面的最新研究

LoRAShear是微软为优化语言模型模型(llm)和保存知识而开发的一种新方法。它可以进行结构性修剪，减少计算需求并提高效率。

Deephub 2023-11-11 11:02:40 0 收藏

Spectron: 谷歌的新模型将语音识别与语言模型结合进行端到端的训练

Spectron是谷歌Research和Verily AI开发的新的模型。与传统的语言模型不同，Spectron直接处理频谱图作为输入和输出。该模型消除归纳偏差，增强表征保真度，提高音频生成质量。

Deephub 2023-11-05 08:52:34 0 收藏

AutoGen完整教程和加载本地LLM示例

Autogen是一个卓越的人工智能系统，它可以创建多个人工智能代理，这些代理能够协作完成任务，包括自动生成代码，并有效地执行任务。

Deephub 2023-11-01 09:28:48 0 收藏

使用Llama index构建多代理 RAG

检索增强生成(RAG)已成为增强大型语言模型(LLM)能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示，RAG为LLM提供了有用的上下文，以产生基于事实的输出。

Deephub 2023-10-31 09:04:25 0 收藏

Table-GPT:让大语言模型理解表格数据

在这篇文章中，我们将介绍微软发表的一篇研究论文，“Table-GPT: Table- tuning GPT for Diverse Table Tasks”，研究人员介绍了Table-GPT

Deephub 2023-10-26 09:46:33 0 收藏

VeRA: 性能相当，但参数却比LoRA少10倍

VeRA在LoRA冻结的低秩张量上添加可训练向量，只训练添加的向量。论文中显示的大多数实验中，VeRA训练的参数比原始LoRA少10倍。

Deephub 2023-10-25 09:40:19 0 收藏

LlamaIndex使用指南

LlamaIndex是一个方便的工具，它充当自定义数据和大型语言模型(llm)(如GPT-4)之间的桥梁，大型语言模型模型功能强大，能够理解类似人类的文本

Deephub 2023-10-24 10:48:20 0 收藏

利用微软Bing AI语言大模型辅助提高写代码、阅读代码、解bug的效率

有时候我们遇到问题会去Google搜索答案，但有些问题如果我们问Bing Ai可能会更好，Bing AI是结合了大语言模型和bing搜索，但这里不是说每次遇到问题都交给Bing AI，有时候可能其他方法更好，有时候可能Bing AI更好，我们可以把Bing AI作为工具或者方法的其中一种，可以和我们

overfit同步小助手 2023-10-24 06:01:16 0 收藏