深度学习 - overfit.cn

整合文本和知识图谱嵌入提升RAG的性能

在RAG模型中，文本嵌入和知识嵌入都允许对输入文本和结构化知识进行更全面、上下文更丰富的表示。这种集成增强了模型在答案检索、答案生成、对歧义的鲁棒性和结构化知识的有效结合方面的性能，最终导致更准确和信息丰富的响应。

Deephub 2024-05-03 10:05:35 0 收藏

Gradformer: 通过图结构归纳偏差提升自注意力机制的图Transformer

Gradformer通过引入带有可学习约束的指数衰减掩码，为图Transformer提供了一种新的方法，有效地捕捉了图结构中的本地和全局信息。

Deephub 2024-05-02 09:40:45 0 收藏

如何准确的估计llm推理和微调的内存消耗

在本文中，我将介绍如何计算这些模型用于推理和微调的最小内存。这种方法适用于任何的llm，并且精确的计算内存总消耗。

Deephub 2024-04-29 10:28:03 0 收藏

2024年4月计算机视觉论文推荐

本文将整理4月发表的计算机视觉的重要论文，重点介绍了计算机视觉领域的最新研究和进展，包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等各个子领域

Deephub 2024-04-27 11:15:37 0 收藏

开源向量数据库比较：Chroma, Milvus, Faiss,Weaviate

本文为你提供四个重要的开源向量数据库之间的全面比较，希望你能够选择出最符合自己特定需求的数据库。

Deephub 2024-04-25 10:17:39 0 收藏

微软Phi-3，3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美，量化后还可直接在IPhone中运行

Phi-3是一系列先进的语言模型，专注于在保持足够紧凑以便在移动设备上部署的同时，实现高性能

Deephub 2024-04-24 11:58:07 0 收藏

5种搭建LLM服务的方法和代码示例

在这篇文章中，我们将总结5种搭建开源大语言模型服务的方法，每种都附带详细的操作步骤，以及各自的优缺点。

Deephub 2024-04-22 10:16:43 0 收藏

使用ORPO微调Llama 3

ORPO是一种新的微调技术，它将传统的监督微调和偏好对齐阶段结合到一个过程中。我们将使用ORPO和TRL库对新的Llama 3 8b模型进行微调。

Deephub 2024-04-21 09:59:06 0 收藏

RAG 2.0架构详解：构建端到端检索增强生成系统

当前RAG的问题在于各个子模块之间并没有完全协调，就像一个缝合怪一样，虽然能够工作但各部分并不和谐，所以我们这里介绍RAG 2.0的概念来解决这个问题。

Deephub 2024-04-19 11:49:26 0 收藏

PyTorch小技巧：使用Hook可视化网络层激活（各层输出）

这篇文章将演示如何可视化PyTorch激活层。可视化激活，即模型内各层的输出，对于理解深度神经网络如何处理视觉信息至关重要，这有助于诊断模型行为并激发改进。

Deephub 2024-04-17 09:44:34 0 收藏

ORPO偏好优化：性能和DPO一样好并且更简单的对齐方法

ORPO是另一种新的LLM对齐方法，这种方法甚至不需要SFT模型。通过ORPO，LLM可以同时学习回答指令和满足人类偏好。

Deephub 2024-04-16 10:00:37 0 收藏

时空图神经网络ST-GNN的概念以及Pytorch实现

对于时空图神经网络Spatail-Temporal Graph来说，最简单的描述就是在原来的Graph基础上增加了时间这一个维度，也就是说我们的Graph的节点特征是会随着时间而变化的。

Deephub 2024-04-15 09:55:32 0 收藏

Moirai：Salesforce的时间序列预测基础模型

在本文中，我们将探索用于时间序列预测的 Salesforce 新发布的基础模型 Moirai。最后我们还对比Moirai 与其他两个基础模型之间的差异

Deephub 2024-04-14 11:12:31 0 收藏

PiSSA ：将模型原始权重进行奇异值分解的一种新的微调方法

我们开始看4月的新论文了，这是来自北京大学人工智能研究所、北京大学智能科学与技术学院的研究人员发布的Principal Singular Values and Singular Vectors Adaptation（PiSSA）方法。

Deephub 2024-04-12 10:03:57 0 收藏

YOLOv8改进 | 图像去雾 | 利用图像去雾网络UnfogNet辅助YOLOv8进行图像去雾检测（全网独家首发）

本文给大家带来的改进机制是由AOD-Net提出的UnfogNet超轻量化图像去雾网络，我将该网络结合YOLOv8针对图像进行去雾检测（也适用于一些模糊场景），我将该网络结构和YOLOv8的网络进行结合同时该网络的结构的参数量非常的小，我们将其添加到模型里增加的计算量和参数量基本可以忽略不计这是非常难

overfit同步小助手 2024-04-11 11:06:38 0 收藏

10个大型语言模型(LLM)常见面试问题和答案解析

今天我们来总结以下大型语言模型面试中常问的问题

Deephub 2024-04-11 10:20:34 0 收藏

YOLOv5改进 | 图像去雾 | 利用图像去雾网络AOD-PONO-Net网络增改进图像物体检测（全网独家首发）

本文给大家带来的改进机制是利用AODNet图像去雾网络结合PONO机制实现二次增强，我将该网络结合YOLOv5针对图像进行去雾检测（也适用于一些模糊场景，图片不清晰的检测）同时本文的内容不影响其它的模块改进可以作为工作量凑近大家的论文里，非常的适用，图像去雾检测为群友最近提出的需要的改进，

overfit同步小助手 2024-04-11 04:06:41 0 收藏

人工智能|深度学习——基于Xception算法模型实现一个图像分类识别系统

在计算机视觉领域，图像识别是一个非常重要的任务，其应用涵盖了人脸识别、物体检测、场景理解等众多领域。随着深度学习技术的发展，深度卷积神经网络（Convolutional Neural Networks，简称CNN）在图像识别任务上取得了巨大成功，其中Xception算法作为一种改进型CNN，被广泛应

overfit同步小助手 2024-04-11 04:01:44 0 收藏

AI辅写疑似度多少正常？从七个方面解读疑似度的合理范围！

为了降低疑似度，可以采取多种措施，如选择高水平的AI辅写工具、适当调整参数、加入个人思考和观点等。随着AI技术的发展，AI辅写工具在学术、写作等领域的应用越来越广泛。影响AI辅写疑似度的因素有很多，包括AI技术的水平、使用者的写作习惯、写作主题的难度等。AI辅写疑似度是指使用AI辅写工具生成的文本与

overfit同步小助手 2024-04-10 19:01:37 0 收藏

文献学习-30-GRAB-Net: 用于医学点云分割的图的边界感知网络

香港中文大学袁奕萱教授团队提出了一个包含 GBM、OCM 和 IFM 的 GRAB-Net 框架来解决点云分割中对偶约束不足和上下文混乱，在边界周围进行良好分割效果不佳的问题。 GBM提出在图域中建立语义和边界之间的全局关系，为生成高质量特征提供足够的对偶信息。OCM 利用上下文图在边界外分配适当的

overfit同步小助手 2024-04-10 14:06:29 0 收藏