Deephub 的个人主页

使用PyTorch实现混合专家(MoE)模型

在本文中，我将使用Pytorch来实现一个MoE模型。在具体代码之前，我们先简单介绍混合专家的体系结构。

2024-01-10 09:46:57 0 收藏

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模”

2024-01-09 09:50:39 0 收藏

使用知识图谱提高RAG的能力，减少大模型幻觉

在使用大型语言模型(llm)时，幻觉是一个常见的问题。LLM生成流畅连贯的文本，但往往生成不准确或不一致的信息。防止LLM产生幻觉的方法之一是使用提供事实信息的外部知识来源，如数据库或知识图谱。

2024-01-08 09:33:24 0 收藏

使用PyTorch实现去噪扩散模型

在本文中，我们将深入研究DDPM的复杂性，涵盖其训练过程，包括正向和逆向过程，并探索如何执行采样。在整个探索过程中，我们将使用PyTorch从头开始构建DDPM，并完成其完整的训练。

2024-01-07 10:09:32 0 收藏

Python 中的==操作符和 is关键字

==操作符和is关键字，它们的用途不同，但由于它们有时可以达到相同的目的，所以经常会被混淆。

2024-01-06 09:29:05 0 收藏

4种SVM主要核函数及相关参数的比较

本文将用数据可视化的方法解释4种支持向量机核函数和参数的区别

2024-01-05 09:47:31 0 收藏

使用pytorch构建图卷积网络预测化学分子性质

在本文中，我们将通过化学的视角探索图卷积网络，我们将尝试将网络的特征与自然科学中的传统模型进行比较，并思考为什么它的工作效果要比传统的方法好。

2024-01-04 09:56:18 0 收藏

如何避免LLM的“幻觉”(Hallucination)

生成式大语言模型（LLM）可以针对各种用户的 prompt 生成高度流畅的回复。然而，大模型倾向于产生幻觉或做出非事实陈述，这可能会损害用户的信任。

2024-01-03 09:35:25 0 收藏

加速Python循环的12种方法,最高可以提速900倍

在本文中，我将介绍一些简单的方法，可以将Python for循环的速度提高1.3到900倍。

2024-01-02 10:24:21 0 收藏

Jupyter Notebook的10个常用扩展介绍

在本文中，我们将探索Jupyter Notebook提升我们数据科学经验的强大扩展组件。

2024-01-01 09:52:14 0 收藏

神经网络中的分位数回归和分位数损失

在分位数回归中，我们不仅关注预测的中心趋势（如均值），还关注在分布的不同分位数处的预测准确性。Quantile loss允许我们根据所关注的分位数来量化预测的不确定性。

2023-12-31 09:50:14 0 收藏

使用LOTR合并检索提高RAG性能

RAG结合了两个关键元素:检索和生成。本文将介绍使用使用Merge retriver改进RAG的性能

2023-12-30 09:40:36 0 收藏

基于CNN和双向gru的心跳分类系统

论文，提出了基于卷积神经网络和双向门控循环单元(CNN + BiGRU)注意力的心跳声分类，论文不仅显示了模型还构建了完整的系统。

2023-12-29 19:03:56 0 收藏

人工智能生成文本检测在实践中使用有效性探讨

本文介绍了关于如何检测ai生成文本的思路。希望这有助于理解检测人工智能生成文本背后的细节。

2023-12-28 10:26:17 0 收藏

一文读懂分类模型评估指标

模型评估是深度学习和机器学习中非常重要的一部分，用于衡量模型的性能和效果。本文将逐步分解混淆矩阵，准确性，精度，召回率和F1分数。

2023-12-27 10:24:28 0 收藏

处理不平衡数据的过采样技术对比总结

在不平衡数据上训练的分类算法往往导致预测质量差。过采样提供了一种在模型训练开始之前重新平衡类的方法。

2023-12-26 10:11:41 0 收藏

EDA中常用的9个可视化图表介绍和代码示例

在这篇文章中我们介绍EDA中常用的9个图表，并且针对每个图表给出代码示例。

2023-12-26 10:09:21 0 收藏

2023年小型计算机视觉总结

到2023年底，人工智能领域迎来了生成式人工智能的新成功:大型语言模型(llm)和图像生成模型。每个人都在谈论它，它们对小型计算机视觉应用有什么改变吗?

2023-12-24 10:08:43 0 收藏

论文推荐：大型语言模型能自我解释吗?

这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法，一种是做出预测，然后解释它，另一种是产生解释，然后用它来做出预测。

2023-12-23 10:14:13 0 收藏

神经网络可视化新工具：TorchExplorer

TorchExplorer是一个交互式探索神经网络的可视化工具

2023-12-22 09:53:11 0 收藏

Deephub

个人信息