正则化技巧:标签平滑(Label Smoothing)以及在 PyTorch 中的实现

在本文中,我们将解释标签平滑的原理,实现了一个使用这种技术的交叉熵损失函数,并评估了它的性能

UMAP降维算法原理详解和应用示例

本文将介绍一种流行的降维技术Uniform Manifold Approximation and Projection (UMAP)的内部工作原理,并提供一个 Python 示例。

EDA和数据挖掘实战:漫威与 DC电影收视率和票房分析

在本篇文章中,我们将根据一些数据来对比Marvel 与 DC , 数据总能说出真相。

深入解释 CTGAN 的工作原理

本文的目的是解释Conditional Tabular GANs的工作原理,因为目前我还没有看到类似这样的文章。

在 Python 中将数值变量转换为分类变量

这篇文章是今天发布的CTGAN的补充,我们可以使用pandas的cut函数将数据进行离散化、将连续变量进行分段汇总,这比写自定义函数要简单的多。

神经网络中的概率分布函数

LSTM 和 TCN 能记住多长时间的依赖关系?

在这篇文章中,我将在 LSTM 和 TCN 的长期信息学习方面进行比较。

初学者指南:使用 Numpy、Keras 和 PyTorch 实现最简单的机器学习模型线性回归

在本文中,我们将使用 Python 中最著名的三个模块来实现一个简单的线性回归模型。

自监督学习简介以及在三大领域中现状

自监督学习旨在从未标记的数据中学习信息表示。在这种情况下,标记数据集比未标记数据集相对小。自监督学习使用这些未标记的数据并执行前置任务(*pretext**tasks* )和对比学习。

2021年11月推荐阅读的10篇论文

AutoEncoder (AE) 和 Variational AutoEncoder (VAE) 的详细介绍和对比

Autoencoder 和 Variational Autoencoder 都用于将数据从高维空间转换到低维空间,从本质上实现压缩。

使用 Seaborn 绘制pair plot可视化变量之间的相关性

使用散点图评估数值变量之间的相关性很简单,但是分类变量呢?

使用Optuna进行超参数优化

在这篇文章中,我将展示如何使用 Optuna 调整 CatBoost 模型的超参数。

5个常见的交叉验证技术介绍和可视化

In CV we trust。

分位数回归(quantile regression)简介和代码实现

普通最小二乘法如何处理异常值?它对待一切事物都是一样的——它将它们平方!中位数对异常值的鲁棒性比均值强。这种理论也可以在预测统计中为我们服务

如何监控NVIDIA GPU 的运行状态和使用情况

设备跟踪和管理正成为机器学习工程的中心焦点。这个任务的核心是在模型训练过程中跟踪和报告gpu的使用效率。

BetaBoosting:使用beta密度函数动态调整xgboost的学习率

一般情况下的梯度提升实现(如 XGBoost)都使用静态学习率。但是我们可以使用一个函数,使函数参数可以作为训练时的超参数来确定训练时的“最佳”学习率形状。

6个pandas新手容易犯的错误

我们在这里讨论6个新手容易犯的错误,这些错误与你所使用工具的API或语法无关,但是在应用中却会给我们带来很大的麻烦。

使用 Python 创建一个简单的基于规则的聊天机器人

还记得这个价值一个亿的AI核心代码吗?以上这段代码就是我们今天的主题,基于规则的聊天机器人

一张图了解机器学习