正则化技巧:标签平滑(Label Smoothing)以及在 PyTorch 中的实现
在本文中,我们将解释标签平滑的原理,实现了一个使用这种技术的交叉熵损失函数,并评估了它的性能
UMAP降维算法原理详解和应用示例
本文将介绍一种流行的降维技术Uniform Manifold Approximation and Projection (UMAP)的内部工作原理,并提供一个 Python 示例。
EDA和数据挖掘实战:漫威与 DC电影收视率和票房分析
在本篇文章中,我们将根据一些数据来对比Marvel 与 DC , 数据总能说出真相。
深入解释 CTGAN 的工作原理
本文的目的是解释Conditional Tabular GANs的工作原理,因为目前我还没有看到类似这样的文章。
在 Python 中将数值变量转换为分类变量
这篇文章是今天发布的CTGAN的补充,我们可以使用pandas的cut函数将数据进行离散化、将连续变量进行分段汇总,这比写自定义函数要简单的多。
LSTM 和 TCN 能记住多长时间的依赖关系?
在这篇文章中,我将在 LSTM 和 TCN 的长期信息学习方面进行比较。
初学者指南:使用 Numpy、Keras 和 PyTorch 实现最简单的机器学习模型线性回归
在本文中,我们将使用 Python 中最著名的三个模块来实现一个简单的线性回归模型。
自监督学习简介以及在三大领域中现状
自监督学习旨在从未标记的数据中学习信息表示。在这种情况下,标记数据集比未标记数据集相对小。自监督学习使用这些未标记的数据并执行前置任务(*pretext**tasks* )和对比学习。
AutoEncoder (AE) 和 Variational AutoEncoder (VAE) 的详细介绍和对比
Autoencoder 和 Variational Autoencoder 都用于将数据从高维空间转换到低维空间,从本质上实现压缩。
使用 Seaborn 绘制pair plot可视化变量之间的相关性
使用散点图评估数值变量之间的相关性很简单,但是分类变量呢?
使用Optuna进行超参数优化
在这篇文章中,我将展示如何使用 Optuna 调整 CatBoost 模型的超参数。
5个常见的交叉验证技术介绍和可视化
In CV we trust。
分位数回归(quantile regression)简介和代码实现
普通最小二乘法如何处理异常值?它对待一切事物都是一样的——它将它们平方!中位数对异常值的鲁棒性比均值强。这种理论也可以在预测统计中为我们服务
如何监控NVIDIA GPU 的运行状态和使用情况
设备跟踪和管理正成为机器学习工程的中心焦点。这个任务的核心是在模型训练过程中跟踪和报告gpu的使用效率。
BetaBoosting:使用beta密度函数动态调整xgboost的学习率
一般情况下的梯度提升实现(如 XGBoost)都使用静态学习率。但是我们可以使用一个函数,使函数参数可以作为训练时的超参数来确定训练时的“最佳”学习率形状。
6个pandas新手容易犯的错误
我们在这里讨论6个新手容易犯的错误,这些错误与你所使用工具的API或语法无关,但是在应用中却会给我们带来很大的麻烦。
使用 Python 创建一个简单的基于规则的聊天机器人
还记得这个价值一个亿的AI核心代码吗?以上这段代码就是我们今天的主题,基于规则的聊天机器人