LSTM 和 TCN 能记住多长时间的依赖关系?
在这篇文章中,我将在 LSTM 和 TCN 的长期信息学习方面进行比较。
初学者指南:使用 Numpy、Keras 和 PyTorch 实现最简单的机器学习模型线性回归
在本文中,我们将使用 Python 中最著名的三个模块来实现一个简单的线性回归模型。
自监督学习简介以及在三大领域中现状
自监督学习旨在从未标记的数据中学习信息表示。在这种情况下,标记数据集比未标记数据集相对小。自监督学习使用这些未标记的数据并执行前置任务(*pretext**tasks* )和对比学习。
AutoEncoder (AE) 和 Variational AutoEncoder (VAE) 的详细介绍和对比
Autoencoder 和 Variational Autoencoder 都用于将数据从高维空间转换到低维空间,从本质上实现压缩。
使用 Seaborn 绘制pair plot可视化变量之间的相关性
使用散点图评估数值变量之间的相关性很简单,但是分类变量呢?
使用Optuna进行超参数优化
在这篇文章中,我将展示如何使用 Optuna 调整 CatBoost 模型的超参数。
5个常见的交叉验证技术介绍和可视化
In CV we trust。
分位数回归(quantile regression)简介和代码实现
普通最小二乘法如何处理异常值?它对待一切事物都是一样的——它将它们平方!中位数对异常值的鲁棒性比均值强。这种理论也可以在预测统计中为我们服务
如何监控NVIDIA GPU 的运行状态和使用情况
设备跟踪和管理正成为机器学习工程的中心焦点。这个任务的核心是在模型训练过程中跟踪和报告gpu的使用效率。
BetaBoosting:使用beta密度函数动态调整xgboost的学习率
一般情况下的梯度提升实现(如 XGBoost)都使用静态学习率。但是我们可以使用一个函数,使函数参数可以作为训练时的超参数来确定训练时的“最佳”学习率形状。
6个pandas新手容易犯的错误
我们在这里讨论6个新手容易犯的错误,这些错误与你所使用工具的API或语法无关,但是在应用中却会给我们带来很大的麻烦。
使用 Python 创建一个简单的基于规则的聊天机器人
还记得这个价值一个亿的AI核心代码吗?以上这段代码就是我们今天的主题,基于规则的聊天机器人
使用 Pandas resample填补时间序列数据中的空白
在现实世界中时间序列数据并不总是完全干净的。本文介绍了如何使用pandas的重采样函数来识别和填补这些空白。
揭开机器学习模型黑箱:模型可解释性方法总结和对比
解释人工智能黑盒模型是一个巨大的挑战。在这篇文章中,我将介绍特征归因和反事实解释的基本方法。稍后,您将了解两者之间的关系。本文基于Microsoft[1]在2020年发表的一篇论文。
深度不一定更好:12层ParNet 并行非深度网络架构实现了与目前SOTA模型相似的性能
普林斯顿大学(Princeton University)和英特尔实验室(Intel Labs)的一个研究小组在最新发表的(Non-deep Networks)论文中提出了ParNet (Parallel Networks),其性能可与最先进的深度网络架构相媲美。
使用统计学分析《鱿鱼游戏》中“玻璃垫脚石”的生存概率
如果你要在鱿鱼游戏中玩玻璃垫脚石,你的会选择那个数字?
20个不常见但却非常有用的Numpy函数
Numpy是每个数据科学家都应该掌握的Python包,它提供了许多创建和操作数字数组的方法。它构成了许多与数据科学相关的广泛使用的Python库的基础,比如panda和Matplotlib。