5个常见的交叉验证技术介绍和可视化

In CV we trust。

分位数回归(quantile regression)简介和代码实现

普通最小二乘法如何处理异常值?它对待一切事物都是一样的——它将它们平方!中位数对异常值的鲁棒性比均值强。这种理论也可以在预测统计中为我们服务

如何监控NVIDIA GPU 的运行状态和使用情况

设备跟踪和管理正成为机器学习工程的中心焦点。这个任务的核心是在模型训练过程中跟踪和报告gpu的使用效率。

BetaBoosting:使用beta密度函数动态调整xgboost的学习率

一般情况下的梯度提升实现(如 XGBoost)都使用静态学习率。但是我们可以使用一个函数,使函数参数可以作为训练时的超参数来确定训练时的“最佳”学习率形状。

6个pandas新手容易犯的错误

我们在这里讨论6个新手容易犯的错误,这些错误与你所使用工具的API或语法无关,但是在应用中却会给我们带来很大的麻烦。

使用 Python 创建一个简单的基于规则的聊天机器人

还记得这个价值一个亿的AI核心代码吗?以上这段代码就是我们今天的主题,基于规则的聊天机器人

一张图了解机器学习

使用 Pandas resample填补时间序列数据中的空白

在现实世界中时间序列数据并不总是完全干净的。本文介绍了如何使用pandas的重采样函数来识别和填补这些空白。

揭开机器学习模型黑箱:模型可解释性方法总结和对比

解释人工智能黑盒模型是一个巨大的挑战。在这篇文章中,我将介绍特征归因和反事实解释的基本方法。稍后,您将了解两者之间的关系。本文基于Microsoft[1]在2020年发表的一篇论文。

深度不一定更好:12层ParNet 并行非深度网络架构实现了与目前SOTA模型相似的性能

普林斯顿大学(Princeton University)和英特尔实验室(Intel Labs)的一个研究小组在最新发表的(Non-deep Networks)论文中提出了ParNet (Parallel Networks),其性能可与最先进的深度网络架构相媲美。

​常用的连续概率分布汇总

使用统计学分析《鱿鱼游戏》中“玻璃垫脚石”的生存概率

如果你要在鱿鱼游戏中玩玻璃垫脚石,你的会选择那个数字?

20个不常见但却非常有用的Numpy函数

Numpy是每个数据科学家都应该掌握的Python包,它提供了许多创建和操作数字数组的方法。它构成了许多与数据科学相关的广泛使用的Python库的基础,比如panda和Matplotlib。

使用torch.package将pytorch模型进行独立打包

在最新的1.9版本中有了一个新的方法torch.package,可以帮我们简化保存模型的步骤。

基本的核方法和径向基函数简介

偏差-方差困境是机器学习方法的面临的主要问题。在看完本文后,希望你能很好地理解这句话的含义以及它为什么重要。

一文读懂正则化:LASSO回归、Ridge回归、ElasticNet 回归

你可能听说过“Ridge”、“Lasso”和“ElasticNet”这样的术语。这些技术术语背后的基本概念都是正规化。在这篇文章中我们将详细进行说明。

Patchs才是你最需要的! 新研究表明VIT的强大性能归功于Patchs的策略

Vision transformer (ViT) 在许多计算机视觉任务中取得了优于经典的卷积架构的令人瞩目的性能。

已经14年的Scikit-Learn终于1.0了,发布第一个主要版本的意义是什么?

在这篇文章中,我不想像其他许多文章那样对新特性进行分析,而是想尝试分析Scikit-Learn这个版本的目的,以及它未来的发展策略

使用傅立叶变换清理时间序列数据噪声

傅立叶变换是一种从完全不同的角度查看数据的强大方法:从时域到频域。 但是这个强大的运算用它的数学方程看起来很可怕。

个人信息

加入时间:2020-01-23

最后活动:6 小时前

发帖数:1935

回复数:1