XGBoost和时间序列

​XGBoost是功能非常强大且用途广泛的模型。 它的应用范围非常大,并且已经成功地用于解决许多ML分类和回归问题。

R vs. Python vs. Julia

如果你是一名数据科学家,你很有可能使用Python或R编程。但是有一个叫Julia的新成员承诺在不影响数据科学家编写代码和与数据交互的情况下拥有c一样的性能。

优化Pytorch模型训练的小技巧

在本文中,我将描述并展示4种不同的Pytorch训练技巧的代码,这些技巧是我个人发现的,用于改进我的深度学习模型的训练。

使用Imblearn对不平衡数据进行随机重采样

我们希望为模型准备或分析的数据是完美的。在我们的生活中,数据不可能是平衡的,这种不平衡的情况非常常见而且需要进行修正。

Numpy中常用的10个矩阵操作示例

数据科学和机器学习所需的数学知识中,约有30-40%来自线性代数。矩阵运算在线性代数中占有重要的地位。numpy通过向量化避免许多for循环来更有效地执行矩阵操作。

超分辨率技术:Adobe Photoshop与深度神经网络对比

与领先的超分辨率深度神经网络模型相比,Adobe的超分辨率有多有效?这篇文章试图评估这一点,Adobe的超级分辨率的结果非常令人印象深刻

TimeSformer:视频理解所需的只是时空注意力吗?

论文提出了一种无卷积的视频分类方法,该方法专门基于名为“ TimeSformer”的空间和时间上的自注意力而构建,通过直接从一系列帧级块中启用时空特征学习,将标准的Transformer体系结构应用于视频。

构建自动车牌识别系统

本文介绍了如何从零开始开发车牌对象检测模型。整体项目中还包含了一个使用Flask的API

2021年3月四篇深度学习论文推荐

这是Machine-Learning-Collage系列,每隔一周作者都会编写一个本周论文的幻灯片摘要。每月底所有的幻灯片画都会被集中到一个总结文章中。

Python中的循环:遍历列表、元组、字典和字符串

什么是循环在编程中,循环意味着以相同的顺序多次重复同一组计算。

使用Pytorch和BERT进行多标签文本分类

BERT是在8亿单词的图书语料库和2500万单词的英语维基百科上训练的预训练模型

二次判别分析(QDA)和Python实现

我们将在本文中介绍的模型属于称为高斯判别分析(GDA)模型的类别。

F1是合适的指标吗?那么F2 F3…F_beta呢?

使用F1分数进行二元分类的度量是很常见的。这就是所谓的调和均值。然而,更通用的F_beta评分标准可能更好地评估模型性能。那么F2 F3和F_beta呢?在这篇文章中,我们将回顾F指标。

Pytorch中的.backward()方法

PyTorch的主要功能和特点之一就是backword函数

使用孤立森林进行异常检测

异常检测是对罕见的观测数据进行识别,这些观测数据具有与其他数据点截然不同的极值。这类的数据被称为异常值

5分钟掌握Pandas GroupBy

数据分析本质上就是用数据寻找问题的答案。当我们对一组数据执行某种计算或计算统计信息时,通常对整个数据集进行统

同一个项目中让R和Python无缝工作的五种方法

同时使用两种语言来获得最好的结果

Informer:用于长序列时间序列预测的新型transformer 模型

Informer旨在改善自我注意机制,减少记忆使用,加快推理速度

MLOps:构建生产机器学习系统的最佳实践

在这篇文章中,我将分享一些MLOps的最佳实践和技巧,它们将允许您在生产环境中使用您的ML模型并正确地操作它。

如何使用方差阈值进行特征选择

基于方差阈值的特征选择介绍今天,数据集拥有成百上千个特征是很常见的。从表面上看,这似乎是件好事——每个样本的