带掩码的自编码器MAE在各领域中的应用总结
NLP,图像,视频,多模态,设置时间序列和图机器学习中都出现了MAE的身影
使用机器学习创建自己的Emojis 表情
在本文中,我们将描述一种图像生成方法,该方法无需额外的模型训练和昂贵的设备就可以在不同的图像风格之间切换。
GANs的优化函数与完整损失函数计算
本文详细解释了GAN优化函数中的最小最大博弈和总损失函数是如何得到的。将介绍原始GAN中优化函数的含义和推理,以及它与模型的总损失函数的区别,这对于理解Generative Adversarial Nets是非常重要的
时间序列中的特征选择:在保持性能的同时加快预测速度
在这篇文章中,我们展示了特征选择在减少预测推理时间方面的有效性,同时避免了性能的显着下降。tspiral 是一个 Python 包,它提供了各种预测技术。并且它与 scikit-learn 可以完美的集成使用。
最大似然估计(MLE)入门教程
最大似然估计(Maximum Likelihood Estimation)是一种可以生成拟合数据的任何分布的参数的最可能估计的技术。它是一种解决建模和统计中常见问题的方法——将概率分布拟合到数据集。
使用Torchmetrics快速进行验证指标的计算
TorchMetrics可以为我们提供一种简单、干净、高效的方式来处理验证指标。TorchMetrics提供了许多现成的指标实现,如Accuracy, Dice, F1 Score, Recall, MAE等等,几乎最常见的指标都可以在里面找到。
使用时间序列数据预测《Apex英雄》的玩家活跃数据
在本文中我们使用《Apex英雄》中数据分析的玩家活动时间模式,并预测其增长或下降。
学习偏态分布的相关知识和原理的4篇论文推荐
偏态分布(skewness distribution)指频数分布的高峰位于一侧,尾部向另一侧延伸的分布。
如何估算transformer模型的显存大小
本文将详细介绍如何计算transformer的内存占用
为什么基于树的模型在表格数据上仍然优于深度学习
在这篇文章中,将详细解释一个被世界各地的机器学习从业者在各种领域观察到的现象——基于树的模型在分析表格数据方面比深度学习/神经网络好得多。
将特征转换为正态分布的一种方法示例
正态(高斯)分布在机器学习中起着核心作用,线性回归模型中要假设随机误差等方差并且服从正态分布,如果变量服从正态分布,那么更容易建立理论结果。
Pytorch中获取模型摘要的3种方法
在pytorch中获取模型的可训练和不可训练的参数,层名称,内核大小和数量。
论文推荐:使用带掩码的孪生网络进行自监督学习
本篇文章将介绍Masked Siamese Networks (MSN),这是另一种用于学习图像表示的自监督学习框架。MSN 在 ImageNet-1K 上的线性评估方面优于 MAE 和其他模型
为什么Adam 不是默认的优化算法?
本文这并不是否定自适应梯度方法在神经网络框架中的学习参数的贡献。而是希望能够在使用Adam的同时实验SGD和其他非自适应梯度方法
处理医学时间序列中缺失数据的3种方法
这些方法都是专为RNN设计,它们都经过了广泛的学术评估,而且十分的简单
关联规则算法Apriori algorithm详解以及为什么它不适用于所有的推荐系统
Apriori是Agarwal和Srikant在1994年首次提出的一种关联规则挖掘算法,它可以在特定类型的数据中找到关系,本文将介绍其算法并且说明那些哪些情况并不适用。
使用Pytorch手写ViT — VisionTransformer
本篇文章使用 Pytorch 中实现 Vision Transformer,通过我们自己的手动实现可以更好的理解ViT的架构
25个例子学会Pandas Groupby 操作
在本文中,我们将使用25个示例来详细介绍groupby函数的用法。这25个示例中还包含了一些不太常用但在各种任务中都能派上用场的操作。