最大似然估计(MLE)入门教程

最大似然估计(Maximum Likelihood Estimation)是一种可以生成拟合数据的任何分布的参数的最可能估计的技术。它是一种解决建模和统计中常见问题的方法——将概率分布拟合到数据集。

使用Torchmetrics快速进行验证指标的计算

TorchMetrics可以为我们提供一种简单、干净、高效的方式来处理验证指标。TorchMetrics提供了许多现成的指标实现,如Accuracy, Dice, F1 Score, Recall, MAE等等,几乎最常见的指标都可以在里面找到。

使用时间序列数据预测《Apex英雄》的玩家活跃数据

在本文中我们使用《Apex英雄》中数据分析的玩家活动时间模式,并预测其增长或下降。

学习偏态分布的相关知识和原理的4篇论文推荐

偏态分布(skewness distribution)指频数分布的高峰位于一侧,尾部向另一侧延伸的分布。

如何估算transformer模型的显存大小

本文将详细介绍如何计算transformer的内存占用

为什么基于树的模型在表格数据上仍然优于深度学习

在这篇文章中,将详细解释一个被世界各地的机器学习从业者在各种领域观察到的现象——基于树的模型在分析表格数据方面比深度学习/神经网络好得多。

将特征转换为正态分布的一种方法示例

正态(高斯)分布在机器学习中起着核心作用,线性回归模型中要假设随机误差等方差并且服从正态分布,如果变量服从正态分布,那么更容易建立理论结果。

Pytorch中获取模型摘要的3种方法

在pytorch中获取模型的可训练和不可训练的参数,层名称,内核大小和数量。

论文推荐:使用带掩码的孪生网络进行自监督学习

本篇文章将介绍Masked Siamese Networks (MSN),这是另一种用于学习图像表示的自监督学习框架。MSN 在 ImageNet-1K 上的线性评估方面优于 MAE 和其他模型

为什么Adam 不是默认的优化算法?

本文这并不是否定自适应梯度方法在神经网络框架中的学习参数的贡献。而是希望能够在使用Adam的同时实验SGD和其他非自适应梯度方法

处理医学时间序列中缺失数据的3种方法

这些方法都是专为RNN设计,它们都经过了广泛的学术评估,而且十分的简单

关联规则算法Apriori algorithm详解以及为什么它不适用于所有的推荐系统

Apriori是Agarwal和Srikant在1994年首次提出的一种关联规则挖掘算法,它可以在特定类型的数据中找到关系,本文将介绍其算法并且说明那些哪些情况并不适用。

使用Pytorch手写ViT — VisionTransformer

本篇文章使用 Pytorch 中实现 Vision Transformer,通过我们自己的手动实现可以更好的理解ViT的架构

25个例子学会Pandas Groupby 操作

在本文中,我们将使用25个示例来详细介绍groupby函数的用法。这25个示例中还包含了一些不太常用但在各种任务中都能派上用场的操作。

广义线性模型(GLM)及其应用

广义线性模型[generalize linear model(GLM)]是线性模型的扩展,通过联系函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。

10个常用的损失函数解释以及Python代码实现

理解机器学习中的损失函数

使用PyTorch和Keras实现 pix2pix GAN

对比两个框架实现同一个模型到底有什么区别?

超参数黑盒(Black-box)优化的Python代码示例

暴力搜索优化的一个替代方案是黑盒(Black-Box)非凸优化技术。黑盒非凸优化算法可根据某些预定义的度量找到足够最佳的局部最小值(或最大值)的次优解。

贝叶斯自举法Bayesian Bootstrap

简单,快速,高效,稳定

使用Dask,SBERT SPECTRE和Milvus构建自己的ARXIV论文相似性搜索引擎

通过矢量相似性搜索,可以在〜50ms内响应〜640K论文上的语义搜索查询

个人信息

加入时间:2020-01-23

最后活动:18 小时前

发帖数:2309

回复数:1