从熵到交叉熵损失的直观通俗的解释

对于机器学习和数据科学的初学者来说,必须清楚熵和交叉熵的概念.在本文中,我将尝试从信息论的角度解释有关熵的概念

2021 年顶级深度学习论文推荐

2021年还有10天就过去了, 以下是我认为 2021 年最有趣、最有前途的深度学习论文。

神经网络压缩方法:模型量化的概念简介

这篇介绍性文章将讨论可用于优化重型深度神经网络模型的量化技术。

阅读和实现深度学习的论文初学者指南

如果想了解黑匣子内部发生了么,提高创造力或成为第一个将最新科学研究带入业务的开发人员 这篇文章应该可以帮到你。

计算 Python 代码的内存和模型显存消耗的小技巧

本篇文章我们将介绍两个 Python 库 memory_profiler和Pytorch-Memory-Utils,这两个库可以帮助我们了解内存和显存的消耗。

可解释的AI (XAI):如何使用LIME 和 SHAP更好地解释模型的预测

在本文中,我将介绍两个可以帮助了解模型的决策过程的模型 LIME 和 SHAP。将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。

开启深度强化学习之路:Deep Q-Networks简介和代码示例

Deep Q-Learning 算法是深度强化学习的核心概念之一。神经网络将输入状态映射到(动作,Q 值)对。在本篇文章中将通过游戏的示例来介绍 Deep Q-Networks 的整个概念

18 个 实用的Numpy 代码片段总结

在本文中,我整理了一些 NumPy 代码的片段,这些代码片段都是在日常开发中经常用到的。

使用卷积神经网络进行实时面部表情检测

面部表情对于社交互动很重要,并且在非语言人机交互方面发挥着重要作用。本篇文章的目标是创建一个模型,该模型可以使用网络摄像头等普通设备识别和分类一个人当前的情绪。

BERT 模型的知识蒸馏: DistilBERT 方法的理论和机制研究

在本文中,我们将探讨 DistilBERT [1] 方法背后的机制,该方法可用于提取任何类似 BERT 的模型。

带掩码的自编码器MAE详解和Pytorch代码实现

前几天已经被kaiming大神的MAE刷屏了,今天我们来看看论文具体的代码实现。

联邦学习(Federated Learning)详解以及示例代码

联邦学习也称为协同学习,它可以在产生数据的设备上进行大规模的训练,并且这些敏感数据保留在数据的所有者那里

SIMILAR:现实场景中基于子模块信息度量的主动学习

这是一篇被顶会 NeurIPS 2021收录的关于主动学习的论文,作者不仅提供了代码,还提供了很多实际案例代码。

为什么 Pi 会出现在正态分布的方程中?

本篇文章将介绍钟形曲线是如何形成的,以及π为什么会出现在一个看似与它无关的曲线的公式中。

Self-Training:用半监督的方式对任何有监督分类算法进行训练

本文将对Self-Training的流程做一个详细的介绍并使用Python 和Sklearn 实现一个完整的Self-Training示例。

SSD(Single Shot MultiBox Detector)原理详解

在这篇文章中,我将讨论用于目标检测任务的 Single Shot Multi-box Detector。

自回归模型PixelCNN是如何处理多维输入的

在这篇文章中,我们将讨论如何用多个通道建模图像,比如RGB图像。

马尔科夫决策过程基本概念详解

在今天的文章中,我们使用来自Stuart Russell和Peter Norvig的《Artificial Intelligence: A Modern Approach》一书中的网格例子来介绍MDP的基本概念。

使用自变分原理改进正则化核回归:通过变分法推导和推广Nadaraya-Watson估计

在本文中,我将介绍推导 Nadaraya-Watson 估计(本篇文章中将其简称为“核回归”)的另一种基本原理。