深度学习的线性代数基础

在这篇文章中,我将尝试对线性代数做一个简单的介绍。

数据科学初学者不要做的三件事

在这篇文章中,我将写3件我认为有抱负的数据科学家应该避免的事情。他们有可能破坏你的动力或减慢你的速度。

使用Dataprep进行自动化的探索性数据分析

创建不同类型的图和图表会消耗大量时间,Dataprep 是一个开源 Python 库,有助于自动化探索性数据分析过程

3 个可以薅羊毛的在线 Jupyter Notebook环境

这里介绍几个在线的 Jupyter Notebook环境,希望对你有所帮助

中心极限定理的解释和关键假设

这篇文章将帮助您更直观地理解 CLT 定理。 它还将帮助您更好地理解它的重要性以及使用时的关键假设。

使用UMAP进行降维和可视化

UMAP是一个开源的Python库,可以帮助可视化降维。

通过短文本生成图像

最近来自微软的 AI 研究人员发表了一篇论文,提出了一种基于短文本生成图像的方法。

贝叶斯公式的最通俗解释

本质上,贝叶斯公式描述了在给定新信息的情况下如何更新我们的模型。

在深度学习中使用Bagging集成模型

集成是一种机器学习概念,使用相同的学习算法训练多个模型。

python中三个不常见但是非常有用的数据科学库

在本文中,我将向您展示一些不太为人所知的但是却非常好用的python库。

这个GAN可以根据手绘图生成真实图像

生成对抗的网络机器学习模型现在可以根据它从现有的一组图像中看到的内容生成新的图像。

计算卷积神经网络参数总数和输出形状

在本文中,将介绍如何计算卷积层中的参数数量。以及如何计算卷积图像的形状。

CatBoost, XGBoost, AdaBoost, LightBoost,各种Boost的介绍和对比

本文包含了不同的增强方法,从不同的角度解释了这些方法并进行了简单的测试

强化学习算法三个基线策略

本文中概述的三个策略非常容易实现,可以作为完备性检查,并在出现问题时立即告诉你。

如何编写便于团队阅读和维护的SQL语句

团队中的每个人都可能有自己编写SQL的习惯,如果没有一套规范我们所编写的SQL语句肯定会令人别人难以阅读,所以一套良好SQL编码规范是十分重要的。

比较两幅图像的相似度的各种相似度量结果对比

在本文中,我们将看到如何使用一行代码实现各种相似性度量,并对比各相似度的评分

用于图神经网络研究的几个实用的数据集

本文将为ML/DL图网络的研究提供一些实用的数据集

使用🤗Transformers进行NLP的数据增广的4种常用方法

数据增广技术通过对数据进行扩充,加大训练的数据量来防止过拟合和使模型更健壮,帮助我们建立更好的模型。

Hint Learning和知识蒸馏

在这篇文章中,我简要介绍了知识蒸馏和Hint Learning。

时间序列的自回归理论和实现

​将回归应用于时间序列问题