从零开始构建:使用CNN和TensorFlow进行人脸特征检测

我们将通过tensorflow和cnn从零建立一个可以在脸上绘制15个关键点的模型。

浅谈时间序列的平稳性检验

🐦🐦🐦 每一个统计学问题,我们都需要对其先做一些基本假设。在时间序列分析中,我们考虑了很多合理且可以简

PU Learning简介:对无标签数据进行半监督分类

当只有几个正样本,你如何分类无标签数据?假设您有足够的数据和良好的特征,这似乎是一项简单的分类任务。 但是,假设数据集中只有15%的数据被标记,并且标记的样本仅属于一类,样本不均衡问题是否使这项任务变成了无监督学习问题?

翻车现场:我用pytorch和GAN做了一个生成神奇宝贝的失败模型

神奇宝贝已经是一个家喻户晓的动画了,我们今天来确认是否可以使用深度学习为他自动创建新的Pokemon。

文本挖掘实战:看看国外人们在冠状病毒隔离期间在家里做什么?

本文通过文本的挖掘,对人们在冠状病毒锁定期间正在做什么以及他们的感觉进行的探索性和情感分析随着越来越多的国家

主动学习介绍:尽可能减少数据的标注成本的一种半监督学习方法

这篇文章的主要目的是为了揭开主动学习的神秘面纱,以及将展示它与传统监督学习的不同之处。

精度是远远不够的:如何最好地评估一个分类器?

分类模型(分类器)是一种有监督的机器学习模型,其中目标变量是离散的(即类别)。评估一个机器学习模型和建立模型一样重要。

具有异构元数据的卷积神经网络:CNN元数据处理方式回顾

尽管CNN擅长从摄像机图像(或视频剪辑形式的序列)中提取信息,但我们毕竟不断遇到各种不适合卷积神经网络的元数据。回顾一下最近文献中提出的使用卷积神经网络处理元数据的不同方式。

解决过拟合:如何在PyTorch中使用标签平滑正则化

在训练深度学习模型的过程中,过拟合和概率校准(probability calibration)是两个常见的问题。有没有一种方法可以同时解决过拟合和模型过度自信呢?

机器学习项目模板:ML项目的6个基本步骤

每个机器学习项目都有自己独特的形式。对于每个项目,都可以遵循一组预定义的步骤。尽管没有严格的流程,但是可以提出一个通用模板。

Python实现固定效应回归模型实现因果关系推断

众所周知,“相关并不意味着因果关系”。 相关可以表示因果关系,但需要一定条件。在本文中,我将以一种易于理解的方式对其进行总结。 我将解释如果不满足这些条件为什么标准的普通最小二乘(OLS)无法确定因果关系。

神奇的Batch Normalization 仅训练BN层会发生什么

到目前为止,我从未将批标准化(BN)层视为学习过程本身的一部分,仅是为了帮助深度网络实现优化和提高稳定性。 经过几次实验发现了BN层的作用

机器学习的统计方法 贝叶斯决策理论入门(公式修正版)

无论你是在建立机器学习模型还是在日常生活中做决定,我们总是选择风险最小的方案。然而,机器学习模型最初并不是基于这种理解而建立的。

利用数据可视化和相关历史背景分析在COVID-19影响下美国股市暴跌

在本文中,我将使用数据科学的手段来量化2020年美国股市下跌的影响,并将其与近期(以及更早)历史上的其他主要下跌进行比较。我将收集数据来帮助构建我的模型,设置比较统计来提供背景,并通过可视化来传达重要的想法。

使用GAN绘制像素画,用机器学习的方式协助绘画者更快地完成作品

像素绘画是视频游戏中最受欢迎的美学之一。 它致力于重现任天堂和Arcade旧游戏的外观。假设使用机器学习模型可以生成阴影和彩色图片,那么生成的精灵必须足够好,以至于人类绘画者可以用比从头开始绘制更少的时间来完善它。

使用PyTorch Lightning构建轻量化强化学习DQN(附完整源码)

本文旨在探究将PyTorch Lightning应用于激动人心的强化学习(RL)领域。在这里,我们将使用经典的倒立摆gym环境来构建一个标准的深度Q网络(DQN)模型,以说明如何开始使用Lightning来构建RL模型。

使用机器学习和Python揭开DNA测序神秘面纱

基因组是生物体中DNA的完整集合。作为数据驱动的科学,基因组学广泛地利用机器学习来捕获数据中的关系并推断出新的生物学假设。在本文中,我们将了解如何解释DNA结构以及如何使用机器学习算法来建立DNA序列数据的预测模型。

假新闻无处不在:我创建了一个通过深度学习的方法标记假新闻的开源项目

虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探,负责在发布前确定帖子是否真实。但是,虚假新闻仍然会越过我们的防线。本文通过NLP的处理方法,测试RNN,LSTM,GPT2,BERT等模型,创建出一个标记假新闻的开源项目

梯度下降算法数学原理讲解和Python代码实现

在本文中,我们将看到几种基本的优化算法,在机器学习的背景下直接看到这些算法,我们难免会感到困惑。因此,我认为最好不要在任何背景下查看这些算法,以便更好地理解这些方法。

在Python中使用K-Means聚类和PCA主成分分析进行图像压缩

在这片文章中会介绍k-means和PCA的主要原理,并且尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。