不平衡数据集分类实战:成人收入数据集分类模型训练和评估

许多二分类任务并不是每个类别都有相同数量的数据,存在着数据分布不平衡的情况。一个常用的例子是成人收入数据集,存在着一定程度的分布不平衡。针对这一数据集,可以使用很多不平衡分类的相关算法完成分类任务

搭建深度学习模型实现“换脸检测” Deepfake Detection

概要Deepfakes 是一种合成视频,通过深度学习技术将原视频中的人脸进行替换,本文使用Keras 和 TensorFlow 开发了 single shot multibox detector,用于自动检测视频是否是 deepfake

熟练掌握CV中最基础的概念:图像特征,看这篇万字的长文就够了

这是一篇有关CV的最基础的教学,每一个CV方向的从业者或者对CV感兴趣的人都应该看看

手写批量线性回归算法:在Python3中梯度下降方法实现模型训练

在这篇文章中,我们将看一个使用NumPy作为数据处理库的Python3编写的程序,来了解如何实现使用梯度下降法的(批量)线性回归。

数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了

尽管"数据科学"、人工智能 (AI) 和机器学习属于同一领域,彼此相互联系,但是它们也有特定的应用背景和意义。

超参数调整实战:scikit-learn配合XGBoost的竞赛top20策略

快速学习如何为XGboost优化超参数!在过去的几年中,XGBoost被广泛用于表格数据推断,并且赢得了数百个挑战。取得冠军的原因除了经验方面的差异,还有一个事实,那就是他们优化了超参数!

CV基础教程:图像上的几何变换

本文主要讲解CV中最基础的几何变换操作,包括缩放、平移、旋转、仿射变换、透视变换等

NLP实战:对GPT-2进行微调以生成创意的域名

GPT-2是一个非常好的模型,它具有巨大的创作潜力,为了证明它在创作文字方面很有用,作者创建一个对人有帮助并且超级简单的AI服务。自动生成创意的域名。

从零开始构建:使用CNN和TensorFlow进行人脸特征检测

我们将通过tensorflow和cnn从零建立一个可以在脸上绘制15个关键点的模型。

浅谈时间序列的平稳性检验

🐦🐦🐦 每一个统计学问题,我们都需要对其先做一些基本假设。在时间序列分析中,我们考虑了很多合理且可以简

PU Learning简介:对无标签数据进行半监督分类

当只有几个正样本,你如何分类无标签数据?假设您有足够的数据和良好的特征,这似乎是一项简单的分类任务。 但是,假设数据集中只有15%的数据被标记,并且标记的样本仅属于一类,样本不均衡问题是否使这项任务变成了无监督学习问题?

翻车现场:我用pytorch和GAN做了一个生成神奇宝贝的失败模型

神奇宝贝已经是一个家喻户晓的动画了,我们今天来确认是否可以使用深度学习为他自动创建新的Pokemon。

文本挖掘实战:看看国外人们在冠状病毒隔离期间在家里做什么?

本文通过文本的挖掘,对人们在冠状病毒锁定期间正在做什么以及他们的感觉进行的探索性和情感分析随着越来越多的国家

主动学习介绍:尽可能减少数据的标注成本的一种半监督学习方法

这篇文章的主要目的是为了揭开主动学习的神秘面纱,以及将展示它与传统监督学习的不同之处。

精度是远远不够的:如何最好地评估一个分类器?

分类模型(分类器)是一种有监督的机器学习模型,其中目标变量是离散的(即类别)。评估一个机器学习模型和建立模型一样重要。

具有异构元数据的卷积神经网络:CNN元数据处理方式回顾

尽管CNN擅长从摄像机图像(或视频剪辑形式的序列)中提取信息,但我们毕竟不断遇到各种不适合卷积神经网络的元数据。回顾一下最近文献中提出的使用卷积神经网络处理元数据的不同方式。

解决过拟合:如何在PyTorch中使用标签平滑正则化

在训练深度学习模型的过程中,过拟合和概率校准(probability calibration)是两个常见的问题。有没有一种方法可以同时解决过拟合和模型过度自信呢?

机器学习项目模板:ML项目的6个基本步骤

每个机器学习项目都有自己独特的形式。对于每个项目,都可以遵循一组预定义的步骤。尽管没有严格的流程,但是可以提出一个通用模板。

Python实现固定效应回归模型实现因果关系推断

众所周知,“相关并不意味着因果关系”。 相关可以表示因果关系,但需要一定条件。在本文中,我将以一种易于理解的方式对其进行总结。 我将解释如果不满足这些条件为什么标准的普通最小二乘(OLS)无法确定因果关系。

个人信息

加入时间:2020-01-23

最后活动:3 小时前

发帖数:1597

回复数:1