特征工程入门:应该保留和去掉那些特征

在特征/列上执行的任何能够帮助我们根据数据进行预测的操作都可以称为特征工程。这将包括以下内容:添加新功能去掉

5分钟入门GANS:原理解释和keras代码实现

生成式对抗网络(GANs)是由Ian Goodfellow (GANs的GAN Father)等人于2014年在其题为“生成式对抗网络”的论文中提出的。

使用ML 和 DNN 建模的技巧总结

每个人都可以轻松地将数据放入任何模型机器学习或深度学习框架中。但是遵循最佳实践技巧可能有助于提升工作效率。以

医学图像分割模型U-Net介绍和Kaggle的Top1解决方案源码解析

U-Net创建于2015年,是一款专为生物医学图像分割而开发的CNN

机器学习中的音频特征:理解Mel频谱图

这篇简短的文章能澄清一些困惑,并从头解释mel的光谱图。

你可能不知道的pandas的5个基本技巧

如何用pandas处理大数据学习“between”、“reindex”等功能。

Quickprop介绍:一个加速梯度下降的学习方法

Quickprop的方法之一是寻找特定领域的最佳学习率,或者更确切地说:适当地动态调整学习率的算法

PandaSQL:一个让你能够通过SQL语句进行pandas的操作的python包

这篇文章将介绍一种在pandas的dataframe中使用SQL的python包,并且使用一个不等链接的查询操作来介绍PandasSQL的使用方法。

推理(Inference)与预测(Prediction)

推理和预测这两个术语都描述了我们在监督下从数据中学习的任务,以便找到一个描述自变量和结果之间关系的模型

10种常用的图算法直观可视化解释

快速介绍10个基本的图算法举例和可视化

每个数据科学家都应该知道的20个NumPy操作

NumPy构成了数据科学领域中大部分Python库的基础。

理解GPT-3: OpenAI最新的语言模型

这一切都始于OpenAl研究人员发表的论文《Language Models are few Shot Learners》,该论文介绍了GPT-3系列模型。

机器学习特性缩放的介绍,什么时候为什么使用

在这篇文章中,我们将讨论什么是特征缩放以及为什么我们在机器学习中需要特征缩放。

推荐系统基础:使用PyTorch进行矩阵分解进行动漫的推荐

通过将评分矩阵分解成两个高而细的矩阵来填充矩阵,是推荐系统的一个核心技术

特征工程之处理时间序列数据

维基百科对于特征工程的定义是:利用相关领域知识,通过数据挖掘技术从原始数据中提取特征的过程。

机器学习算法背后的数学原理

不同的机器学习算法是如何从数据中学习并预测未知数据的呢?

Matplotlib中的“plt”和“ax”到底是什么?

在幕布中绘图,还是在幕布上的单元格中绘图? 实际上,作为最流行和最基础的数据可视化库,Matplotlib

使用深度学习模型创作动漫故事,比较LSTM和GPT2的文本生成方法

这个项目的动机是想看看在短短的几年时间里NLP领域的技术已经走了多远,特别是当它涉及到生成创造性内容的时候。

LightGBM的参数详解以及如何调优

lightGBM可以用来解决大多数表格数据问题的算法。有很多很棒的功能,并且在kaggle这种该数据比赛中会经常使用。

使用2D卷积技术进行时间序列预测

本文将展示一种新的时间序列预测方法。