如何管理和组织一个机器学习项目

本文主要分享一些组织管理机器学习项目的实践经验

从单词嵌入到文档距离 :WMD一种有效的文档分类方法

文档分类和文档检索已显示出广泛的应用。文档分类的重要部分是正确生成文档表示。马特·库斯纳(Matt J. K

适用于稀疏的嵌入、独热编码数据的损失函数回顾和PyTorch实现

在稀疏的、独热编码编码数据上构建自动编码器自1986年[1]问世以来,在过去的30年里,通用自动编码器神经网

基于可变自动编码器(VAE)的生成建模,理解可变自动编码器背后的原理

理解可变自动编码器背后的原理

使用GANs生成时间序列数据:DoppelGANger论文详解

在本文中,我们描述并应用了一种最新的强大方法的扩展版本,以生成合成顺序数据DoppelGANger。

使用图进行特征提取:最有用的图特征机器学习模型介绍

从图中提取特征与从正常数据中提取特征完全不同。图中的每个节点都是相互连接的,这是我们不能忽视的重要信息。

Pandas的列表值处理技巧,避免过多循环加快处理速度

这里有一些技巧可以避免过多的循环,从而获得更好的结果

Actor-Critic:强化学习中的参与者-评价者算法简介

Actor-Critic从名字上看包括两部分,参与者(Actor)和评价者(Critic)。其中Actor使

14个Seaborn数据可视化图

调查数据并从中提取信息和趋势的工具。绿色代表新的开始和成长,也意味着更新和丰富。 数据可视化在数据挖掘中起

单变量和多变量高斯分布:可视化理解

​详细介绍高斯分布及其与均值、标准差、方差的关系

如何在图数据库中训练图卷积网络模型

在图数据库中训练GCN模型,可以利用图数据库的分布式计算框架现实应用中大型图的可扩展解决方案

孪生网络:使用双头神经网络进行元学习

深度神经网络有一个大问题-他们一直渴望数据。当数据太少时(无法到达算法可以接受的数量)深度神经网络很难推广。

如何在算法比赛中获得出色的表现 :改善模型的5个重要技巧

如果你最近才开始使用Kaggle,或者你是这个平台的老用户,你可能想知道如何轻松地提高你的模型的性能。以下是

使用CatBoost进行不确定度估算:模型为何不确定以及如何估计不确定性水平

什么是预测不确定性,为什么您要关心它? 不确定性的两个来源是什么?

在图上发送消息的神经网络MPNN简介和代码实现

欢迎来到图神经网络的世界,在这里我们在图上构建深度学习模型。你可以认为这很简单。毕竟,我们难道不能重用使用正

Transformer的潜在竞争对手QRNN论文解读,训练更快的RNN

使用递归神经网络(RNN)序列建模业务已有很长时间了。但是RNN很慢因为他们一次处理一个令牌无法并行化处理。

Google的神经网络表格处理模型TabNet介绍

Google Research的TabNet于2019年发布,在预印稿中被宣称优于表格数据的现有方法。

使用CatBoost和NODE建模表格数据对比测试

来自俄罗斯在线搜索公司Yandex的CatBoost快速且易于使用,但同一家公司的研究人员最近发布了一种基于神经网络的新软件包NODE,声称其性能优于CatBoost和所有其他梯度增强方法。

对比PyTorch和TensorFlow的自动差异和动态子类化模型

使用自定义模型类从头开始训练线性回归,比较PyTorch 1.x和TensorFlow 2.x之间的自动差异

梯度直方图(HOG)用于图像多分类和图像推荐

介绍 机器学习的神奇之处在于,我们对原理的概念和思路理解得越多,它就变得越容易。在本文中,我们将研究在图像

个人信息

加入时间:2020-01-23

最后活动:15 小时前

发帖数:1802

回复数:1