scikit-learn中的自动模型选择和复合特征空间

使用scikit-learn管道自动组合文本和数字数据

利用VAE和LSTM生成时间序列

用深度学习生成模型填充时间序列

TensorFlow Quantum:建立在量子架构上工作的机器学习模型

TensorFlow Quantum是一个开源堆栈,向我们展示了量子和机器学习的未来可能会是什么样子

Jupyter Notebooks嵌入Excel并使用Python替代VBA宏

在本文中,我将向你展示如何设置在Excel中运行的Jupyter Notebook。

在NLP中结合文本和数字特征进行机器学习

这篇文章展示了如何在scikit-learn(对于Tfidf)和pytorch(对于LSTM / BERT)中组合文本输入和数字输入。

Pytorch中的分布式神经网络训练

在本文中,我将向您介绍如何使用PyTorch在GPU集群上设置分布式神经网络训练。

使用TensorFlow和深度混合学习进行时间序列预测

在本文中,我们将看到深度混合学习如何应用于时间序列数据,以及它是否与图像数据一样有效。

NumPy中的广播:对不同形状的数组进行操作

在本文中,我们重点介绍正在广播的NumPy的特定类型的操作。

使用遗传交叉算子进行过采样处理数据不平衡

除了随机过采样,SMOTE及其变体之外,还有许多方法可以对不平衡数据进行过采样。

用于多关系数据的图神经网络R-GCNs

本文描述如何扩展图神经网络(GNNs)的最简单公式,以编码知识图谱(KGs)等多关系数据的结构。

理解高斯混合模型中期望最大化的M-Step

在本篇文章中将解释高斯混合模型(GMM)的关键部分背后的数学原理,即期望最大化(EM)

2020年人工智能论文总结

根据发布日期列出了人工智能领域的最新进展

2021年成为数据科学家最需要学习的7项技能

这七个最推荐的数据科学的技能希望对你有帮助

使用Fastai中的学习率查找器和渐进式调整大小提高训练效率

当我第一次开始使用fastai时,我非常兴奋地建立并训练了一个深度学习模型,它可以在很短的时间内产生惊人的结果

使用贝叶斯统计来进行更好更直观的A/B测试

A / B测试是当今技术,市场营销和研究中最有用的统计技术之一

使用用测试时数据增强(TTA)提高预测结果

数据增强是一种用于提高计算机视觉问题神经网络模型的性能和减少泛化误差的技术。

2012到2020主要的CNN架构总结

卷积神经网络(CNN或ConvNet)是理解图像内容的最佳学习算法之一,在本文中,我们将讨论每个机器学习工程师都应该知道的十大CNN架构。

OpenAI的新模型DALL·E:可以从文字说明生成图像

OpenAI成功地训练了一个能够从文字标题生成图像的网络。它非常类似于GPT-3和图像GPT,并产生惊人的结果。

单变量和多变量对基因表达式的预测能力对比

DESeq2与LASSO对基因表达的预测能力

提高数据科学家讲故事能力的5个小技巧

学习如何利用正确的工具成为一个有效的讲故事的人