使用遗传交叉算子进行过采样处理数据不平衡

除了随机过采样,SMOTE及其变体之外,还有许多方法可以对不平衡数据进行过采样。

用于多关系数据的图神经网络R-GCNs

本文描述如何扩展图神经网络(GNNs)的最简单公式,以编码知识图谱(KGs)等多关系数据的结构。

理解高斯混合模型中期望最大化的M-Step

在本篇文章中将解释高斯混合模型(GMM)的关键部分背后的数学原理,即期望最大化(EM)

2020年人工智能论文总结

根据发布日期列出了人工智能领域的最新进展

2021年成为数据科学家最需要学习的7项技能

这七个最推荐的数据科学的技能希望对你有帮助

使用Fastai中的学习率查找器和渐进式调整大小提高训练效率

当我第一次开始使用fastai时,我非常兴奋地建立并训练了一个深度学习模型,它可以在很短的时间内产生惊人的结果

使用贝叶斯统计来进行更好更直观的A/B测试

A / B测试是当今技术,市场营销和研究中最有用的统计技术之一

使用用测试时数据增强(TTA)提高预测结果

数据增强是一种用于提高计算机视觉问题神经网络模型的性能和减少泛化误差的技术。

2012到2020主要的CNN架构总结

卷积神经网络(CNN或ConvNet)是理解图像内容的最佳学习算法之一,在本文中,我们将讨论每个机器学习工程师都应该知道的十大CNN架构。

OpenAI的新模型DALL·E:可以从文字说明生成图像

OpenAI成功地训练了一个能够从文字标题生成图像的网络。它非常类似于GPT-3和图像GPT,并产生惊人的结果。

单变量和多变量对基因表达式的预测能力对比

DESeq2与LASSO对基因表达的预测能力

提高数据科学家讲故事能力的5个小技巧

学习如何利用正确的工具成为一个有效的讲故事的人

使用Python过滤出类似的文本的简单方法

本文适合那些希望快速而实用地概述如何解决这样的问题并广泛了解他们同时在做什么的人!

股票市场交易中的强化学习

使用真实的市场数据生成我们的政策交易运行,每天政策可以买进、卖出或持有股票

Pyspark处理数据中带有列分隔符的数据集

本篇文章目标是处理在数据集中存在列分隔符或分隔符的特殊场景。

使用Plotly创建带有回归趋势线的时间序列可视化图表

利用Pandas Groupby()、for loops和Plotly Scatter Graph对象结合Plotly Express趋势线创建带有回归趋势线的时间序列图。

基于MeshCNN和PyTorch的三维对象分类和分割

MeshCNN引入了·操作,使我们能够将cnn应用到三维模型中。

计算机视觉中的注意力:PyTorch中实现MultiHead和CBAM

本文的目标是详细描述计算机视觉中两个最重要的注意力模块,并将它们应用到使用PyTorch的实际案例中。

位置编码在注意机制中的作用

在本文中,我将专注于注意力机制的位置编码部分及其数学原理。

统计学:你是贝叶斯主义者还是频率主义者?

如果我告诉你我可以通过抛硬币来展示贝叶斯统计和频率统计的区别