使用用测试时数据增强(TTA)提高预测结果
数据增强是一种用于提高计算机视觉问题神经网络模型的性能和减少泛化误差的技术。
2012到2020主要的CNN架构总结
卷积神经网络(CNN或ConvNet)是理解图像内容的最佳学习算法之一,在本文中,我们将讨论每个机器学习工程师都应该知道的十大CNN架构。
OpenAI的新模型DALL·E:可以从文字说明生成图像
OpenAI成功地训练了一个能够从文字标题生成图像的网络。它非常类似于GPT-3和图像GPT,并产生惊人的结果。
单变量和多变量对基因表达式的预测能力对比
DESeq2与LASSO对基因表达的预测能力
提高数据科学家讲故事能力的5个小技巧
学习如何利用正确的工具成为一个有效的讲故事的人
使用Python过滤出类似的文本的简单方法
本文适合那些希望快速而实用地概述如何解决这样的问题并广泛了解他们同时在做什么的人!
股票市场交易中的强化学习
使用真实的市场数据生成我们的政策交易运行,每天政策可以买进、卖出或持有股票
Pyspark处理数据中带有列分隔符的数据集
本篇文章目标是处理在数据集中存在列分隔符或分隔符的特殊场景。
使用Plotly创建带有回归趋势线的时间序列可视化图表
利用Pandas Groupby()、for loops和Plotly Scatter Graph对象结合Plotly Express趋势线创建带有回归趋势线的时间序列图。
基于MeshCNN和PyTorch的三维对象分类和分割
MeshCNN引入了·操作,使我们能够将cnn应用到三维模型中。
计算机视觉中的注意力:PyTorch中实现MultiHead和CBAM
本文的目标是详细描述计算机视觉中两个最重要的注意力模块,并将它们应用到使用PyTorch的实际案例中。
位置编码在注意机制中的作用
在本文中,我将专注于注意力机制的位置编码部分及其数学原理。
统计学:你是贝叶斯主义者还是频率主义者?
如果我告诉你我可以通过抛硬币来展示贝叶斯统计和频率统计的区别
图神经网络中的过平滑问题
图神经网络图解指南图神经网络或简称 GNN 是用于图数据的深度学习 (DL) 模型。
CTAB-GAN:高效且可行的表格数据合成
CTAB-GAN是一种基于条件 GAN 的表格数据生成器。 CTAB-GAN 通过对混合变量进行建模而超越了先前最先进的方法,并为不平衡的分类变量和具有复杂分布的连续变量提供了强大的生成能力
将SHAP用于特征选择和超参数调优
使用SHAP优化特征选择,同时调整参数特征选择和超参数调整是每个机器学习任务中的两个重要步骤。
在NLP项目中使用Hugging Face的Datasets 库
Hugging Face 的数据集库,一个快速高效的库,可以轻松共享和加载数据集和评估指标。
调整图像大小的三种插值算法总结
插值是一种在已知数据点的离散集合范围内构造新数据点的方法。
OpenCV实现手指识别:空中移动手指就可以弹钢琴!
Air Piano 是一个融合计算机视觉和人机交互的项目。为了制作 Air Piano,我使用了 Python 语言和 OpenCV 库。
如何消除多重共线性
在解释ML模型之前,消除多重共线性是一个必要的步骤。多重共线性是指一个预测变量与另一个预测变量相关的情况。