Python中7种主要关键词提取算法的基准测试
本篇文章使用 2000 个文档的语料库对几种著名的关键字提取算法进行测试和试验。
使用图神经网络优化信息提取的流程概述
在这篇文章中,我们将介绍票据数字化的问题,即从纸制收据(如医疗发票、门票等)中以标签的形式提取必要和重要的信息。
可视化推导贝叶斯定理公式
在统计和应用数学中,贝叶斯定理也被称为贝叶斯规则,它是一个用于确定事件的偶然性概率的数学公式。贝叶斯定理描述了由事件相关条件的先验知识支持的事件发生的概率。
通过卫星图像预测区域内降雨范围和降雨量
在这篇文章中,我们展示了我们如何开发一个神经网络来根据红外卫星数据预测给定区域的降雨量。
时间序列分析中 5 个必须了解的术语和概念
时间序列分析是数据科学的一个基础领域,具有广泛的应用。如果能够成为该领域的专家,那么获得数据科学家工作的机会可能会大大增加。
使用SpaCy构建自定义 NER 模型
命名实体识别(NER)是一种自然语言处理技术,用于在给定的文本内容中提取适当的实体,并将提取的实体分类到预定义的类别下。
Colossal-AI发布新的深度学习辅助框架,半小时即可完成ViT-Base/32预训练
从头开始预训练计算机视觉领域最热门的 AI 模型 Vision Transformer (ViT) 需要多长时间?Colossal-AI系统最新给出的答案是半小时!
使用高斯混合模型对不同的股票市场状况进行聚类
本片文章将演示如何使用高斯混合模型来帮助确定资金何时进入或退出市场。
使用VQGAN+CLIP从图鉴文本描述中生成神奇宝贝
还记得我们一年前发布的使用GAN生成神奇宝贝的文章吗,今天他的改进版本来了,这次我们根据文字描述来生成神奇宝贝。
论文推荐:使用三维卷积进行自监督的3D点云预测
大多数自动驾驶汽车使用 3D 激光扫描仪(即所谓的 LiDAR)来感知周围的 3D 世界。预测传感器在未来可能会看到什么的能力可以增强自动驾驶汽车的决策。
论文导读:Masked Autoencoders Are Scalable Vision Learners
Facebook 人工智能研究 (FAIR) 团队发表的论文 Masked Autoencoders Are Scalable Vision Learners 已成为计算机视觉社区的热门话题。这也是KaiMing大神在2年后的第一篇一作论文。
使用ECOC编码提高多分类任务的性能
逻辑回归、支持向量机等机器学习算法可以对二元数据集进行分类,但是无法处理超过 2 个目标类标签的多类分类任务。对于多类分类或多标签分类任务,我们需要使用某些技巧或者其他机器学习算法来训练数据集。
用于优化广告展示的深度强化学习实践
本文使用深度强化技术来优化网站上的广告位,以最大限度地提高用户点击的概率并增加数字营销收入。在介绍概念的同时提供了带有代码的详细案例,可以作为在任何真实示例中实施解决方案。
正则化技巧:标签平滑(Label Smoothing)以及在 PyTorch 中的实现
在本文中,我们将解释标签平滑的原理,实现了一个使用这种技术的交叉熵损失函数,并评估了它的性能
UMAP降维算法原理详解和应用示例
本文将介绍一种流行的降维技术Uniform Manifold Approximation and Projection (UMAP)的内部工作原理,并提供一个 Python 示例。
EDA和数据挖掘实战:漫威与 DC电影收视率和票房分析
在本篇文章中,我们将根据一些数据来对比Marvel 与 DC , 数据总能说出真相。
深入解释 CTGAN 的工作原理
本文的目的是解释Conditional Tabular GANs的工作原理,因为目前我还没有看到类似这样的文章。
在 Python 中将数值变量转换为分类变量
这篇文章是今天发布的CTGAN的补充,我们可以使用pandas的cut函数将数据进行离散化、将连续变量进行分段汇总,这比写自定义函数要简单的多。
LSTM 和 TCN 能记住多长时间的依赖关系?
在这篇文章中,我将在 LSTM 和 TCN 的长期信息学习方面进行比较。