使用SpaCy构建自定义 NER 模型

命名实体识别(NER)是一种自然语言处理技术,用于在给定的文本内容中提取适当的实体,并将提取的实体分类到预定义的类别下。

Colossal-AI发布新的深度学习辅助框架,半小时即可完成ViT-Base/32预训练

从头开始预训练计算机视觉领域最热门的 AI 模型 Vision Transformer (ViT) 需要多长时间?Colossal-AI系统最新给出的答案是半小时!

使用高斯混合模型对不同的股票市场状况进行聚类

本片文章将演示如何使用高斯混合模型来帮助确定资金何时进入或退出市场。

使用VQGAN+CLIP从图鉴文本描述中生成神奇宝贝

还记得我们一年前发布的使用GAN生成神奇宝贝的文章吗,今天他的改进版本来了,这次我们根据文字描述来生成神奇宝贝。

论文推荐:使用三维卷积进行自监督的3D点云预测

大多数自动驾驶汽车使用 3D 激光扫描仪(即所谓的 LiDAR)来感知周围的 3D 世界。预测传感器在未来可能会看到什么的能力可以增强自动驾驶汽车的决策。

论文导读:Masked Autoencoders Are Scalable Vision Learners

Facebook 人工智能研究 (FAIR) 团队发表的论文 Masked Autoencoders Are Scalable Vision Learners 已成为计算机视觉社区的热门话题。这也是KaiMing大神在2年后的第一篇一作论文。

使用ECOC编码提高多分类任务的性能

逻辑回归、支持向量机等机器学习算法可以对二元数据集进行分类,但是无法处理超过 2 个目标类标签的多类分类任务。对于多类分类或多标签分类任务,我们需要使用某些技巧或者其他机器学习算法来训练数据集。

用于优化广告展示的深度强化学习实践

本文使用深度强化技术来优化网站上的广告位,以最大限度地提高用户点击的概率并增加数字营销收入。在介绍概念的同时提供了带有代码的详细案例,可以作为在任何真实示例中实施解决方案。

正则化技巧:标签平滑(Label Smoothing)以及在 PyTorch 中的实现

在本文中,我们将解释标签平滑的原理,实现了一个使用这种技术的交叉熵损失函数,并评估了它的性能

UMAP降维算法原理详解和应用示例

本文将介绍一种流行的降维技术Uniform Manifold Approximation and Projection (UMAP)的内部工作原理,并提供一个 Python 示例。

EDA和数据挖掘实战:漫威与 DC电影收视率和票房分析

在本篇文章中,我们将根据一些数据来对比Marvel 与 DC , 数据总能说出真相。

深入解释 CTGAN 的工作原理

本文的目的是解释Conditional Tabular GANs的工作原理,因为目前我还没有看到类似这样的文章。

在 Python 中将数值变量转换为分类变量

这篇文章是今天发布的CTGAN的补充,我们可以使用pandas的cut函数将数据进行离散化、将连续变量进行分段汇总,这比写自定义函数要简单的多。

神经网络中的概率分布函数

LSTM 和 TCN 能记住多长时间的依赖关系?

在这篇文章中,我将在 LSTM 和 TCN 的长期信息学习方面进行比较。

初学者指南:使用 Numpy、Keras 和 PyTorch 实现最简单的机器学习模型线性回归

在本文中,我们将使用 Python 中最著名的三个模块来实现一个简单的线性回归模型。

自监督学习简介以及在三大领域中现状

自监督学习旨在从未标记的数据中学习信息表示。在这种情况下,标记数据集比未标记数据集相对小。自监督学习使用这些未标记的数据并执行前置任务(*pretext**tasks* )和对比学习。

2021年11月推荐阅读的10篇论文

AutoEncoder (AE) 和 Variational AutoEncoder (VAE) 的详细介绍和对比

Autoencoder 和 Variational Autoencoder 都用于将数据从高维空间转换到低维空间,从本质上实现压缩。

使用 Seaborn 绘制pair plot可视化变量之间的相关性

使用散点图评估数值变量之间的相关性很简单,但是分类变量呢?

个人信息

加入时间:2020-01-23

最后活动:9 小时前

发帖数:1596

回复数:1