特征工程:基于梯度提升的模型的特征编码效果测试

树形结构为什么不需要归一化?使用独热编码和标签编码对模型的表现影响大吗?

使用格拉姆角场(GAF)以将时间序列数据转换为图像

这篇文章将会详细介绍格拉姆角场 (Gramian Angular Field),并通过代码示例展示“如何将时间序列数据转换为图像”。

稀疏矩阵的概念介绍

使用稀疏矩阵既可以节省内存,也可以加快训练速度,本文中将介绍系数矩阵的概念并且通过示例介绍在什么时候以及如何使用稀疏矩阵

使用孤立森林进行无监督的离群检测

孤立森林是 一种无监督算法的异常检测,可以快速检测数据集中的异常值。

5分钟NLP:HuggingFace 内置数据集的使用教程

对于NLP 爱好者来说HuggingFace肯定不会陌生,HuggingFace为NLP任务提供了维护了一系列开源库的应用和实现,今天我们来看一下用于NLP任务的数据集总结。

模型的可解释性:部分依赖图PDP和个体条件期望图ICE

部分依赖图 (PDP) 和个体条件期望 (ICE) 图可用于可视化和分析训练目标与一组输入特征之间的交互关系。

自监督学习的知识点总结

本篇文章将对自监督学习的要点进行总结

GAN 并不是你所需要的全部:从AE到VAE的自编码器全面总结

在图像生成方面GAN似乎成为了主流,但是自编码器(autoencoder)还是有很多的优势,所以本文对AE模型做一个全面详细得介绍和总结。

提高EDA(探索性数据分析)效率的 3 个简单工具

本文简单的介绍 3 个非常好用的的数据可视化和分析工具,它们只需要很少的代码就可以自动的帮助我们执行快速和详细的数据分析

Python 中的 requirements.txt 与 setup.py

Python 中 requirements.txt、setup.py 和 setup.cfg 的用途

论文导读:Universal Adversarial Training

在这篇论文中,作者提出了一种优化的方法来找到给定模型的通用对抗样本(首先在 Moosavi-Desfooli 等人 [1] 中引入)。作者还提出了一种低成本算法来增强模型对此类扰动的鲁棒性。

Pandas DataFrame 中的自连接和交叉连接

在本文中,介绍了如何在Pandas中使用连接的操作,以及它们是如何在 Pandas DataFrame 中执行的。

轻量级图卷积网络LightGCN介绍和构建推荐系统示例

今天介绍的这个模型被称作:Light Graph Convolution Network 或 LightGCN。LightGCN 非常轻量级,训练速度比其他基于 GCN 的模型快得多,并且在效果上表现得也非常不错

5分钟NLP:使用 HuggingFace 微调BERT 并使用 TensorBoard 可视化

上篇文章我们已经介绍了Hugging Face的主要类,在本文中将介绍如何使用Hugging Face进行BERT的微调进行评论的分类。

论文导读:CoAtNet是如何完美结合 CNN 和 Transformer的

这篇文章主要介绍 Z. Dai 等人的论文 CoAtNet: Marrying Convolution and Attention for All Data Sizes。(2021 年)。

条件随机场(CRF)的详细解释

条件随机场(CRF)结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,其中相邻的上下文信息或状态会影响当前预测,常用于标注或分析序列资料,如自然语言文字或是生物序列

LazyProphet:使用 LightGBM 进行时间序列预测

但是当在单变量情况下使用增强树时,由于没有大量的外生特征可以利用,它的性能非常的糟糕。LazyProphet通过新的特征生成方法可以大大提高树型模型处理时序数据的性能

论文解释:SeFa ,在潜在空间中为 GAN 寻找语义向量

SeFa — Closed-Form Factorization of Latent Semantics in GANs

优化算法之手推遗传算法(Genetic Algorithm)的详细步骤图解

遗传算法(Genetic Algorithm, GA)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。

5分钟 NLP :Hugging Face 主要类和函数介绍 🤗

主要包括Pipeline, Datasets, Metrics, and AutoClasses

个人信息

加入时间:2020-01-23

最后活动:5 小时前

发帖数:1604

回复数:1