时间序列数据的预处理

在本文中,我们将看到在深入研究数据建模部分之前应执行的常见时间序列预处理步骤和与时间序列数据相关的常见问题。

8个可以提高数据科学工作效率、节省宝贵时间的Python库

在进行数据科学时,可能会浪费大量时间编码并等待计算机运行某些东西。所以我选择了一些 Python 库,可以帮助你节省宝贵的时间。

为什么交叉熵和KL散度在作为损失函数时是近似相等的

在本文中,我们将介绍熵、交叉熵和 Kullback-Leibler Divergence [2] 的概念,并了解如何将它们近似为相等。

使用DistilBERT 蒸馏类 BERT 模型的代码实现

在本篇文章中我们将使用DistilBERT 蒸馏类 BERT 模型,并给出完整的代码实现。

DeepFaceDrawing: 使用草图生成人脸图像

在本文中,介绍了使用人脸设计或草图来制作人脸照片的想法。该技术的应用包括角色设计、教育培训、面部变形和嫌疑人画像等。

Github上10个数据科学和机器学习知识库

在本文中将介绍一些对数据科学和机器学习爱好者最有用的 Github 代码库。(排名顺序不分先后)

‘0.99999…’真的等于‘1’吗?这个问题揭示了数学所面临的更深层次的哲学挑战!

在这篇文章中,首先从数学上解决这个问题,弄清楚发生了什么。然后将深入探讨隐藏在数学结构背后的哲学挑战。

2022 年 2 月 arXiv 论文推荐

本篇文章选择了 10 篇论文,这些论文展示了各种 AI 子领域的关键发展:自动强化学习 (AutoRL)、多模态语言模型 (LM)、计算机视觉 (CV) 中的ConvNets vs Transformers 、无监督神经信息 检索 (IR) 等。

使用时间特征使让机器学习模型更好地工作

在本文中,我将通过一个实际示例讨论如何从 DateTime 变量中提取新特征以提高机器学习模型的准确性。

卷积自编码器中注意机制和使用线性模型进行超参数分析

本文通过一个简单的代码实例介绍了卷积的注意力机制和何如使用线性模型进行超参数的分析

论文推荐-使用 Noisy Student 进行自训练可以提高 ImageNet 分类的表现

使用 Noisy Student 进行自训练改进 ImageNet 分类是一篇由 Google Research、Brain Team 和Carnegie Mellon大学发表在2020 CVPR的论文

5分钟NLP - SpaCy速查表

SpaCy 是一个免费的开源库,用于 Python 中的高级自然语言处理包括但不限于词性标注、dependency parsing、NER和相似度计算。它可帮助构建处理和理解大量文本的应用程序可用于多种方向,例如信息提取、自然语言理解或为深度学习提供文本预处理。

图卷积和消息传递理论的可视化详解

本文中将研究如何基于消息传递机制构建图卷积神经网络,并创建一个模型来对具有嵌入可视化的分子进行分类。

伪标签:用于深度神经网络的简单高效的半监督学习方法

未标记的数据由监督学习网络标记,即所谓的伪标记。然后使用标记数据和伪标记数据训练网络。

2022年必须要了解的20个开源NLP 库

在本文中,我列出了当今最常用的 NLP 库,并对其进行简要说明。它们在不同的用例中都有特定的优势和劣势,因此它们都可以作为专门从事 NLP 的优秀数据科学家备选方案。每个库的描述都是从它们的 GitHub 中提取的。

高斯函数、高斯积分和正态分布

本篇文章我们首先将研究高斯函数的一般定义是什么,然后将看一下高斯积分,其结果对于确定正态分布的归一化常数是非常必要的。最后我们将使用收集的信息理解,推导出正态分布方程。

通过强化学习和官方API制作《星露谷物语》的自动钓鱼mod

使用官方 Stardew Valley 的 modding API 用 C# 编写一个自动钓鱼的mod

RVN 一种新的聚类算法

RVN 的灵感来自一家家具公司的商业案例,由于每件家具都有不同的形状和大小,所以创建了可以考虑每个点大小的 RVN 算法

1月论文推荐:Hyper-Tune 满足大规模高效分布式自动超参数调整的 SOTA 架构

北京大学、苏黎世联邦理工学院和快手科技的研究团队提出了 Hyper-Tune,这是一种高效、健壮的分布式超参数调优框架

为神经网络选择正确的激活函数

在本篇文章中我们将讨论神经网络中常见的激活函数,并使用可视化技术帮助你了解激活函数的函数定义和不同的使用场景。

个人信息

加入时间:2020-01-23

最后活动:5 小时前

发帖数:1802

回复数:1