Deepmind的RFA:transformers的Softmax注意机制最新替代

什么是注意力机制?为什么RFA比Softmax更好?

SHAP值:用博弈论的概念解释一个模型

SHAP —表示SHapley Additive ExPlanations是一种解释来自机器学习模型的单个预测的方法。

为什么独热编码会引起维度诅咒以及避免他的几个办法

从机器学习的角度来看独热编码不是一个很好的选择,最明显的原因是它加起来有大量的维度,数据集维数的增加会引起维数诅咒,从而导致并行性和多重共线性问题。

开放API如何处理数据隐私问题?看看GPT-3 是怎么做的

GPT-3正在改变企业利用人工智能增强现有产品能力的方式,并推出下一代产品。我们看看GPT-3如何处理数据隐私问题

5分钟搭建强大又好用的深度学习环境

为深度学习项目建立一个良好的环境不是一件容易的任务,随着容器彻底改变了软件开发的世界,现在它们也可以帮助数据科学家构建更健壮的环境。

结合Sklearn的网格和随机搜索进行自动超参数调优

今天将介绍两种自动超参数优化方法:随机搜索和网格搜索,并结合他们的有点进行自动化的超参数调整

FOTS:自然场景的文本检测与识别

在这篇文章里,我将分享​实现这篇论文的方法。

基于偏差校正似然的贝叶斯参数估计

通过使用先验信息来校正贝叶斯参数估计中似然性的偏差,可能意味着对小样本量的估计的准确性和鲁棒性进行了改进

基于BERT嵌入的推荐系统

当你查看任何社交媒体平台时,你很可能会从其中看到很多建议,例如“为你推荐”。这些建议主要取决于你当前的兴趣

卷积神经网络中的自我注意

我写这篇短文是为了总结cnn的自注意力机制,主要是为了以后可以回顾一下我做了什么,但我也希望对你们有用。

强化学习相关的主要概念和术语简介

而强化学习,现在被认为是最有前途的技术,以推动AI范式的下一个层次

基于3DCNN的深度学习卫星图像土地覆盖分类

​本文帮助读者更好地理解使用3D-CNN对卫星数据进行土地覆盖分类的不同深度学习方法。

神经机器翻译的Subword技术

字符分割是机器翻译中为了避免词层翻译的缺点而采用的一种技术,Sennrich等人(2016)通过提供更有意义的表示,引入了将单词分割成子词单元序列的概念

TabTransformer:用于表格数据的Transformer

在Transformers颠覆了自然语言处理和计算机视觉之后,他们现在把目光投向了最大的数据类型:表格数据。

音频时域特征的提取

介绍在音频领域中,我们可以使用深度学习提取和分析这些音频的频率和时域特征以了解波形的属性。

论文总结与分析:“An Image is Worth 16x16 Words”

本文提出这样的论点,即这种转换将产生与传统CNN相当的结果,同时需要较少的计算资源进行训练。

递归模型的语言处理入门:双向rnn,编码器和词嵌入

双向RNN是RNN的一种变体,它对于自然语言处理任务特别有用,并且有时可以提高性能。

在Python中使用逆变换方法生成随机变量

目标在仿真理论中,生成随机变量是最重要的“构建块”之一,而这些随机变量大多是由均匀分布的随机变量生成的。

使用深度学习进行音频分类的端到端示例和解释

声音分类是音频深度学习中应用最广泛的方法之一。它包括学习对声音进行分类并预测声音的类别。

为什么深度学习模型不能适配不同的显微镜扫描仪产生的图像

为什么深度学习模型不能在其他实验室的图像上工作?部分答案是肯定的:使用不同的扫描仪造成的色域移位。

个人信息

加入时间:2020-01-23

最后活动:7 小时前

发帖数:1609

回复数:1