PyTorch-Forecasting一个新的时间序列预测库
PyTorch- forecasting是一个建立在PyTorch之上的开源Python包
Meta 开源语音 AI 模型支持 1,100 多种语言
本周一Meta 又开源了新的语音模型MMS,并且发布了支持1100种语言的预训练模型权重
Jupyter Notebook 10个提升体验的高级技巧
Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。在这篇文章中,我将介绍10个可以提升体验的高级技巧。
升级到PyTorch 2.0的技巧总结
PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。我们将演示这个新功能的使用,以及介绍在使用它时可能遇到的一些问题。
计算GMAC和GFLOPS
GMAC 代表“Giga Multiply-Add Operations per Second”(每秒千兆乘法累加运算),是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量,以每秒十亿 (giga) 表示。
NSFW 图片分类
NSFW指的是不适宜工作场所("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。
常用的视频帧提取工具和方法总结
视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中,视频可以看作是由一系列连续的图像帧组成的。
使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具
Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。所以本文将介绍如何使用LangChain来创建我们自己的论文汇总工具。
LoRA:大模型的低秩自适应微调模型
对于大型模型来说,重新训练所有模型参数的全微调变得不可行。Microsoft 提出了低秩自适应大大减少了下游任务的可训练参数数量。
Github Copilot Chat的规则泄露,详细分析这31条规则
GitHub Copilot Chat是GitHub Copilot的一部分,它是一个基于人工智能的编程助手,
LayerNorm 在 Transformers 中对注意力的作用研究
LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。
数据信息汇总的7种基本技术总结
数据汇总是一个将原始数据简化为其主要成分或特征的过程,使其更容易理解、可视化和分析。本文介绍总结数据的七种重要方法,有助于理解数据实质的内容。
使用RobustPCA 进行时间序列的异常检测
鲁棒主成分分析(Robust Principal Component Analysis, RobustPCA)是一种将时间序列矩阵分解为低秩分量和稀疏分量的技术。这种分解能够识别潜在的趋势,以及检测异常和异常值。
视觉大模型DINOv2:自我监督学习的新领域
本文将介绍DINOv2是如何改进的,以及这些进步可能对整个领域有什么影响。
形态学运算与仿真:图像处理中形态学操作的简单解释
形态学是图像处理领域的一个分支,主要用于描述和处理图像中的形状和结构。形态学可以用于提取图像中的特征、消除噪声、改变图像的形状等。其中形态学的核心操作是形态学运算。
Softmax简介
Softmax是一种数学函数,通常用于将一组任意实数转换为表示概率分布的实数。
使用Actor-Critic的DDPG强化学习算法控制双关节机械臂
在本文中,我们将介绍在 Reacher 环境中训练智能代理控制双关节机械臂
Transformers回顾 :从BERT到GPT4
在本文中,我们将研究革命性的Transformers架构以及它如何改变NLP,我们还将全面回顾从BERT到Alpaca的Transformers模型,重点介绍每种模型的主要特征及其潜在应用。
使用思维链(Chain-of-thoughts)提示在大型语言模型中引出推理
“思维链提示”的方法,通过生成一系列中间推理步骤或思维链来提高法LLM 的复杂推理能力。
UNeXt:基于 MLP 的快速医学图像分割网络
UNeXt是约翰霍普金斯大学在2022年发布的论文。它在早期阶段使用卷积,在潜在空间阶段使用 MLP。通过一个标记化的 MLP 块来标记和投影卷积特征,并使用 MLP 对表示进行建模。对输入通道进行移位,可以专注于学习局部依赖性。