这8个NumPy函数可以解决90%的常见问题

NumPy是一个用于科学计算和数据分析的Python库,也是机器学习的支柱。

DHVT:在小数据集上降低VIT与卷积神经网络之间差距,解决从零开始训练的问题

VIT在归纳偏置方面存在空间相关性和信道表示的多样性两大缺陷。所以论文提出了动态混合视觉变压器(DHVT)来增强这两种感应偏差。

基于GMM的一维时序数据平滑算法

在本文中探讨GMM作为时间数据平滑算法的使用。GMM(Gaussian Mixture Model)是一种统计模型,常用于数据聚类和密度估计,但也可以在一定程度上用作时间数据平滑算法。

数据偏度介绍和处理方法

偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。

深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。

Scikit-LLM:将大语言模型整合进Sklearn的工作流

我们以前介绍过Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM,它结合了强大的语言模型,如ChatGPT和scikit-learn。

PyTorch-Forecasting一个新的时间序列预测库

PyTorch- forecasting是一个建立在PyTorch之上的开源Python包

Meta 开源语音 AI 模型支持 1,100 多种语言

本周一Meta 又开源了新的语音模型MMS,并且发布了支持1100种语言的预训练模型权重

Jupyter Notebook 10个提升体验的高级技巧

Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。在这篇文章中,我将介绍10个可以提升体验的高级技巧。

升级到PyTorch 2.0的技巧总结

PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。我们将演示这个新功能的使用,以及介绍在使用它时可能遇到的一些问题。

计算GMAC和GFLOPS

GMAC 代表“Giga Multiply-Add Operations per Second”(每秒千兆乘法累加运算),是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量,以每秒十亿 (giga) 表示。

NSFW 图片分类

NSFW指的是不适宜工作场所("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。

常用的视频帧提取工具和方法总结

视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中,视频可以看作是由一系列连续的图像帧组成的。

使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具

Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。所以本文将介绍如何使用LangChain来创建我们自己的论文汇总工具。

LoRA:大模型的低秩自适应微调模型

对于大型模型来说,重新训练所有模型参数的全微调变得不可行。Microsoft 提出了低秩自适应大大减少了下游任务的可训练参数数量。

Github Copilot Chat的规则泄露,详细分析这31条规则

GitHub Copilot Chat是GitHub Copilot的一部分,它是一个基于人工智能的编程助手,

LayerNorm 在 Transformers 中对注意力的作用研究

LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。

数据信息汇总的7种基本技术总结

数据汇总是一个将原始数据简化为其主要成分或特征的过程,使其更容易理解、可视化和分析。本文介绍总结数据的七种重要方法,有助于理解数据实质的内容。

使用RobustPCA 进行时间序列的异常检测

鲁棒主成分分析(Robust Principal Component Analysis, RobustPCA)是一种将时间序列矩阵分解为低秩分量和稀疏分量的技术。这种分解能够识别潜在的趋势,以及检测异常和异常值。

视觉大模型DINOv2:自我监督学习的新领域

本文将介绍DINOv2是如何改进的,以及这些进步可能对整个领域有什么影响。

个人信息

加入时间:2020-01-23

最后活动:16 小时前

发帖数:1801

回复数:1