【深度学习】(三)图像分类

上一章介绍了深度学习的基础内容,这一章来学习一下图像分类的内容。图像分类是计算机视觉中最基础的一个任务,也是几乎所有的基准模型进行比较的任务。从最开始比较简单的10分类的灰度图像手写数字识别任务mnist,到后来更大一点的10分类的cifar10和100分类的cifar100任务,到后来的image

使用python手写Metropolis-Hastings算法的贝叶斯线性回归

本文通过手写Metropolis-Hastings来深入的理解MCMC的过程

word2vec简单总结

与Skip-Gram相反,CBOW模型假设上下文词可以用来生成中心词。Skip-Gram模型假设中心词可以用来生成上下文词。在计算条件概率时我们通常会对这些上下文词取平均,即。,则Skip-Gram模型的似然函数为。表示其用作中心词和上下文词的两个向量。维向量来表示,具体来说,对于索引为。CBOW模

ROS从入门到精通(十) TF坐标变换原理,为什么需要TF变换?

TF坐标变换是ROS中很重要的组成原理,本节从两个实例出发介绍TF变换的作用,最后基于Rviz可视化加深理解

在线会议中人脸面部轮廓图像提取(三)——Dlib库人脸面部轮廓图像特征提取

当当当当,第三期来廖!接上一期,介绍完HOG特征提取我们继续学习Dlib库提取特征叭!

从零开始实现一个简单的CycleGAN项目

pytorch 中CycleGAN(循环一致生成对抗网络)的简单且易于修改的实现

PyTorch 结构重参数化 RepVGGBlock

近年来,卷积神经网络的结构已经变得越来越复杂;得益于多分支结构良好的收敛能力,多分支结构越来越流行但是,使用多分支结构的时候,一方面无法有效地利用并行加速,另一方面增加了MAC为了使简单结构也能达到与多分支结构相当的精度,在训练RepVGG时使用多分支结构(3×3卷积+1×1卷积+恒等映射),以借助

图片、视频修复并超分 - Real-ESRGAN项目使用(一) | 机器学习

前段时间一直在弄golang,很少关注一些开源项目。正巧碰到一个,可以将模糊的照片或者视频修复清晰,且可以超分处理的项目。

基于百度AI和QT的景物识别系统

基于百度AI和QT的景物识别系统,可以通过百度AI来识别出图片中的动物是什么种类并以文字的形式进行反馈。(每一部分都有源码)除此之外还有一些微功能作为点缀,分别实现了程序启动时的GIF动图效果、简易GIF播放器、打点计时器、按钮长按功能、任务栏加载进度条。...

5分钟NLP:Python文本生成的Beam Search解码

Beam Search不取每个标记本身的绝对概率,而是考虑每个标记的所有可能扩展。然后根据其对数概率选择最合适的标记序列。

GraphMAE:将MAE的方法应用到图中使图的生成式自监督学习超越了对比学习

前几天的文章中我们提到MAE在时间序列的应用,本篇文章介绍的论文已经将MAE的方法应用到图中,这是来自[KDD2022]的论文GraphMAE: Self-supervised Masked Graph Autoencoders

‘kaggle视频游戏销售数据的可视化和分析‘项目实现

‘kaggle视频游戏销售数据的可视化和分析‘项目实现——Python实现

吴恩达机器学习 手推正则化线性回归 正规方程 小白第一篇文章

手推机器学习 多元线性回归 正则化 正规方程

基于opencv 的OCR小票识别(1)

今天在超市购物的时候,发现一个新的需求,能不能通过拍照识别的方式进行记账,于是开始行动,干起来。-灰度化,去噪,边缘检测算法。进行OCR框架安装和文字识别。

【OpenCV】图像拼接 原理介绍 C++ OpenCV 案例实现

本文以实现图像拼接为目标,把分割开的图像进行拼接还原,核心的内容包括:OpenCV图像拼接相关原理以及OpenCV图像拼接案例的实现

2022搜狐校园NLP算法大赛情感分析第一名方案理解和复现

2022搜狐校园NLP算法大赛情感分析第一名方案理解,代码复现和效果对比

使用Python和OCR进行文档解析的完整代码演示

在本文中将使用Python演示如何解析文档(如pdf)并提取文本,图形,表格等信息。

解决seaborn.load_dataset()导入数据时报错问题

解决sns.load_dataset()导入数据不成功问题