FPN细节剖析以及pytorch代码实现

FPN细节剖析以及pytorch代码实现

[ 数据集 ] VOC 2012 数据集介绍

[ 数据集 ] VOC 2012 数据集介绍VOC 2012它从根本上说是一个有监督的学习问题,提供了一组标记图像的训练集;包括二十个对象类别:Person、Animal、Vehicle、Indoor;有三个主要的对象识别竞赛:分类、检测和分割;VOC 2012 文件夹介绍1)Annotations

模型初始化与随机种子——Pytorch 炼丹技巧(随手记)

模型参数的默认初始化方式和自定义初始化方式,以及通过设置随机种子让每次实验的模型初始化参数保持一致

tf-idf原理 & TfidfVectorizer参数详解及实战

tf-idf作为文体特征提取的常用统计方法之一,适合用于文本分类任务,本文从原理、参数详解及实战全方位详解tf-idf,掌握本篇即可轻松上手并用于文本数据分类。tf 表示(某单词在某文本中的出现次数/该文本中所有词的词数),idf表示(语料库中包含某单词的文本数、的倒数、取log),tf-idf则表

Python将语音识别成文字

theme: orange持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第30天,点击查看活动详情 ???? 个人主页:@青Cheng序员石头 在本教程中,我们将学习如何将语音或音频文件转换为文本格式,此处主要是用Python相关库完成功能。语音识别介绍Python支持许

实战 | 用Python 和 OpenCV搭建老人跌倒智能监测系统 (步骤 + 源码)

由于我们将根据我们使用 OpenCV 获得的角度和坐标来假设一个人是在行走还是跌倒在地上,因此,我们必须计算角度,最简单的方法是定义一个函数,然后调用它在程序中。

python端使用opencv的GPU读取视频的小记

在python种使用GPU读取视频,以及GpuMat的拼接操作。

ResUnet++

ResUnet++

【朝夕教育】2023年03月 其他-运动控制和机器视觉面试题(34道)

运动控制是指“控制移动”之意。其代表可以举出利用各种电机进行位置控制等。电能附加给电机,使电机工作,转换为动能。这项技术作为机床、机械手控制、半导体制造装置、注塑成型机、数字家电检查装置等的核心,发挥着巨大的作用,在这一领域的设备投资近年来大幅增长。​ 马尔计算视觉理论包含二个主要观点

ChatGPT写程序如何?

ChatGPT最近挺火的,据说还能写程序,感到有些惊讶。于是在使用ChatGPT有一周左右后,分享一下用它写程序的效果如何。

训练自己的GPT2-Chinese模型

基于GPT2-Chinese训练中文文本模型

【OpenCV--模板匹配】

模板匹配就是在给定的图片中,查找和模板最相似的区域,算法的输入包括模板和图片,通过不断移动模板图片,计算其与图片对应区域匹配度,将匹配度最高区域选择为最终结果。

UNet - 预测数据predict(多个图像的分割)

目录1. 介绍2. predict 预测分割图片3. 结果展示4. 完整代码之前已经将unet的网络模块、dataset数据加载和train训练数据已经解决了,这次要将unet网络去分割图像,下面是之前的链接unet 网络:UNet - unet网络dataset 数据处理:UNet - 数据加载

基于OpenCV的图片和视频人脸识别

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容,基于OpenCV的图片和视频人脸识别。介绍Haar的概念,以及如何对图片和视频中进行人脸检测,以及如何训练我们自己的模型,并在自己的模型下进行人脸识别。

使用 PatchCore 进行图像异常检测

我们已经介绍了 PatchCore 的关键概念,并将其应用于医学影像数据集。即使数据集非常有限,我们也看到了一些非常有希望的结果。一般来说,如果您有一个用例,其中正常数据很容易获取但异常数据很昂贵(甚至是先验未知的),anomalib 可能是一个值得考虑的好工具。相关代码与数据集下载:欢迎关注公众号

ChatGPT和一群程序员的对话,甚至出现橙色警报

ChatGPT和一群程序员的对话

吴恩达机器学习课程资源(笔记、中英文字幕视频、课后作业,提供百度云镜像!)

课程,可以说是机器学习入门的第一课和最热门课程,作者在github开源了吴恩达机器学习个人笔记,用python复现了课程作业,成为热门项目,star数达到11671+。由于某种原因,国内用户访问github非常慢,下载资源经常失败,于是,为方便读者,我们把github内容做成镜像文件予以发布,针对非

stable diffusion插件controlnet的详细讲解以及用法说明

controlnet是基于只能绘画AI-stable diffusion推出的一款功能强大的插件,它为文生图功能引入了新的控制方式,可以额外控制人物的具体姿势,景深,线稿上色等等,可以更稳定的控制画面。

Dropout的深入理解(基础介绍、模型描述、原理深入、代码实现以及变种)

深度神经网络包含多个非线性隐藏层,这使得它们有强大的表现力,可以学习输入和输出之间非常复杂的关系。但是在训练数据有限的情况下,深度神经网络很容易过度学习造成过拟合,过拟合是深度神经网络的一个非常严重的问题,此外,神经网络越大,训练速度越慢,Dropout可以通过在训练神经网络期间随机丢弃单元来防止过

DINO 论文精度,并解析其模型结构 & DETR 的变体

截止2022年7月25日,DINO是目标检测的SOTA。本人根据源码的复现感受和DINO论文的精读心得,撰写本篇博客,希望对你有所帮助。DINO(DETR with Improved deNoising anchOr boxes),一款最先进的端到端对象检测器。对比的去噪训练方式;用于锚点初始化的混