计算机视觉 - overfit.cn

机器视觉07——常见光源特点及应用之环形光源详解

机器视觉光源#前期文章分析了，选择一个合适的光源，需要满足的四点主要要求，文章见链接！本期开始，将分享常见光源的特点及应用。光源的特点，决定了其适合应用的场景。或者说，根据应用场景的需求，我们要选择具有相应特点的光源。

overfit同步小助手 2024-10-01 09:01:30 0 收藏

vision mamba 原理篇

与 transformer中注意力机制不同，S6 将 1D 向量中的每个元素（例如文本序列）与在此之前扫描过的信息进行交互，从而有效地将二次复杂度降低到线性。然而，由于视觉信号（如图像）不像文本序列那样具有天然的有序性，因此无法在视觉信号上简单地对 S6 中的数据扫描方法进行直接应用。在 CSM 的

overfit同步小助手 2024-09-29 18:01:46 0 收藏

RT-DETR: 实时目标检测的又一次进化

点击下方卡片，关注“小白玩转Python”公众号实时目标检测是一个具有广泛应用的关键领域，从物体跟踪到自动驾驶。想象一下，一辆能够实时检测行人和其他车辆的自动驾驶汽车，或一个可以同时跟踪多个移动物体的监控系统。这些系统的效率和准确性取决于其快速、准确地处理和分析视觉数据的能力。这就是实时目标检测的重

overfit同步小助手 2024-09-27 14:01:58 0 收藏

AI：280-深入解析OpenCV中的数值计算与图像阈值处理：方法、优化与应用实例

图像处理是计算机视觉领域的重要组成部分，而阈值处理是其中的基础操作之一。阈值处理通过设置图像像素值的上下限，将图像分割成目标与背景部分。这篇文章将深入探讨OpenCV中的数值计算与图像阈值处理，结合代码实例，帮助你更好地理解和应用这些技术。

overfit同步小助手 2024-09-27 12:01:21 0 收藏

FLUX.1图像生成模型：AI工程师的实践与探索

黑森林实验室（Black Forest Labs）研发的FLUX.1图像生成模型，以其120亿参数的庞大规模，正在重新定义图像生成技术的新标准。FLUX.1系列模型的推出，不仅为AI工程师提供了强大的工具，也为整个图像生成领域带来了新的活力。

overfit同步小助手 2024-09-26 16:01:28 0 收藏

AI：274-深入探讨OpenCV中的ROI区域处理及其高级应用

在OpenCV中，定义ROI非常简单。通常可以通过切片操作或使用OpenCV的方法来实现。import cv2# 读取图像# 定义一个矩形ROI# 显示ROI在上述代码中，我们读取了一张图像，并定义了一个矩形区域。通过切片操作，我们提取了该区域并显示出来。本文探讨了ROI（感兴趣区域）在OpenCV

overfit同步小助手 2024-09-26 12:01:28 0 收藏

OPenCV高级编程——OpenCV常见的API及绘图知识详解

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习软件库，它提供了大量的图像处理、视频分析、对象检测等功能。本文将详细介绍OpenCV中常见的API以及绘图相关的知识，帮助开发者更好地理解和使用OpenCV。

overfit同步小助手 2024-09-25 18:01:46 0 收藏

【Arxiv2023】Detect Everything with Few Examples

本文提出了小样本目标检测领域的SOTA方法DE-ViT，采用元学习训练框架。DE-ViT提出了一种新的区域传递机制用于检测框定位，并且提出了一种空间积分层来讲mask转化为检测框输出。DE-ViT相比之前的方法提升巨大，在COCO数据集上，10-shot提升15AP，30shot提升7.2AP。

overfit同步小助手 2024-09-24 05:01:29 0 收藏

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

通义千问团队宣布，继Qwen2发布三个月后，Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一，包括了通用语言模型Qwen2.5，以及专门针对编程和数学领域的Qwen2.5-Coder和Qwen2.5-Math模型。Qwen2.5系列模型在最新的

overfit同步小助手 2024-09-23 17:03:50 0 收藏

postgres.new：在浏览器中构建与AI协作的开源Postgres沙盒

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhin

overfit同步小助手 2024-09-21 12:01:34 0 收藏

如何寻找一个领域的顶级会议，并且判断这个会议的影响力？

相对应的，普通会议的论文往往引用率很低。，导师、系教授或师兄姐都已经在领域中一段时间了，他们对领域内的知名会议有着深刻的理解和认识。例如：CCF（中国计算机学会）有官方的学术会议推荐名单，里面的学术会议分为A、B、C三个等级，推荐名单中的会议基本都是计算机领域的顶级会议，等级越高说明影响力越大。如果

overfit同步小助手 2024-09-20 09:01:41 0 收藏

【实战】双目测距python实现（含标定）

相机标定主要是为了获取左右相机的内参矩阵、畸变系数、旋转矩阵和平移向量，方便后续对获得的图像进行畸变矫正和图像对齐。是描述相机内在参数的3x3矩阵，包含了相机的焦距和光学中心的位置。这些参数定义了相机的成像过程中的投影关系，内参矩阵一般表示为：其中：fx 和 fy 是焦距（以像素为单位），分别对应x

overfit同步小助手 2024-09-16 14:01:08 0 收藏

AI：259-全新YOLOv8改进策略 | 基于MSDA多尺度空洞注意力机制的优化与实现

空洞卷积是一种用于扩大感受野而不增加计算量的卷积操作。通过在卷积核的权重之间引入空洞（即间隔），空洞卷积能够捕捉更大范围的信息，同时保持计算效率。空洞卷积的公式为：其中，( r ) 是空洞率，控制了感受野的大小。

overfit同步小助手 2024-09-16 13:01:29 0 收藏

Stable Diffusion训练LoRA模型参数详细说明（阿里巴巴堆友AI）

PagedAdamW8bit在AdamW8bit的基础上进一步优化，通过将参数分片或分页，以更有效地处理内存，适合在更小的GPU内存中训练大型模型。PagedLion8bit在Fat Duck格的基础上，进一步优化内存使用，适合在内存受限的环境中训练大型深度学习模型。SGDNesterov8bit是

overfit同步小助手 2024-09-15 22:01:13 0 收藏

【图像识别】十大数据集合集！

他们为微软研究院提供了超过300万张猫和狗的图像，这些图像是由美国数千个动物收容所的人手动分类的。我们设计了一个系统来描述带有情感的图像，并展示了一个自动生成带有正面或负面情绪的字幕的模型。因此，我们使用Voxygen的文本到语音系统来合成可用的字幕。该数据集为细粒度分类数据集 CUB 收集人类注视

overfit同步小助手 2024-09-15 09:01:11 0 收藏

python第三方库——pillow库

python应用之图像处理

overfit同步小助手 2024-09-14 14:01:37 0 收藏

【YOLO5 项目实战】（5）YOLO5+DeepSort 目标追踪

YOLOv5_Deepsort 是一个基于 YOLOv5 的两阶段目标追踪算法，用于实现视频中的目标检测和追踪。本文详细说明YOLO5目标追踪的操作步骤，报错处理。

overfit同步小助手 2024-09-14 13:01:46 0 收藏

数据集 | 人脸公开数据集的介绍及下载地址

本文介绍了人脸相关算法的数据集。

overfit同步小助手 2024-09-13 23:01:29 0 收藏

加油站安全风险监测预警系统 YOLOv3

加油站安全风险监测预警系统可以通过对加油站设备、环境、人员等方面进行监测，加油站安全风险监测预警系统实现对加油站的全面监管。例如，在加油站油罐区中，加油站安全风险监测预警系统可以对加油站人员抽烟打电话、明火烟雾等环境安全隐患进行自动识别，及时发出预警，避免因现场人员违规行为等不恰当的操作而导致的人员

overfit同步小助手 2024-09-13 19:07:13 0 收藏

最新综述：多模态引导的基于文生图大模型的图像编辑算法

近期，复旦大学 FVL 实验室和南洋理工大学的研究人员对于多模态引导的基于文生图（Text-to-Image，T2I）大模型的图像编辑算法进行了总结和回顾。综述涵盖 300 多篇相关研究，调研的最新模型截止至今年 6 月。图2.综述框架旨在根据用户的特定需求编辑给定的合成图像或真实图像。作为人工智能

overfit同步小助手 2024-09-13 14:01:44 0 收藏