计算机视觉 - overfit.cn

OpenCV：开源计算机视觉的魔力之门

OpenCV是一个开源的计算机视觉和机器学习软件库，它包含了众多图像处理和计算机视觉方面的通用算法。OpenCV由一系列C函数和少量C++类构成，同时提供了Python、MATLAB等语言的接口，使得开发者能够轻松地在不同平台上进行计算机视觉应用的开发。无论是学术研究还是商业应用，OpenCV都已成

overfit同步小助手 2024-03-17 10:04:30 0 收藏

基于扩散的图像超分辨率模型：ResShift

基于扩散的图像超分辨率(SR)方法由于需要数百甚至数千个采样步骤，导致推理速度较低。现有的加速采样技术不可避免地会在一定程度上牺牲性能，导致SR结果过于模糊。为了解决这个问题，我们提出了一种新颖有效的SR扩散模型，该模型显著减少了扩散步骤的数量，从而消除了推理过程中对后加速的需求及其相关的性能下降。

overfit同步小助手 2024-03-16 12:06:33 0 收藏

图像增强库albumentations(v1.3.0, 2023.5)中所有图像增强方法记录（class）

Albumentations图像增强库中所有图像增强方法的记录。

overfit同步小助手 2024-03-15 21:01:47 0 收藏

【论文笔记】Mamba：挑战Transformer地位的新架构

Mamba的论文笔记

overfit同步小助手 2024-03-15 05:02:25 0 收藏

YOLO语义分割标注文件txt还原到图像中

【代码】YOLO语义分割标注文件txt还原到图像中

overfit同步小助手 2024-03-15 04:02:44 0 收藏

论文AI率怎么降：揭秘有效降低AI辅助写作比例的策略

综上所述，降低论文AI率需要我们从多个方面入手，包括明确写作目标与内容定位、提升作者的学术素养与写作能力、合理利用AI辅助工具、强化原创性意识与规范引用、建立论文审核机制与反馈循环、加强学术道德教育与监管以及利用技术手段降低AI辅助比例。只有这样，我们才能确保学术论文的质量和原创性，推动学术研究的健

overfit同步小助手 2024-03-15 00:01:28 0 收藏

阿里最新EMO：只需要提供一张照片和一段音频，即可生成会说话唱歌的AI视频

阿里发布AI图片-音频-视频模型技术EMO，用户只需要提供一张照片和一段任意音频文件，EMO即可生成会说话唱歌的AI视频。以及实现无缝对接的动态小视频，最长时间可达1分30秒左右。

overfit同步小助手 2024-03-14 17:01:45 0 收藏

Mamba-UNet：用于医学图像分割的类似UNet的纯视觉Mamba网络

所提出的Mamba-UNet的架构如图2所示，其灵感来源于UNet [24] 和 Swin-UNet [3]。首先将大小为 H × W × 1 的2D灰度图像分割成类似于ViT和VMamba的块 [5,16]，然后转换为维度为 H/4 × W/4 × 16 的1D序列。一个初始的线性嵌入层将特征维度

overfit同步小助手 2024-03-14 12:06:31 0 收藏

【AI视野·今日CV 计算机视觉论文速览第298期】Fri, 26 Jan 2024

AI视野·今日CS.CV 计算机视觉论文速览Fri, 26 Jan 2024Totally 71 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersMultimodal Pathway: Improve Transformers with Irrel

overfit同步小助手 2024-03-14 00:01:41 0 收藏

Labelme加载AI（Segment-Anything）模型进行图像标注

labelme是使用python写的基于QT的跨平台图像标注工具，可用来标注分类、检测、分割、关键点等常见的视觉任务，支持VOC格式和COCO等的导出，代码简单易读，是非常利用上手的良心工具。（2）在labelme/labelme/文件夹下自建一个文件夹model_file。（3）依次输入以下几个网

overfit同步小助手 2024-03-11 13:01:43 0 收藏

nnU-Netv2在服务器上使用全流程（小白边踩坑边学习的记录）

小白第一次使用nnunet做医学影像分割任务的经历，记录记录踩的坑，憧憬下未来的继续使用

overfit同步小助手 2024-03-10 21:06:35 0 收藏

（2024，提示优化，监督微调，强化学习，近端策略优化）用于安全生成文本到图像的通用提示优化器

本文提出用于安全 T2I 生成的通用提示优化器。首先构建一个包含有毒-清洁提示对的数据集来微调 LM。然后设计了一个奖励函数，用于衡量生成图像的毒性和文本对齐度，并通过近端策略优化进行训练。

overfit同步小助手 2024-03-10 15:07:30 0 收藏

sora参考文献整理及AI论文工作流完善（更新中）

OpenAI最新发布的Sora效果惊为天人，除了阅读研究原文（openai.com/research/video-generation-models-as-world-simulators）之外，其引用的32篇参考文献也是了解对应技术路线的重要信息。借此机会，也顺便探索一下整个AI论文的工作应该是什

overfit同步小助手 2024-03-09 23:01:41 0 收藏

图像增强的两个评价指标：峰值信噪比PSNR和结构相似度SSIM

两种图像增强的评价指标（全参考指标）PSNR和SSIM

overfit同步小助手 2024-03-09 00:01:31 0 收藏

AI之T2I：Stable Diffusion 3的简介、安装和使用方法、案例应用之详细攻略

AI之T2I：Stable Diffusion 3的简介、安装和使用方法、案例应用之详细攻略目录Stable Diffusion 3的简介Stable Diffusion 3的安装和使用方法Stable Diffusion 3的案例应用Stable Diffusion 3的简介提示：夜晚，山顶上的

overfit同步小助手 2024-03-08 16:01:31 0 收藏

主流AI服务——大专生新就业之路

overfit同步小助手 2024-03-07 09:01:35 0 收藏

深度解析Sora的核心技术

overfit同步小助手 2024-03-07 00:01:42 0 收藏

Cmake编译《OpenGL超级宝典》第七版GitHub源码及常见错误解决

LNK4272: 库计算机类型“x86”与目标计算机类型“x64”冲突的解决方法；LNK201：无法解析的外部符号 __imp_wglGetProcAddress，函数 get_proc 中引用了该符号的解决方法；无法启动程序 glfw-3.3.9(build\Win32\Debug\ALL BUI

overfit同步小助手 2024-03-06 23:04:32 0 收藏

AI浅谈：计算机视觉（CV）技术的优势和挑战

自动驾驶汽车是利用CV技术实现的。这些系统使用多种传感器（如摄像头、雷达和激光雷达等）来捕获周围环境的数据，并通过算法进行分析。这样，汽车就可以自动控制方向、速度和距离等参数进行行驶。然而，在雨天、夜晚和极端天气条件下，CV技术可能会受到限制，从而影响汽车的性能和安全性。

overfit同步小助手 2024-03-06 07:01:46 0 收藏

Sora：开启视频创作未来的AI革命。Chatgpt

在人工智能技术迅猛发展的今天，OpenAI推出的AI视频模型Sora代表了视频创作领域的一次重大革新。Sora凭借其卓越的性能和前瞻性技术，不仅提高了视频制作的效率和质量，还开辟了全新的创作可能性。本文深入探讨了Sora的核心技术特点，包括其先进的神经网络结构、数据处理能力和学习算法，展现了它在视频

overfit同步小助手 2024-03-05 14:01:12 0 收藏