人工智能计算机视觉

图像检索在ImageNet分类任务中的优势：超越扩散模型生成图像

今天要聊到的这篇论文更全面地探究了扩散模型在下游任务如分类的贡献程度，作者在imageNet数据集上应用了4种不同的数据增强方法，一种为从Laion-5b数据集中直接图像检索得到同类别的图片，其余三种为基于扩散模型的数据增强方法，分别在这些增强后的训练集上训练ResNet50，并比较这四种数据增强方

overfit同步小助手 2024-08-17 06:01:28 0 收藏

面壁的智能开源 MiniCPM-V 2.6 边缘人工智能多模态功能与 GPT-4V 不相上下

机型特点： MiniCPM-V2.6 在边缘单图像、多图像、视频理解等核心能力上实现了全面超越，并首次将实时视频理解和多图像联合理解功能引入边缘，更加贴近复杂的真实场景。效率和性能：该模型占地面积小，却拥有极高的像素密度（令牌密度），是 GPT-4o 单令牌编码像素密度的两倍，在边缘设备上实现了极

overfit同步小助手 2024-08-16 23:01:43 0 收藏

CVPR 2024最佳论文分享：Mip-Splatting: 无混叠3D高斯溅射

本文介绍了一篇获得CVPR2024最佳论文提名的论文。该论文提出了一种名为Mip-Splatting的无混叠三维高斯溅射方法，结合多级混合技术和2D、3D Mip滤波器，显著减少了混叠伪影。该方法在多尺度数据训练和测试中表现优越，提升了渲染质量和计算效率。

overfit同步小助手 2024-08-16 19:01:39 0 收藏

【人工智能】Transformers之Pipeline（十）：视频分类（video-classification）

本文对transformers之pipeline的视频分类（video-classification）从概述、技术原理、pipeline参数、pipeline实战、模型排名等方面进行介绍，读者可以基于pipeline使用代码极简的代码部署计算机视觉中的视频分类（video-classificatio

overfit同步小助手 2024-08-16 11:01:28 0 收藏

Datawhale AI 夏令营2024·第二期(Deepfake攻防挑战赛-图像赛道)Task01

Datawhale AI 夏令营2024·第二期(Deepfake攻防挑战赛-图像赛道)赛题分析和任务解读

overfit同步小助手 2024-08-16 01:01:24 0 收藏

AI：180-如何利用Python进行图像处理和计算机视觉任务

Python在图像处理和计算机视觉领域展现了其强大的能力和广泛的应用前景。从基础的图像操作到复杂的深度学习模型，再到前沿的3D视觉和自动驾驶技术，Python提供了丰富的工具和库，使开发人员能够高效地解决各种图像处理和计算机视觉任务。基础图像处理：使用OpenCV进行图像读取、显示、保存、调整大小和

overfit同步小助手 2024-08-13 02:01:15 0 收藏

人工智能和计算机视觉领域国际学术会议submission

人工智能和计算机视觉领域国际学术会议submission参考。

overfit同步小助手 2024-08-12 01:01:07 0 收藏

20240809 每日AI必读资讯

Runway Academy的Gen-3 Alpha提供了一种将真人视频与生成的视觉特效结合的创新方法。- 新增模型支持: Flux 模型集成为用户提供了示例工作流和模型下载链接，显著增强了 AI 图像生成能力。- 结合3D高斯溅射技术（3DGS），赋予了ExAvatar更真实和高效的渲染能力。-

overfit同步小助手 2024-08-11 04:01:16 0 收藏

在AI浪潮中乘风破浪:程序员如何打造不可替代的核心竞争力

通过持续学习、培养跨学科能力、提升软技能、专注于创新和问题解决,以及深入理解AI工具,程序员完全可以在这个新时代中找到自己的位置,甚至获得更大的发展空间。在这个充满可能性的新时代,程序员的角色可能会发生变化,但其重要性只会与日俱增。保持开放、积极的心态,不断学习和适应,我们就能在AI的浪潮中乘风破浪

overfit同步小助手 2024-08-08 15:01:26 0 收藏

Ultralytics YOLO - 最先进的视觉人工智能：yolov8 环境搭建

Ultralytics YOLOv8是一种尖端的，最先进的(SOTA)模型，建立在以前的YOLO版本的成功基础上，并引入了新的功能和改进，以进一步提高性能和灵活性。YOLOv8旨在快速，准确，易于使用，使其成为广泛的目标检测和跟踪，实例分割，图像分类和姿态估计任务的绝佳选择。

overfit同步小助手 2024-08-07 11:01:12 0 收藏

ReadAgent，一款具有要点记忆的人工智能阅读代理

ReadAgent的工作流程，包括分页、主旨压缩和交互式查找Figure 1展示了 ReadAgent 的工作流程，这是一个模仿人类阅读习惯设计的系统，旨在有效处理和理解长文本。分页（Episode Pagination）：系统将长文本分解为一系列较小的、逻辑上连贯的文本块，即“剧集”，类似于将一本

overfit同步小助手 2024-08-06 00:01:45 0 收藏

＜数据集＞棉花识别数据集＜目标检测＞

YOLO与VOC格式的棉花开花程度识别数据集，适用于YOLO系列、Faster Rcnn、SSD等模型训练，类别：Bacterial Blight、Curl virus、Fussarium wilt、Healthy

overfit同步小助手 2024-08-03 02:01:40 0 收藏

【人工智能高频面试题--基础篇】

人工智能面试题，他来了！

overfit同步小助手 2024-07-24 20:01:47 0 收藏

人工智能在计算机视觉与图像处理中的应用

1.背景介绍人工智能在计算机视觉与图像处理中的应用1. 背景介绍计算机视觉是一种通过计算机程序对图像进行处理和理解的技术。图像处理是计算机视觉的一个重要组成部分，涉及到图像的存储、传输、处理和显示等方面。随着计算机技术的不断发展，计算机视觉和图像处理技术的应用也越来越广泛。人工智能(AI)是一种通过

overfit同步小助手 2024-07-24 20:01:34 0 收藏

盘点国内外免费AI视频工具，助你先人一步拥抱AI

自2022年底ChatGPT横空出世，AIGC（人工智能生成内容）的革新浪潮席卷而来。从最初的文本生成模型，到如今涵盖文本、语音、图像、音乐、视频等多模态大模型的百花齐放，AIGC正在以惊人的速度重塑着内容创作的格局。面对这股势不可挡的潮流，我们唯有积极拥抱AI，将其融入到工作与生活中，才能在未来占

overfit同步小助手 2024-07-19 09:01:48 0 收藏

【人工智能学习之图像操作（四）】

非极大值抑制是一种边缘稀疏技术，非极大值抑制的作用在于“瘦”边。对图像进行梯度计算后，仅仅基于梯度值提取的边缘仍然很模糊。函数 cv2.isContourConvex() 可以可以用来检测一个曲线是不是凸的。函数 cv2.convexHull() 可以用来检测一个曲线是否具有凸性缺陷，并能纠正缺陷。

overfit同步小助手 2024-07-15 22:01:34 0 收藏

ai写的论文能被查出来吗？怎么利用ai写文章

AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，重复率超过10%包退费。尽管AI技术在写作领域取得了显著的进步，但目前的AI写作工具在生成文本时仍存在一些特定的痕迹和模式，这些可以被专门的检测工具

overfit同步小助手 2024-07-15 07:01:12 0 收藏

AI智能视觉监控平台开源了——助力企业智慧化升级！

AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。

overfit同步小助手 2024-07-10 21:01:37 0 收藏

AI自动生成角色和情节连续的漫画,中山大学&联想提出AutoStudio，可以多轮交互式连续生成并保持主题一致性。

由于尖端的文本转图像 (T2I) 生成模型已经擅长生成出色的单幅图像，因此一项更具挑战性的任务，即多轮交互式图像生成，开始引起相关研究界的关注。此任务要求模型与用户进行多轮交互以生成连贯的图像序列。但是，由于用户可能频繁切换主题，因此当前的努力很难在生成多样化图像的同时保持主题一致性。为了解决这个问

overfit同步小助手 2024-07-09 12:01:11 0 收藏

Luma Dream Machine：AI 视频生成

Dream Machine是Luma AI开发的AI视频生成模型，能够快速将文本和图像转换为高质量、逼真的视频，适用于创意视频制作、故事讲述、市场营销及教育培训等场景，提供多样化的摄像机运动选项，帮助用户实现快速、高效的视频创作。

overfit同步小助手 2024-07-07 10:01:07 0 收藏