计算机视觉 - overfit.cn

大世界模型 Large World Model（LWM）：开源界Gemini Pro

目前，在paperswithcode网站研究趋势榜单中排名第一。大世界模型（LWM）是一种通用的多模态自回归模型。它使用RingAttention在各种长视频和书籍的大型数据集上进行训练，可以执行语言，图像和视频理解和生成。LWM可以与图像聊天。LWM可以跨1M上下文检索事实，具有高准确性。LWM可

overfit同步小助手 2024-03-05 02:04:12 0 收藏

人工智能 — 边缘提取

边缘提取、图像锐化和图像平滑、Prewitt 算子、Sobel 算子、Canny 边缘检测算法

overfit同步小助手 2024-03-04 23:01:40 0 收藏

【计算机视觉】Vision Transformer （ViT）详细解析

overfit同步小助手 2024-03-03 12:01:33 0 收藏

Sora OpenAI发布的人工智能文生视频大模型

Sora，OpenAI发布的人工智能文生视频大模型（但OpenAI并未单纯将其视为视频模型，而是作为“世界模拟器”），于2024年2月15日（美国当地时间）正式对外发布。Sora继承了DALL-E 3的画质和遵循指令能力，可以根据用户的文本提示创建逼真的视频，该模型可以深度模拟真实物理世界，能生

overfit同步小助手 2024-03-01 10:01:43 0 收藏

AI视觉训练环境-【1】训练服务器搭建

训练服务器基于docker容器进行深度学习环境的搭建，开发人员通过PyCharm、VSCode等开发环境连接至远程训练服务器的容器，利用训练服务器的GPU进行训练。服务器操作系统：Ubuntu。

overfit同步小助手 2024-02-29 09:01:05 0 收藏

特征值与特征函数在图像安全与隐私保护中的应用

1.背景介绍图像安全与隐私保护是当今社会中的一个重要问题，尤其是随着人工智能技术的不断发展，图像数据的收集、存储和处理量不断增加，这也带来了一系列隐私保护和安全性问题。特征值与特征函数在图像安全与隐私保护中发挥着越来越重要的作用，因为它们可以帮助我们更有效地保护图像数据的隐私和安全性。在这篇文章中，

overfit同步小助手 2024-02-29 02:07:10 0 收藏

9款最新文生图模型汇总！含华为、谷歌、Stability AI等大厂创新模型（附论文和代码）

本文提出了Imagen，一款新型的文本到图像扩散模型，实现了极高的真实感和深度语言理解。本文提出了DreamBooth，一种个性化文生图模型，它通过微调预训练的文生图模型，如Imagen，将一个独特的标识符与某个物体绑定，这样模型就可以在含有该标识符的prompt下，在不同场景中生成包含该物体的新颖

overfit同步小助手 2024-02-26 09:01:35 0 收藏

机器视觉技术（总结）

本文简要介绍了机器视觉技术

overfit同步小助手 2024-02-24 01:01:36 0 收藏

【AI视野·今日CV 计算机视觉论文速览第292期】Thu, 18 Jan 2024

AI视野·今日CS.CV 计算机视觉论文速览Thu, 18 Jan 2024Totally 102 papers👉上期速览✈更多精彩请移步主页Daily Computer Vision PapersGARField: Group Anything with Radiance Fields A

overfit同步小助手 2024-02-23 18:01:48 0 收藏

视觉感知(三)：车道线检测

本期为大家带来车位线检测相关知识点，以及算法工程落地的全流程演示。上期我们讲了车位线检测是自动泊车领域必不可缺的一环，而今天的车道线检测则是辅助驾驶领域必不可缺的一环。所谓车道线检测任务就是对当前行驶道路的车道线进行检测，给出自车道及左右两侧至少各一个车道的车位线信息，如车道线的曲率、类型（虚线、实

overfit同步小助手 2024-02-23 01:01:43 0 收藏

OpenCV简介、导入及图像处理基础方法讲解（图文解释附源码）

overfit同步小助手 2024-02-19 12:01:07 0 收藏

（2022|CVPR，非自回归，掩蔽图像生成，迭代译码）MaskGIT：掩蔽生成式图像 Transformer

本文提出 MaskGIT，使用双向 Transformer 解码器进行图像生成。在训练期间，MaskGIT 通过关注所有方向上的标记来学习预测随机掩蔽的标记。在推理时，模型首先同时生成图像的所有标记，然后在先前生成的基础上迭代地细化图像。

overfit同步小助手 2024-02-19 00:04:27 0 收藏

安全通道堵塞识别摄像机

它通过实时监测和报警，能够及时发现通道堵塞情况，并帮助管理人员迅速清除障碍物，确保通道畅通。为了及时识别和解决安全通道堵塞问题，专门设计了安全通道堵塞识别摄像机，它具有监测、识别和报警功能，可在第一时间发现通道堵塞情况。通过深度学习和图像识别技术，它能够自动识别堵塞物体类型和严重程度，从而更加准确地

overfit同步小助手 2024-02-18 01:07:26 0 收藏

AI别墅设计

生成平面图的流程：第一步：根据对大量训练样本的学习首先对整体布局操作东西南北的房间和中间客厅的进深及分布进行确定，包括确定楼梯的型号和方位朝向，确定厨房餐厅的方位位置关系和尺寸。虽然房屋平面图属于图像但是普通的图像处理处理算法，如：图像识别技术只是识别图像中有什么位置距离大小等无法用于图像生成，GA

overfit同步小助手 2024-02-17 18:01:27 0 收藏

开源项目 | 用AI给人像照片换发型和发色（附详细步骤 + 避坑指南)

我们新颖的表示方法能够从多个参考图像中传输视觉属性，包括痣和皱纹等特定细节，并且因为我们在潜在空间中进行图像混合，所以我们能够合成连贯的图像。我们的方法避免了其他方法中存在的混合伪影，并找到全局一致的图像。源码中是用yaml直接创建环境，environment/environment.yaml ，这

overfit同步小助手 2024-02-15 22:01:35 0 收藏

2024人工智能顶会投稿时间

CCF A类会议共七场，如下：

overfit同步小助手 2024-02-14 06:01:33 0 收藏

基于web的亚热带常见自然林病虫害识别系统——开篇

随着年底的到来，我相信越来越多的小伙伴也要开始着手自己的毕业设计，这里打算分享我自己的毕业设计，以及我的二次开发创作的项目，为大家的毕业设计提供一定的参考，如果有毕业问题相关的小伙伴也可以及时跟我沟通，我会及时回复大家！开篇我先介绍一下我的毕业设计——基于web的亚热带常见自然林病虫害识别系统。Te

overfit同步小助手 2024-02-14 05:03:11 0 收藏

RGB相机、深度相机以及LiDAR成像原理

成像原理

overfit同步小助手 2024-02-07 10:05:13 0 收藏

自动驾驶环境感知之基于毫米波雷达稀疏点云的物体检测与跟踪

系统中测量到的速度是目标相对于雷达的径向相对速度，目标的实际运动方向不一定是目标与雷达之间的径向，因此需要先将径向相对速度转换为实际相对速度。然后再结合雷达自身速度（车身速度），得到目标的绝对速度（相对于地面的速度）。基本思路：假定类别可以通过样本分布的紧密程度决定，通过将紧密相连的样本分为一类，得

overfit同步小助手 2024-02-07 10:04:51 0 收藏

AI前沿论文速递 24.01.23

AI前沿论文速递，github高星论文

overfit同步小助手 2024-02-07 10:01:38 0 收藏