【智能时代】的崛起:【人工智能】、【机器学习】与【计算机视觉】的革命
人工智能、机器学习、深度学习及计算机视觉的核心概念与应用,通过理论分析与代码示例展示了这些技术的实际操作和发展趋势。文章探讨了它们在医疗、金融、制造等领域的应用,及未来面临的挑战,为读者提供了全面的技术指南和未来展望。
发布Meta Segment Anything Model 2 (SAM 2):开启图像和视频分割的新时代
继Meta Segment Anything Model (SAM) 在图像分割领域取得成功之后,Meta发布了SAM 2,这是一款用于图像和视频的实时可提示对象分割的统一模型,达到了业界最先进的性能。SAM 2的多种潜在应用包括与生成视频模型结合以创建新的视频效果,帮助建立更好的计算机视觉系统的快
【人工智能】Transformers之Pipeline(十三):填充蒙版(fill-mask)
本文对transformers之pipeline的填充蒙版(fill-mask)从概述、技术原理、pipeline参数、pipeline实战、模型排名等方面进行介绍,读者可以基于pipeline使用文中的2行代码极简的使用NLP中的填充蒙版(fill-mask)模型。
手把手教你暗通道先验去雾算法
暗通道先验去雾算法(Dark Channel Prior, DCP)是一种基于图像的去雾技术,由Kaiming He等人在2009年提出。这种算法利用了大气散射模型,通过估计大气光和图像的传输图来去除雾的影响。
语义分割快速入门教程(mmsegmentation平台)
让小白快速入门语义分割,少走弯路
专家混合系统MoE的综述
24年7月来自香港科技大学广州分校的论文“A Survey on Mixture of Experts”。
C# VideoCapture 多路视频播放
C# VideoCapture 多路视频播放
【OpenCV 】插值的方法原理,图片缩放,矫正,边界填充
对图像进行旋转缩放,就是对数组进行操作,乘以对应的矩阵,进行空间变换,而矩阵的行列式的值,就是缩放的倍数。插值是通过变化后图像的像素点的坐标,通过缩放倍数,找到原图对应的像素点坐标,通过权重得到新的像素值。小数的坐标对应原图周围四个像素点,对两个方向分别根据距离加权求和,之后再对的到的两个值进行加权
AI/机器学习(计算机视觉/NLP)方向面试复习3
这种方法能够显著减少模型的参数数量。
Python计算机视觉编程 第四章
OpenGL 使用 4×4 的矩阵来表示变换,照相机与场景的变换分成了两个矩阵,GL_PROJECTION 矩阵和GL_MODELVIEW 矩阵。由于我们需要限制旋转矩阵 R 为正定的(否则,旋转坐标轴即可),所以如果需要,我们可以在求解到的结果中加入变换T来改变符号。如果图像中包含平面状的标记物体
【计算机方向】SCI三区,国人发文量友好,还是非OA,千万别错过!
计算机科学、运动医学、农业、生物化学、分子和细胞生物学、生物信息学和计算生物学、商业与管理、癌症研究、心脏病学和心血管内科、化学工程、临床研究。总体来说,此期刊为SCI三区,IF:4.5,自引率极低,根据网友经验来看,4.3个月左右录用,有该领域的作者可以投稿试试哦~~~2021-2022年367篇
OpenCV||超详细的形态学应用
数学上的形态学,特别是数学形态学(Mathematical morphology),是一门建立在格论和拓扑学基础之上的图像分析学科,它是数学形态学图像处理的基本理论。数学形态学具有坚实的理论基础和广泛的应用价值,其基本思想和方法对图像处理的理论和技术产生了重大影响。数学形态学是法国和德国的科学家在研
本地部署:Real-ESRGAN: 高效的图像超分辨率解决方案
Real-ESRGAN 作为一种先进的图像超分辨率技术,凭借其高效的多尺度特征提取和生成对抗训练,在处理真实世界图像时表现出色。特别是在处理真实世界图像时,Real-ESRGAN 展现出了卓越的性能,生成的高分辨率图像细节丰富、视觉效果逼真。损失函数(Loss Function):Real-ESRG
在 AutoDL 平台配置 U-Mamba 环境并训练医学图像分割
最近,处理长序列任务的 Mamba 模型较为火爆。U-Mamba 的作者设计了一个混合的 CNN-SSM(卷积神经网络 - 状态空间序列模型)块,它结合了 CNN 的局部特征提取能力以及 SSM 捕捉长距离依赖的能力,还充分利用了 UNet 的 U 型结构的优势,从而提出了 U-Mamba 网络。通
【环境搭建】使用openSfM+MVSNet重建稠密点云
本帖详细介绍了如何使用openSfM+MVSNet对真实采集的数据进行稀疏重建与稠密重建,并针对一些真实场景下可能遇到的问题进行了整理。
使用一个可变形的二维模型来检测图像中的特定物体
这个脚本展示了如何使用HALCON软件进行图像处理和模式识别,特别是在工业自动化和质量控制领域中检测特定物体的应用。通过创建可变形模型,可以适应物体的不同姿态和形状变化。
2025计算机视觉领域顶会新方向!
作为计算机视觉领域的顶级学术会议CVPR,每年评选出的一篇或多篇最佳论文,不仅为计算机视觉领域的顶级学术荣誉,更代表了将对未来技术或行业发展产生重要影响的里程碑式研究成果。今年的CVPR最佳论文近乎“万里挑一”。CVPR 2024 今年一有效投稿 11532 篇,接收 2719篇。根据最新公示的组委
嵌入式人工智能(OpenCV-基于树莓派的人脸识别与入侵检测)
Mediapipe 由 Google Research 于 2020 年推出,旨在为计算机视觉研究人员和开发者提供一个易于使用、高性能的框架。Mediapipe 提供了多种预训练模型和算法,涵盖了人脸检测、手势识别、姿态估计等领域。
图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像
今天要聊到的这篇论文更全面地探究了扩散模型在下游任务如分类的贡献程度,作者在imageNet数据集上应用了4种不同的数据增强方法,一种为从Laion-5b数据集中直接图像检索得到同类别的图片,其余三种为基于扩散模型的数据增强方法,分别在这些增强后的训练集上训练ResNet50,并比较这四种数据增强方
面壁的智能开源 MiniCPM-V 2.6 边缘人工智能多模态功能与 GPT-4V 不相上下
机型特点: MiniCPM-V2.6 在边缘单图像、多图像、视频理解等核心能力上实现了全面超越,并首次将实时视频理解和多图像联合理解功能引入边缘,更加贴近复杂的真实场景。效率和性能: 该模型占地面积小,却拥有极高的像素密度(令牌密度),是 GPT-4o 单令牌编码像素密度的两倍,在边缘设备上实现了极