AI/机器学习(计算机视觉/NLP)方向面试复习3

这种方法能够显著减少模型的参数数量。

Python计算机视觉编程 第四章

OpenGL 使用 4×4 的矩阵来表示变换,照相机与场景的变换分成了两个矩阵,GL_PROJECTION 矩阵和GL_MODELVIEW 矩阵。由于我们需要限制旋转矩阵 R 为正定的(否则,旋转坐标轴即可),所以如果需要,我们可以在求解到的结果中加入变换T来改变符号。如果图像中包含平面状的标记物体

【建议收藏】八大开源计算机视觉项目分享

本文将为您介绍6个计算机视觉相关的开源项目,这些项目非常实用且功能强大,不仅在CV技术方面具有重要意义,而且为计算机视觉应用的发展提供了有力的支持。

【计算机方向】SCI三区,国人发文量友好,还是非OA,千万别错过!

计算机科学、运动医学、农业、生物化学、分子和细胞生物学、生物信息学和计算生物学、商业与管理、癌症研究、心脏病学和心血管内科、化学工程、临床研究。总体来说,此期刊为SCI三区,IF:4.5,自引率极低,根据网友经验来看,4.3个月左右录用,有该领域的作者可以投稿试试哦~~~2021-2022年367篇

EmguCV学习笔记 VB.Net 4.5 像素距离和连通区域

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。教程配套文件及相关说明获得pdf教程和代码。

OpenCV||超详细的形态学应用

数学上的形态学,特别是数学形态学(Mathematical morphology),是一门建立在格论和拓扑学基础之上的图像分析学科,它是数学形态学图像处理的基本理论。数学形态学具有坚实的理论基础和广泛的应用价值,其基本思想和方法对图像处理的理论和技术产生了重大影响。数学形态学是法国和德国的科学家在研

本地部署:Real-ESRGAN: 高效的图像超分辨率解决方案

Real-ESRGAN 作为一种先进的图像超分辨率技术,凭借其高效的多尺度特征提取和生成对抗训练,在处理真实世界图像时表现出色。特别是在处理真实世界图像时,Real-ESRGAN 展现出了卓越的性能,生成的高分辨率图像细节丰富、视觉效果逼真。损失函数(Loss Function):Real-ESRG

在 AutoDL 平台配置 U-Mamba 环境并训练医学图像分割

最近,处理长序列任务的 Mamba 模型较为火爆。U-Mamba 的作者设计了一个混合的 CNN-SSM(卷积神经网络 - 状态空间序列模型)块,它结合了 CNN 的局部特征提取能力以及 SSM 捕捉长距离依赖的能力,还充分利用了 UNet 的 U 型结构的优势,从而提出了 U-Mamba 网络。通

【环境搭建】使用openSfM+MVSNet重建稠密点云

本帖详细介绍了如何使用openSfM+MVSNet对真实采集的数据进行稀疏重建与稠密重建,并针对一些真实场景下可能遇到的问题进行了整理。

YOLOv10有效涨点专栏目录 | 目前已有90+篇内容,内含各种卷积模块,主干网络,注意力机制,损失函数等创新点改进

YOLOv10专栏持续复现网络上各种顶会内容,同时专栏内容可以用于YOLOv8改进~,欢迎大家订阅!!!

使用一个可变形的二维模型来检测图像中的特定物体

这个脚本展示了如何使用HALCON软件进行图像处理和模式识别,特别是在工业自动化和质量控制领域中检测特定物体的应用。通过创建可变形模型,可以适应物体的不同姿态和形状变化。

2025计算机视觉领域顶会新方向!

作为计算机视觉领域的顶级学术会议CVPR,每年评选出的一篇或多篇最佳论文,不仅为计算机视觉领域的顶级学术荣誉,更代表了将对未来技术或行业发展产生重要影响的里程碑式研究成果。今年的CVPR最佳论文近乎“万里挑一”。CVPR 2024 今年一有效投稿 11532 篇,接收 2719篇。根据最新公示的组委

嵌入式人工智能(OpenCV-基于树莓派的人脸识别与入侵检测)

Mediapipe 由 Google Research 于 2020 年推出,旨在为计算机视觉研究人员和开发者提供一个易于使用、高性能的框架。Mediapipe 提供了多种预训练模型和算法,涵盖了人脸检测、手势识别、姿态估计等领域。

云计算遭遇的主要安全威胁

为了应对这些威胁,云服务提供商和用户需要采取全面的安全措施,包括数据加密、访问控制、网络安全、监控审计、备份恢复等。:云资源的配置错误,如公开的存储桶、不安全的访问控制等,可能导致安全漏洞,被攻击者利用进行数据泄露或其他恶意活动。:虚拟机逃逸是指攻击者利用虚拟化软件的漏洞,从一台虚拟机逃逸并访问宿主

图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像

今天要聊到的这篇论文更全面地探究了扩散模型在下游任务如分类的贡献程度,作者在imageNet数据集上应用了4种不同的数据增强方法,一种为从Laion-5b数据集中直接图像检索得到同类别的图片,其余三种为基于扩散模型的数据增强方法,分别在这些增强后的训练集上训练ResNet50,并比较这四种数据增强方

面壁的智能开源 MiniCPM-V 2.6 边缘人工智能多模态功能与 GPT-4V 不相上下

机型特点: MiniCPM-V2.6 在边缘单图像、多图像、视频理解等核心能力上实现了全面超越,并首次将实时视频理解和多图像联合理解功能引入边缘,更加贴近复杂的真实场景。效率和性能: 该模型占地面积小,却拥有极高的像素密度(令牌密度),是 GPT-4o 单令牌编码像素密度的两倍,在边缘设备上实现了极

CVPR 2024最佳论文分享:Mip-Splatting: 无混叠3D高斯溅射

本文介绍了一篇获得CVPR2024最佳论文提名的论文。该论文提出了一种名为Mip-Splatting的无混叠三维高斯溅射方法,结合多级混合技术和2D、3D Mip滤波器,显著减少了混叠伪影。该方法在多尺度数据训练和测试中表现优越,提升了渲染质量和计算效率。

在一系列图像中搜索局部可变形模型

这个脚本的主要功能是创建一个局部可变形模型,并在一系列图像中搜索这个模型,然后显示搜索结果和搜索时间。

【人工智能】Transformers之Pipeline(十):视频分类(video-classification)

本文对transformers之pipeline的视频分类(video-classification)从概述、技术原理、pipeline参数、pipeline实战、模型排名等方面进行介绍,读者可以基于pipeline使用代码极简的代码部署计算机视觉中的视频分类(video-classificatio

开源目标检测数据集汇总

计算机视觉中关于图像识别有四大类任务:分类,定位,检测,分割。分类问题:即图片(或某个区域)中的图像属于哪个类别。定位问题:目标可能出现在图像的任何位置。大小问题:目标有各种不同的大小。形状问题:目标可能有各种不同的形状。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈