人工智能计算机视觉

简单粗暴提升yolov5小目标检测能力

和yolov5最开始做的focus是类似的，对于输入的特征图（长宽为S），从左到右以及从上到下每scale个像素采样一次，假设scale=2，采样方式就和上图一样，经过这样采样的输出长宽就是S/2，最后将采样后的输出进行concatenate，通道数就是scale的平方，即4。左侧是yolov5原始

overfit同步小助手 2023-03-30 22:01:45 0 收藏

Bilateral Filters（双边滤波算法）的超简单原理，学不会你打我。

摘要：双边滤波(Bilateral Filters)是非常常用的一种滤波，它可以达到保持边缘、降噪平滑的效果。和其他滤波原理一样，双边滤波也是采用加权平均的方法，用周边像素亮度值的加权平均代表某个像素的强度，所用的加权平均基于高斯分布。最重要的是，双边滤波的权重不仅考虑了像素的欧氏距离（如普通的高斯

overfit同步小助手 2023-03-30 22:01:38 0 收藏

slowfast代码实现和论文理解

1、摘要本文提出了用于视频识别的SlowFast网络。我们的模型包括：（1）一条slow pathway，以低帧速率运行，以捕获空间语义；（2）一条fast pathway，以高帧速率运行，以精细的时间分辨率捕获运动。fast pathway可以通过减少通道容量而变得非常轻量，但可以学习有用的时间信

overfit同步小助手 2023-03-30 21:01:58 0 收藏

AI实现艺术品自动生成？太牛了

什么是AI艺术家?本文介绍了AI艺术家的基本原理以及使用流程,为艺术创作带来新的概念,希望能得到大家的鼓励支持!

overfit同步小助手 2023-03-30 21:01:30 0 收藏

CLIP论文详解

CLIP算是在跨模态训练无监督中的开创性工作，作者在开头梳理了现在vision上的训练方式，从有监督的训练，到弱监督训练，再到最终的无监督训练。这样训练的好处在于可以避免的有监督的 categorical label的限制，具有zero-shot性质，极大的提升了模型的实用性能。这篇文章中作者提到早

overfit同步小助手 2023-03-30 20:02:20 0 收藏

经典神经网络论文超详细解读（一）——AlexNet学习笔记（翻译＋精读）

AlexNet（ImageNet Classification with Deep Convolutional Neural Networks）论文超详细解读。翻译＋总结

overfit同步小助手 2023-03-30 20:02:11 0 收藏

目标检测: 一文读懂 YOLOX

论文：YOLOX: Exceeding YOLO Series in 2021论文链接：https://arxiv.org/pdf/2107.08430.pdf代码链接：https://github.com/Megvii-BaseDetection/YOLOX.文章目录1 为什么提出YOLOX2 Y

overfit同步小助手 2023-03-30 19:01:52 0 收藏

【图像处理】图像离散小波变换（Discrete Wavelet Transform）及python代码实现

Motivation看到有论文用到了图像的Haar Discrete Wavelet Transform（HDWT），前面也听老师提到过用小波变换做去噪、超分的文章，于是借着这个机会好好学习一下。直观理解参考知乎上的这篇文章：https://zhuanlan.zhihu.com/p/22450818

overfit同步小助手 2023-03-30 19:01:45 0 收藏

【ROS2&AI】电脑摄像头、intel-D435，利用ros2发布订阅图像(Python)

配置：Python、ROS2、opencv、Ubuntu。利用电脑相机或D435相机联合ROS2进行图像的发布与订阅。与传统的传输列表、字符串msg不同（定义消息类型直接发送即可），利用ros2传输图像需要把图像frame转为image类型的msg。流程如下：opencv或者realsense获取得

overfit同步小助手 2023-03-30 17:02:31 0 收藏

图像风格迁移

风格迁移指的是两个不同域中图像的转换，具体来说就是提供一张风格图像，将任意一张图像转化为这个风格，并尽可能保留原图像的内容

overfit同步小助手 2023-03-30 16:01:58 0 收藏

Attention UNet

Attention UNet论文解析 - 知乎Attention UNet论文地址： https://arxiv.org/pdf/1804.03999.pdf 代码地址： https://github.com/ozan-oktay/Attention-Gated-NetworksAttention

overfit同步小助手 2023-03-30 15:02:17 0 收藏

优化GPU显存不足，提高GPU利用率

1 常用GPU显存不足时的各种Trick1)监控GPU2）估计模型显存3）显存不足时的Trick4）提高GPU内存利用率2 数据处理及算法角度改善（以医学图像分割算法为例）1 常用GPU显存不足时的各种Trick1)监控GPU 监控GPU最常用的当然是nvidia-smi，但有一个工具能够更好的

overfit同步小助手 2023-03-30 13:01:53 0 收藏

D435i相机的标定及VINS-Fusion config文件修改

overfit同步小助手 2023-03-30 13:01:42 0 收藏

用YOLOv8推荐的Roboflow工具来训练自己的数据集

总而言之，Roboflow是一种非常有用的工具，它提供了一种简单的方式来调整训练数据，使其能够更好地适应YOLOv8的要求，帮助我们更轻松地准备YOLO v8所需的训练数据。用验证后的训练集模型预测新数据，需要先收集和我们的数据集相关的同类型图片，做成新的文件夹，图片大小和格式保持与之前的数据集图片

overfit同步小助手 2023-03-30 12:02:17 0 收藏

Python 人脸识别系统

简介人脸识别不同于人脸检测。在人脸检测中，我们只检测了人脸的位置，在人脸识别任务中，我们识别了人的身份。本文重点介绍使用库 face_recognition 实现人脸识别，该库基于深度学习技术，并承诺使用单个训练图像的准确率超过 96%。识别系统用例寻找失踪者识别社交媒体上的帐户识别汽车中的驾驶员考

overfit同步小助手 2023-03-30 12:02:11 0 收藏

图像超分综述:超长文一网打尽图像超分的前世今生 (附核心代码)

图像超分的目的是提高图像的分辨率，同时丰富图像的纹理细节。本文总结整理在图像超分领域经典算法的创新点以及意义，同时指出当下图像超分的困境和未来，欢迎大家前来阅读收藏。本文全部观点受个人能力水平限制如有偏差还请指正。...

overfit同步小助手 2023-03-30 11:02:10 0 收藏

【已解决】安装cv2时Building wheel for opencv-python终端卡死

本文探究安装cv2时Building wheel for opencv-python终端卡死的原因并予以解决

overfit同步小助手 2023-03-30 11:01:43 0 收藏

【达摩院OpenVI】AIGC技术在图像超分上的创新应用

随着扩散模型DiffusionModel在理论和实践中的有效性得到越来越多的验证，在大数据、大模型的加持下，多模态学习发展如火如荼，促成了当今AIGC的火爆。同时以此为基础的视觉增强底层任务，也带来了一些突破性成果。今天重点给大家展示下，扩散模型在图像超分辨率这方面的新的应用，展现出其超过GAN的生

overfit同步小助手 2023-03-30 10:02:02 0 收藏

KITTI数据集详解

三维目标检测常用的数据集——KITTI数据集的详解，包括文件目录、文件格式说明、文件使用说明。

overfit同步小助手 2023-03-30 10:01:41 0 收藏

顶会查找论文的网址和检索方法

顶会的论文集：https://openaccess.thecvf.com/menu。dblp.org官网下载会议中的论文： https://dblp.org/论文下载网址：https://arxiv.org/指定论文来自哪个会议。

overfit同步小助手 2023-03-30 09:02:29 0 收藏