计算机视觉 - overfit.cn

人工智能在计算机视觉与图像处理中的应用

1.背景介绍人工智能在计算机视觉与图像处理中的应用1. 背景介绍计算机视觉是一种通过计算机程序对图像进行处理和理解的技术。图像处理是计算机视觉的一个重要组成部分，涉及到图像的存储、传输、处理和显示等方面。随着计算机技术的不断发展，计算机视觉和图像处理技术的应用也越来越广泛。人工智能(AI)是一种通过

overfit同步小助手 2024-07-24 20:01:34 0 收藏

基于图扑 HT for Web 实现拓扑关系图

拓扑结构在计算机网络设计和通信领域中非常重要，因为它描述了网络中的设备（即“点”）如何相互连接（即通过“线”）。这种结构不仅涉及物理布局，即物理拓扑，还可以涉及逻辑或虚拟的连接方式，即逻辑拓扑。

overfit同步小助手 2024-07-24 12:03:08 0 收藏

盘点国内外免费AI视频工具，助你先人一步拥抱AI

自2022年底ChatGPT横空出世，AIGC（人工智能生成内容）的革新浪潮席卷而来。从最初的文本生成模型，到如今涵盖文本、语音、图像、音乐、视频等多模态大模型的百花齐放，AIGC正在以惊人的速度重塑着内容创作的格局。面对这股势不可挡的潮流，我们唯有积极拥抱AI，将其融入到工作与生活中，才能在未来占

overfit同步小助手 2024-07-19 09:01:48 0 收藏

【视觉传感器系列1】—— 如何在ubuntu中安装USB相机ros驱动并获取usb摄像头数据

在VMware虚拟机中安装USB相机的驱动并读取USB相机的图像数据

overfit同步小助手 2024-07-16 20:06:38 0 收藏

【人工智能学习之图像操作（四）】

非极大值抑制是一种边缘稀疏技术，非极大值抑制的作用在于“瘦”边。对图像进行梯度计算后，仅仅基于梯度值提取的边缘仍然很模糊。函数 cv2.isContourConvex() 可以可以用来检测一个曲线是不是凸的。函数 cv2.convexHull() 可以用来检测一个曲线是否具有凸性缺陷，并能纠正缺陷。

overfit同步小助手 2024-07-15 22:01:34 0 收藏

ai写的论文能被查出来吗？怎么利用ai写文章

AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，重复率超过10%包退费。尽管AI技术在写作领域取得了显著的进步，但目前的AI写作工具在生成文本时仍存在一些特定的痕迹和模式，这些可以被专门的检测工具

overfit同步小助手 2024-07-15 07:01:12 0 收藏

如何在智能交通系统中使用物联网技术提高道路安全和效率

通过这些方法，物联网技术在智能交通系统中发挥着至关重要的作用，不仅能够提高道路安全性，还能提升交通效率，减少拥堵，为驾驶者提供更加舒适、便捷的出行体验。2. 智能信号管理系统：利用物联网技术，智能交通信号管理系统可以实时收集交通流量数据，动态调整信号灯的时序，以适应交通流的变化，减少等待时间和提高路

overfit同步小助手 2024-07-14 03:07:12 0 收藏

引领未来：在【PyCharm】中利用【机器学习】与【支持向量机】实现高效【图像识别】

支持向量机（SVM）进行图像识别的完整过程，包括从获取并可视化MNIST数据集、进行数据标准化、划分训练和测试集、通过网格搜索优化SVM模型、评估模型性能到预测新图像的各个步骤，并在代码中添加了调试输出和计时器以便更好地跟踪和优化整个过程。

overfit同步小助手 2024-07-13 08:04:52 0 收藏

AI智能视觉监控平台开源了——助力企业智慧化升级！

AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作，就可以实现全视频的接入及布控。

overfit同步小助手 2024-07-10 21:01:37 0 收藏

AI自动生成角色和情节连续的漫画,中山大学&联想提出AutoStudio，可以多轮交互式连续生成并保持主题一致性。

由于尖端的文本转图像 (T2I) 生成模型已经擅长生成出色的单幅图像，因此一项更具挑战性的任务，即多轮交互式图像生成，开始引起相关研究界的关注。此任务要求模型与用户进行多轮交互以生成连贯的图像序列。但是，由于用户可能频繁切换主题，因此当前的努力很难在生成多样化图像的同时保持主题一致性。为了解决这个问

overfit同步小助手 2024-07-09 12:01:11 0 收藏

【语义分割】12个主流算法架构介绍、数据集推荐、总结、挑战和未来发展

回顾近10年来经典的语义分割模型，无论是基于CNN的架构还是基于Transformer的架构，最核心的理念是“编码-解码”。直观上来讲，就是通过下采样获取特征的潜在表示，再通过上采样从抽象的底层特征表示中恢复目标的细节信息。从交通、医学、遥感、自动驾驶、智能施工管控等领域近些年发表的关于语义分割的论

overfit同步小助手 2024-07-09 03:02:12 0 收藏

Luma Dream Machine：AI 视频生成

Dream Machine是Luma AI开发的AI视频生成模型，能够快速将文本和图像转换为高质量、逼真的视频，适用于创意视频制作、故事讲述、市场营销及教育培训等场景，提供多样化的摄像机运动选项，帮助用户实现快速、高效的视频创作。

overfit同步小助手 2024-07-07 10:01:07 0 收藏

stable diffusion无限贴近真人的调教方法，助力AI变现（下）

做漫画效果时，看用户想要哪种效果：1、完全根据原图画面来出，则直接使用 linear 线稿进行控制即可，现在大部分产品的人转漫画，就是这个方式。2、想用一张真人图参考，最大还原发型，随意变换姿势，可使用 controlnet 的 IP Adapter 模型。但这个方法比较适用于人转漫，如果想出比较写

overfit同步小助手 2024-07-06 09:01:43 0 收藏

【机器学习】GANs网络在图像和视频技术中的应用前景

生成对抗网络（Generative Adversarial Networks, GANs）由Ian Goodfellow等人于2014年提出，迅速成为机器学习领域的一项革命性技术。GANs通过一个生成器（Generator）和一个判别器（Discriminator）之间的对抗性训练，实现了数据生成的

overfit同步小助手 2024-07-05 11:01:35 0 收藏

地平线旭日X3开发板基于MIPI Camera的目标检测 web 端展示调试记录

终于将MIPI Camera在web端显示出来了，其实很简单的事情，但是因为一个网络的问题，自己研究了好几天，查遍了论坛所有帖子，最后还是在地平线专家们的指导下，发现问题所在。言归正传，将自己的过程记录下来。想要在web端显示，需要以下准备工作。

overfit同步小助手 2024-07-03 05:02:38 0 收藏

LLaVA-1.6：多模态AI新标准，中文零样本能力与低成本训练革命，性能全面超越Gemini Pro

在与前一版本LLaVA-1.5相比，LLaVA-1.6不仅在视觉细节捕捉、OCR能力和视觉对话方面取得了显著进步，还在多项国际评测中表现优异，全面超越了Gemini Pro等商业模型。特别值得一提的是，LLaVA-1.6展现了出色的中文零样本能力，即使用仅考虑英文多模态数据的模型，在中文多模态场景下

overfit同步小助手 2024-06-27 14:01:34 0 收藏

大模型培训 AUTOWEBGLM：自动网页导航智能体

大语言模型（LLMs）在智能代理任务中发挥着重要作用，尤其是在网络导航方面。然而，现有的代理在真实世界的网页上表现不佳，主要原因网络导航代理面临着三大挑战：网页上行动的多样性、HTML文本的处理限制以及开放领域决策的复杂性。为了克服这些挑战，AUTOWEBGLM采用了基于ChatGLM3-6B模型的

overfit同步小助手 2024-06-26 07:03:12 0 收藏

2024年6月计算机视觉论文推荐：扩散模型、视觉语言模型、视频生成等

6月还有一周就要结束了，我们今天来总结2024年6月上半月发表的最重要的论文，重点介绍了计算机视觉领域的最新研究和进展。

Deephub 2024-06-23 10:53:50 0 收藏

使用粒子滤波（particle filter）进行视频目标跟踪

粒子滤波是一种贝叶斯滤波方法，主要用于非线性、非高斯动态系统中的状态估计。它通过使用一组随机样本（称为粒子）来表示状态的后验概率分布，并通过这些粒子的加权平均来估计状态。

Deephub 2024-06-22 10:54:03 0 收藏

OpenCV--Mat属性和深浅拷贝

【代码】OpenCV--Mat属性和深浅拷贝。

overfit同步小助手 2024-06-21 01:06:48 0 收藏