基于PyTorch+LSTM的交通客流预测(时间序列分析)
将深度学习与交通客流时间分布特征相结合,能够有效地揭示轨道交通客流量的变化趋势。本文将使用LSTM进行较为客观的客流量预测数据统计,并通过深度学习将预测结果应用于实践之中对轨道交通发车频次进行合理优化。
新出炉!谷歌AI #DreamFusion 从文本生成3D模型
文本生成图像已有了大量模型工具,文本生成3D模型的工具到是很少见。#我记得有一期推文介绍了文本生成数字人模型吧,现在有能生成通用3D模型的工具了?近期谷歌AI 发布了文本生成3D模型— Dreamfusion#赶紧去体验下有多神奇~DreamFusionDreamfusion是Google 的大型A
机器学习中的数学——距离定义(二):曼哈顿距离(Manhattan Distance)
曼哈顿距离是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和。下图中红线代表曼哈顿距离,绿色代表欧氏距离,也就是直线距离,而蓝色和黄色代表等价的曼哈顿距离。曼哈顿距离在2维平面是两点在纵轴上的距离加上在横轴上的距离,即:d(x,y)=∣x1−y1∣+∣x2−y2∣d(x,
多模态论文串讲笔记
多模态论文串讲笔记
YOLO Air一款面向科研小白的YOLO项目 | 包含大量改进方式教程
YOLO Air一款面向科研的YOLO项目
毕业设计-基于机器视觉人脸识别技术课堂签到系统的设计与实现-OpenCV
毕业设计-基于机器视觉人脸识别技术课堂签到系统的设计与实现-OpenCV:人工智能理论的深入研究和优秀的深度学习算法的相继出现,我国开始着重于对大数据、深度学习的研究,这极大推动了计算机视觉技术的发展。人脸识别是机器视觉领域的主要研究对象之一,人脸识别验证速度快、识别准确率高、用户体验良好的特点,而
Windows下Pytorch3d的安装方法
Pytorch3d在WIN下的安装
ACmix:卷积与self-Attention的融合
ACmix是一种高效的卷积自注意力融合方法,集中了两种结构的优势,同时又能在计算开销上保持在能接受的范围。
图像超分——Real-ESRGAN快速上手
首先声明,图像超分不是我的主要研究方向,下面我就以一个“外行人”的视角简单理解一下Real-ESRGAN这个算法的原理。如果读者对理论不感兴趣,可以跳到下一节的实践部分。
【综述】分子表示与性质预测中的深度学习方法
Drug Discovery Today、分子性质预测综述
Pyqt搭建YOLOv5目标检测系统(可视化界面+功能介绍+源代码)
系统支持输入图片、视频、摄像头和RTSP视频流的目标检测,其中,可以对图片进行处理,包括灰度化、平滑处理、均衡化、形态学、图像梯度、阈值处理、边缘检测、轮廓检测、直线检测、亮度调节和伽玛校正。
DarkNet网络结构
如下图所示,残差块结构由两条支路组成,一条支路将上一层输出的feature map进行卷积等操作,另一条支路将上一层输出的feature map。而更基本的结构就是残差块了,因此我们先构建出残差块,然后重复堆叠上述结构darknet53就完成了。残差)(下采+4*残差),所以待会儿会出现一个储存残差
深度学习论文精读[6]:UNet++
UNet的编解码结构一经提出以来,大有统一深度学习图像分割之势,后续基于UNet的改进方案也经久不衰,一些研究者也在从网络结构本身来思考UNet的有效性。比如说编解码网络应该取几层,跳跃连接是否能够有更多的变化以及什么样的结构训练起来更加有效等问题。UNet本身是针对医学图像分割任务而提出来的网络结
EIoU和Focal-EIoU Loss
CIoU Loss虽然考虑了边界框回归的重叠面积、中心点距离、高宽比。但是其公式中的v反映的是高宽的差异,而不是高宽分别与其置信度的真实差异。因此,有时会阻碍模型有效的优化相似性。针对这一问题,本文在CIoU的基础上将高宽比拆开,提出了EIoU Loss,并且引入了Focal Loss聚焦优质的锚框
10.7. Transformer
transformer的编码器和解码器是基于自注意力的模块叠加而成的,源(输入)序列和目标(输出)序列的嵌入(embedding)表示将加上位置编码(positional encoding),再分别输入到编码器和解码器中。值得注意的是,解码器的自注意力权重和“编码器-解码器”的注意力权重都有相同的查
如何使用GPT2中文闲聊对话系统,机器人对话,自动对话!
每一次运行完一个epoch都会保存到model下面,在预测的时候直接调用model下面最后一个epoch就行,有问题可以发评论,我看见且我看得懂的话就会,哈哈哈httpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttpshttps
【注意力机制集锦】Channel Attention通道注意力网络结构、源码解读系列一
本文从原文、网络结构、代码实现三个方面系统总结了SENet、SKNET、CBAM三种注意力机制
关于YOLOv7的分析
此篇文章是在7月初编写,可能会与现有的源码有所出入,如在月末增加了关于head部分阴性参数的融合,但总体上的出入并不会太大
VoxCeleb1 数据集下载
VoxCeleb1 是广泛使用的 说话人识别、验证 数据集。由于是从 YouTube 视频中提取,有比较丰富的噪声。(有空补介绍)如果可以使用谷歌表单和翻译软件应该就可以顺利下载,私下分发数据集有侵权风险。官网如下:VoxCelebhttps://www.robots.ox.ac.uk/~vgg/d
YOLOv5-Shufflenetv2
YOLOV5-Shufflenetv2