AlexNet论文解读与代码实现

1. 论文解读1.1 泛读1.1.1 标题与作者1.1.2 摘要1.1.3 结论(讨论)1.1.4 重要图1.1.5 重要表1.2 精读1.2.1 文章精解1.2.1.1 ReLU1.2.1.2 Local Response Normalization(局部响应归一化)1.2.1.3 降低过拟合1.

条件随机场(CRF)的详细解释

条件随机场(CRF)结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,其中相邻的上下文信息或状态会影响当前预测,常用于标注或分析序列资料,如自然语言文字或是生物序列

ViT结构优化——Searching the Search Space (S3 NAS)

Paper地址:https://arxiv.org/abs/2111.14725GitHub链接:https://github.com/microsoft/Cream概述网络结构搜索(NAS: Neural-network Architecture Search)的设计收敛,首先取决于搜索空间的设计

人工智能实践Tensorflow2.0 第五章--1.卷积神经网络基础--八股法搭建卷积神经网络--北京大学慕课

第五章–卷积神经网络基础–八股法搭建卷积神经网络本讲目标:  介绍神经网络基本概念,用八股法实现卷积神经网络(以cifar10为例,本节建立的框架作为后续网络的baseline,在baseline中修改实现其他网络)。参考视频。卷积神经网络基础0.回顾全连接神经网络1.卷积计算过程1.1-卷积概念1

论文解释:SeFa ,在潜在空间中为 GAN 寻找语义向量

SeFa — Closed-Form Factorization of Latent Semantics in GANs

YOLOv4网络结构详解

YOLOv4是2020年Alexey Bochkovskiy等人发表在CVPR上的一篇文章,并不是Darknet的原始作者Joseph Redmon发表的,但这个工作已经被Joseph Redmon大佬认可了。之前我们有聊过YOLOv1~YOLOv3以及Ultralytics版的YOLOv3 SPP

5分钟 NLP :Hugging Face 主要类和函数介绍 🤗

主要包括Pipeline, Datasets, Metrics, and AutoClasses

【宝藏工具系列】神经网络可视化工具集合啦,秒级画出漂亮的神经网络图~

宝藏工具系列,强烈建议收藏备用!!!

手把手写深度学习(10):用Pix2Pix GANs实现sketch-to-image跨模态任务(理论基础)

前言:2017年GANs正如火如荼地发展,有CGANs、DCGANs等前辈珠玉在前,Pix2Pix GANs横空出世,在多种多模态任务上有着亮眼的表现,并且首次把U-net结构带到了深层次生成模型当中,非常有意义。本文用Pix2Pix GANs实现sketch-image这一跨模态任务。encode

论文推荐:ReLICv2 ,新的自监督学习能否在ResNet 上超越监督学习?

自监督 ResNets 能否在 ImageNet 上没有标签的情况下超越监督学习?

动手学深度学习——卷积层

从全连接到卷积1、简单例子:分类猫和狗的图片使用一个还不错的相机采集图片(12M像素)RGB图片有36M元素使用100大小的单隐藏层MLP,模型有3.6B元素,远多于世界上所有猫和狗总数(900M狗,600M猫)2、重新考察全连接层将输入和输出变形为矩阵(宽度,高度);将权重变形为4-D张量(h,w

深度盘点:30个用于深度学习、自然语言处理和计算机视觉的顶级 Python 库

今天我们来盘点一下有哪些用于深度学习、自然语言处理和计算机视觉的顶级Python库。我尽力将每个库按预期的使用情况进行归类,所有包含的库都有对应的Github代码仓库,我还列出每个库的在Github上的收藏(Stars) ,提交(Commits ),贡献者(Contributors)的数据,这在一定

神经网络中的激活函数与损失函数&深入理解推导softmax交叉熵

介绍神经网络中常用的激活函数和损失函数,主要是介绍softmax交叉熵损失函数,并使用计算图手动推导softmax交叉熵反向传播过程。

【论文笔记】道路检测 SNE-RoadSeg

论文标题:SNE-RoadSeg: Incorporating Surface Normal Information into Semantic Segmentation for Accurate Freespace Detection论文地址:https://arxiv.org/abs/2008.

BN-Batch Normalization 算法的学习

文章目录背景前景知识-白化BN算法原理BN算法的优点BN的代码实现学习神经网络的时候,发现了很多的算法在输入层之前加上了Batch Normalization 算法,记录一下自己的学习。背景前景知识-白化BN算法原理BN算法的优点BN的代码实现...

眼见不为“实”,人们更信任人工智能合成的假脸

常言道,耳听为虚,眼见为实。但是现在随着人工智能技术的发展,眼见可不一定为实。而造成这一结果的全都是因为深度伪造技术,简称深伪技术或者深度伪造。是Deep Learing(深度学习)和Fake(伪造)的混成词。一种基于人工智能的人体图像合成技术。而该技术的扩散与发展,引起了人们的担忧。2018年,英

论文推荐:StarCraft II Unplugged 离线强化学习

在本文中,我们将介绍 StarCarft II Unplugged 论文 [1],本论文可以将AlphaStar进行了扩展或者说更好的补充解释,绝对值得详细阅读。

音频数据建模全流程代码示例:通过讲话人的声音进行年龄预测

从EDA、音频预处理到特征工程和数据建模的完整源代码演示

构建可以查找相似图像的图像搜索引擎的深度学习技术详解

在本文中将介绍如何查找相似图像的蛇毒学习理论基础并且使用一个用于查找商标的系统为例介绍相关的技术实现,阅读本文后你将有能够从头开始为创建类似图像的搜索引擎的能力。

TensorFlow2 实现动物识别(90类)MobileNetV2算法(内附源码与数据)

本文已加入 ???? Python AI 计划,从一个Python小白到一个AI大神,你所需要的所有知识都在 这里 了。在之前的文章中我们通过Xception算法模型实现了狗、猫、鸡、马四种的动物的识别(新模型!实现动物识别)。今天我们接着介绍MobileNetV2算法,将数据集扩充到90个类别,即