0


【AI】AI入门之Nvidia Jetson平台(一)- Jetson平台介绍

一. Jetson概述

NVIDIA® Jetson™ 是世界领先的平台,适用于自主机器和其他嵌入式应用进行边缘计算部署。例如自主机器人,便携式医疗设备等。

Jetson平台被广泛应用于,智能工业,零售,医疗等行业。

  Grundium数字切片扫描仪                                                    Ouva医患行为监控

NVIDIA® Jetson™ 平台包括 Jetson 模组(外形小巧的高性能计算机)、用于加速软件的 NVIDIA JetPack™ SDK,以及包含传感器、SDK、服务和产品的生态系统,从而加快开发速度。

Jetson平台具有体积小,功耗低,软硬件均可裁剪,可定制化程度高,系统开源等优势。

二. Jetson系列

2.1 产品图谱

Jetson系列模组尺寸小巧,但能提供强大AI算力,尺寸在100mm以内,AI算力最高可达几百TOPS,其中Xavier NX为70mm x 45mm,AI算力为21TOPS。

注:TOPS:万亿次/秒, GOPS:亿次/秒

2.2 参数对比

2.3 Xavier NX模组

后续采用的开发板是基于Xavier NX模组,所以这里着重介绍下NX模组的参数。

Xavier NX模组拥有384个CUDA cores,48个Tensor Cores,6个基于Arm-V8架构的核心,最高16GB的DDR4,支持音视频硬件解码和编码,还有丰富的外设接口,如USB,Ethernet,UART,IIC,CAN,GPIO等。

三. NVIDIA GPU

Jetson模组内部集成用于AI算法GPU,是整个模组的关键,也是英伟达的看家本领,这里介绍下其GPU。

3.1 架构演变

英伟达GPU架构历经多次演变,从2008年的Tesla架构到2020年的Ampere架构。

2017年发布的Volta架构完全以深度学习为核心,并引入了Tensor Core进行矩阵乘法运算。

3.2 Volta GPU

Xavier NX模组采用的是适用于深度学习的 Volta架构GPU,所以这里着重讲一下。

1.Cuda Core

GPU内部的运算单元,可提供INT和Float类型的运算。

Volta架构中Cuda Core拆分为1个FP32 Core+1个INT32 Core,可以同时执行FP32和INT32的操作。
  1. Tensor Core

    专门针对Deep Learning应用而设计的计算单元,实际上是一种矩阵乘累加的计算单元。矩阵乘累加计算在Deep Learning网络层算法中,比如卷积层、全连接层等是最重要、最耗时的一部分。

四. Xavier NX开发套件

后续的环境搭建,以及AI应用的部署,都在此开发套件进行

Xavier NX开发套件拥有DP和HDMI接口可连接显示器,两个CSI接口用于摄像头,M.2接口扩展固态硬盘,4个USB3.1口,一路以太网口,还引出了40PIN IO口按需使用。 开发套件支持Jetpack开发包,可搭载Ubunt20.04系统,支持主流深度学习框架,TensorFlow,PyTorch,Caffe等。

从下一篇开始,开始写在Xavier NX开发套件进行环境搭建,和应用部署


本文转载自: https://blog.csdn.net/qq_37755518/article/details/130286439
版权归原作者 有意思科技 所有, 如有侵权,请联系我们删除。

“【AI】AI入门之Nvidia Jetson平台(一)- Jetson平台介绍”的评论:

还没有评论