从头开始进行CUDA编程:流和事件
为了提高我们的并行处理能力,本文介绍CUDA事件和如何使用它们
从头开始进行CUDA编程:线程间协作的常见技术
在本篇文章我们将介绍一些允许线程在计算中协作的常见技术。
NVIDIA VPI架构解析
VPI 是一个软件库,提供了一系列计算机视觉和图像处理算法,可以在各种硬件加速器中无缝执行。这些加速器称为后端。VPI 的目标是为计算后端提供统一的接口,同时保持高性能。它通过暴露底层硬件及其操作的数据的薄而有效的软件抽象来实现这一点。此图说明了 VPI 的体系结构:API 遵循在初始化阶段进行对象
比较CPU和GPU中的矩阵计算
GPU 计算与 CPU 相比能够快多少?在本文中,我将使用 Python 和 PyTorch 线性变换函数对其进行测试。
【31】GPU(下):为什么深度学习需要使用GPU?
GPU发展历史:1.加速卡(顶点处理仍在CPU完成,图像渲染受制于CPU的性能);2.带有顶点处理功能的显卡:NVidia推出GeForce 256 显卡;3.可编程管线(Programable Function Pipeline)的引入:2001年的Direct3D 8.0【微软第一次引入】;4.
- 1
- 2