GPU 英伟达GPU架构回顾
1999 年,英伟达发明了 GPU(graphics processing unit),本节将介绍英伟达 GPU 从 Fermi 到 Blackwell 共 9 代架构,时间跨度从 2010 年至 2024 年,具体包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(
NVIDIA 完全过渡到开源 GPU 内核模块
开源GPU内核模块
英伟达黄仁勋发布GB200,比H100推理能力提高30倍,能耗降低25倍,将AI4S能力做成微服务
史上最大规模 GTC 开幕
混合输入矩阵乘法的性能优化
AI驱动的技术正逐渐融入人们日常生活的各个角落,有望提高人们获取知识的能力,并提升整体生产效率。语言大模型(LLM)正是这些应用的核心。LLM对内存的需求很高,通常需要专用的硬件加速器,以高效地提供数百亿亿次浮点运算(Exaflops级别)的计算能力。本文将展示如何通过更有效地利用内存来解决计算方面
黄仁勋:英伟达预言 2 年内行业将面目全非 一个词形容AI:Unbelievable
黄仁勋:英伟达预言 2 年内行业将面目全非英伟达甚至整个行业将在 2 年内面目全非。60 年来首次看到两项技术转型同时发生:AI 与计算。计算技术每十年进步一百万倍,带来天翻地覆的变化。老黄表示,人工智能是不同于以往任何技术的基础。判断依据,60年来首次看到两项技术转型同时发生:AI与计算此言出自老
英伟达显卡系列与架构、代表产品
这个架构是专为光线追踪和基于 AI 的神经图形设计的 GPU,能够提供高性能的游戏、专业图形、AI 和计算性能。Ampere 架构是 NVIDIA 的第二代深度学习架构,引入了更多的Tensor Cores、第三代NVLink以及改进的Ray Tracing技术。Maxwell 架构进一步提高了功耗
英伟达的AI霸主地位会持久吗?
目前英伟达因其 GPU 芯片在 AI 革命中扮演着核心角色,使其成为AI时代最赚钱的公司。本文作者Pete Warden总结了铸就英伟达 AI 霸主地位的四点优势:几乎无人运行大规模机器学习应用;英伟达的替代品都很糟糕;研究人员掌握着硬件采购的风向舵;训练时延的影响。随着 AI 技术的发展,Pete
GPU架构与计算入门指南
大多数工程师对CPU和顺序编程都十分熟悉,这是因为自从他们开始编写CPU代码以来,就与之密切接触。然而,对于GPU的内部工作原理及其独特之处,他们的了解则相对较少。过去十年,由于GPU在深度学习中得到广泛应用而变得极为重要。因此,每位软件工程师都有必要了解其基本工作原理。本文旨在为读者提供这方面的背