Triton大会@硅谷：芯片、AI大厂齐站台

9月 17 日，一年一度的 Triton 大会在硅谷举办。智源研究院联合多个团队，基于 Triton 打造面向多元异构 AI 芯片的统一、开源算子库和社区生态，成为 Triton 生态系统中不可或缺的一部分。今年，我们亲临现场，第一时间为您带来大会的精彩内容。智源研究院牵头打造的基于 Triton 的开源算子库 FlagGems/FlagAttention 将在明天开始的 9 月 18 日-19 日的 Pytorch 大会亮相。

今年的 Triton 大会再次在 PyTorch 大会的前夕举行，这一安排凸显了 Triton 与 PyTorch 紧密的合作关系。由 Meta 主办的 Triton 大会，不仅未收取参会费用，也未接受任何厂商赞助，展现了其开放和包容的姿态。大会吸引了逾 300 名专业人士参加，包括来自美国各大芯片制造商的代表，无论是业界巨头还是新兴企业；同时，也包括了 Meta、微软、Google 等 AI 领域的领军企业，以及众多专注于编译器工具链的创新型初创公司。此外，来自湾区各高校的教师和学生也积极参与，特别是斯坦福大学的师生，他们的出席尤为引人注目。

大会亮点

Triton：全球认可的 CUDA 替代方案

Triton 成为全球公认的 CUDA 平替 —— 在智源与国内外众多厂商共同推动统一、开源 AI 芯片软件生态的过程中，Triton 展现出成为 CUDA 替代方案的巨大潜力。此次大会，包括 Nvidia、AMD、Intel、Qualcomm 在内的各大芯片厂商，以及Google、微软、OpenAI、AWS 和 Meta 等 AI 领域的领军企业，均将 Triton 视为构建开放 AI 软件栈的关键技术，尤其是 Meta 都把 Triton 作为打造开放 AI 软件栈的必需品。Nvidia 和 Meta 的积极参与，进一步坚定了我们对 Triton 的信心。

Triton 社区生态的蓬勃发展

Triton 的社区生态建设呈现出一种独特的活力，核心团队虽不张扬，但众多芯片厂商和用户厂商表现出极高的热情和积极性，Triton 社区有种被大家推着往前走的“幸福”感。这种由社区推动的发展态势，也从侧面反映了工业界对 Triton 的高度认可。整个大会下来，几乎忘了 OpenAI 是主导者。

Triton 的性能与易用性

与会者普遍反馈 Triton 在性能上表现优异，且易于上手。在跨平台原型开发中，Triton 能快速展现出性能效果。然而，在大规模、高质量要求的产品部署场景中，Triton 仍需进一步提升。

Triton 的未来方向

Triton 的下一步重点是加强对非 GPU 架构硬件的支持，统一高层次硬件架构的抽象设计，并加强对多后端的软件架构支持。

重要内容记录

以下是对这次 Triton 大会一些重要内容的记录。

Triton profile 工具 Proton

大会首日的两个 Tutorial 环节中。其中一个比较重要的是 Triton 的 profiler 工具 —— Proton。介绍这个工作的是来自Open AI 和 George Mason University 的华人 Keren Zhou。OpenAI 和 Meta 都一表达了 Proton 这个工具项目的重要性。

Proton 跟现有在 NVIDIA 上面的另外两个 profile 工具的比较展现出显著优势。