GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片
活动相册
活动已结束
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
上一个
Keynote – Building an Open Agentic Ecosystem
所有日程
下一个
Panel: The Agentic AI Moment — From Models to Intelligent Systems
agentic-ai-summit
GPU 的 Tile 编程
日期
5月5日
时间
10:40 - 11:00
地点
Master Stage
并行编程可能令人望而生畏,但其实不必如此!一种全新的并行编程范式正在兴起,它对新手友好、高效且高性能:基于 Tile 的编程模型。
在这个以示例驱动的演讲中,我们将向您介绍 Python、C++ 和 Rust 中的 Tile 编程。我们将展示 cuTile —— NVIDIA 全新的 Tile 编程栈,以及 Tile IR —— 其底层的编译器栈。您将了解最近发布的 CUDA Tile 新特性,包括多 GPU 通信、与传统 CUDA SIMT 的互操作性,以及对卷积和模板计算等更多类型内核的支持。我们将对比 Tile 编程模型与传统并行编程模型的异同。您将看到来自多个领域的示例,包括 HPC 模板计算、稀疏矩阵向量乘(SPMV)和共轭梯度(CG)求解器,以及来自 TileGym 的 AI 模型。
Tile 编程根植于 HPC 库,如 NWChem 的 TCE、BLIS 和 ATLAS。近年来,这种范式在 GPU 编程中越来越流行,涌现出 Triton、JAX/Pallas 和 Warp 等语言和框架。
在本次演讲中,您将:
- 学习编写 GPU Tile 并行应用的最佳实践
- 深入了解 Tile 代码的性能表现及其实际执行方式
- 学习如何推理和调试 Tile 应用
- 理解 Tile 编程与传统并行编程的区别以及各自的适用场景
- 了解 Tile 编程如何让您的软件在最新硬件趋势下保持可移植性
演讲结束时,您将理解 Tile 编程如何使高性能数据并行应用的开发变得更直观、更可移植、更高效,适用于 HPC、数据科学和机器学习领域。
演讲嘉宾
Bryce Adelstein Lelbach
Principal Engineer, NVIDIA