边缘 Agentic AI

Vulkan for Edge AI: Expanding the Hardware Frontier with llama.cpp

日期 5月6日时间 11:35 - 12:00 地点 Central Room

边缘端的智能体AI需要可访问的低延迟推理，但硬件碎片化限制了部署。虽然CUDA在加速领域占主导地位，但其厂商锁定制约了本地智能的发展。本次演讲探讨了Vulkan作为厂商中立替代方案的价值，展示了它如何在llama.cpp中扩展兼容性并降低了跨Intel、AMD和NVIDIA GPU的部署复杂度。

然而，Vulkan并非万能方案。我将概述工程上的障碍，从驱动不一致到计算限制。展望未来，我们将探索VK_NV_cooperative_matrix2作为将硬件特定优化卸载到驱动程序的蓝图。这使得通过厂商优化实现峰值性能成为可能，同时通过通用着色器回退提供广泛支持，从而统一边缘AI生态系统。

演讲嘉宾

Ruben Ortlam Senior ML Engineer, Red Hat