GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片 演讲幻灯片 活动相册 活动相册
筛选
边缘 Agentic AI

Vulkan for Edge AI: Expanding the Hardware Frontier with llama.cpp

日期 5月6日 时间 11:35 - 12:00 地点 Central Room
边缘端的智能体AI需要可访问的低延迟推理,但硬件碎片化限制了部署。虽然CUDA在加速领域占主导地位,但其厂商锁定制约了本地智能的发展。本次演讲探讨了Vulkan作为厂商中立替代方案的价值,展示了它如何在llama.cpp中扩展兼容性并降低了跨Intel、AMD和NVIDIA GPU的部署复杂度。

然而,Vulkan并非万能方案。我将概述工程上的障碍,从驱动不一致到计算限制。展望未来,我们将探索VK_NV_cooperative_matrix2作为将硬件特定优化卸载到驱动程序的蓝图。这使得通过厂商优化实现峰值性能成为可能,同时通过通用着色器回退提供广泛支持,从而统一边缘AI生态系统。