GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片
活动相册
活动已结束
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
上一个
OminiX: Fully Automated Native C++ Deployment for Diverse Large-Scale Learning Models
所有日程
下一个
RoboChallenge Annual Report on Large-Scale Real Robot Benchmark
边缘 Agentic AI
Vulkan for Edge AI: Expanding the Hardware Frontier with llama.cpp
日期
5月6日
时间
11:35 - 12:00
地点
Central Room
边缘端的智能体AI需要可访问的低延迟推理,但硬件碎片化限制了部署。虽然CUDA在加速领域占主导地位,但其厂商锁定制约了本地智能的发展。本次演讲探讨了Vulkan作为厂商中立替代方案的价值,展示了它如何在llama.cpp中扩展兼容性并降低了跨Intel、AMD和NVIDIA GPU的部署复杂度。
然而,Vulkan并非万能方案。我将概述工程上的障碍,从驱动不一致到计算限制。展望未来,我们将探索VK_NV_cooperative_matrix2作为将硬件特定优化卸载到驱动程序的蓝图。这使得通过厂商优化实现峰值性能成为可能,同时通过通用着色器回退提供广泛支持,从而统一边缘AI生态系统。
演讲嘉宾
Ruben Ortlam
Senior ML Engineer, Red Hat