GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片
活动相册
活动已结束
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
上一个
Power Every Smart Device with Intelligence
所有日程
下一个
Vulkan for Edge AI: Expanding the Hardware Frontier with llama.cpp
边缘 Agentic AI
OminiX: Fully Automated Native C++ Deployment for Diverse Large-Scale Learning Models
日期
5月6日
时间
11:10 - 11:35
地点
Central Room
在原生C++中运行深度学习推理可实现高效的边缘部署,消除对Python/PyTorch的依赖,并支持快速、精确的量化。然而,将PyTorch模型转换为原生C++需要数周的高强度开发工作,且目前只有少数LLM被手动移植。我们提出了OminiX cpp,这是一个自动化流水线,利用具有结构化过程技能的AI智能体将任意PyTorch模型转换为针对GGML运行时优化的C++推理代码。OminiX cpp的通用性超越了LLM,支持多种模型类型,包括图像和视频生成、语音识别、文本转语音模型、世界模型以及视觉-语言-动作(VLA)模型。作为案例研究,我们展示了在OpenVLA(一个70亿参数的VLA模型)上的结果,实现了近乎无损的任务成功率、高达63%的内存减少以及高达1.52倍的加速。
演讲嘉宾
Yanzhi Wang
Professor, Northeastern University