GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片 演讲幻灯片 活动相册 活动相册
筛选
vLLM Workshop

构建、测试与贡献vLLM:开发者指南

日期 5月5日 时间 10:25 - 11:05 地点 Founders Cafe
大语言模型(LLM)已经彻底改变了AI格局,而vLLM已成为领先的推理引擎,通过PagedAttention等创新显著加速了LLM服务。但你如何实际地构建、测试和贡献到这个快速发展的项目中呢?

在本次演讲中,我们将带你了解vLLM的架构,并探索使用这个复杂Python/C++代码库的实际方面。我们将从vLLM核心优化(包括PagedAttention)的概述开始,然后深入不同目标的构建过程以及第三方硬件插件,如Google TPU、AWS Neuron、Intel Gaudi等。

你将了解测试策略,例如使用GuideLLM进行性能基准测试和使用lm-evaluation-harness进行模型评估。我们还将涵盖向vLLM社区贡献的最佳实践,以及Red Hat AI Inference Server(RHAIIS)如何提供一个可信且经过验证的平台来在多种硬件环境中运行LLM工作流。