vLLM Workshop

构建、测试与贡献vLLM：开发者指南

日期 5月5日时间 10:25 - 11:05 地点 Founders Cafe

大语言模型（LLM）已经彻底改变了AI格局，而vLLM已成为领先的推理引擎，通过PagedAttention等创新显著加速了LLM服务。但你如何实际地构建、测试和贡献到这个快速发展的项目中呢？

在本次演讲中，我们将带你了解vLLM的架构，并探索使用这个复杂Python/C++代码库的实际方面。我们将从vLLM核心优化（包括PagedAttention）的概述开始，然后深入不同目标的构建过程以及第三方硬件插件，如Google TPU、AWS Neuron、Intel Gaudi等。

你将了解测试策略，例如使用GuideLLM进行性能基准测试和使用lm-evaluation-harness进行模型评估。我们还将涵盖向vLLM社区贡献的最佳实践，以及Red Hat AI Inference Server（RHAIIS）如何提供一个可信且经过验证的平台来在多种硬件环境中运行LLM工作流。

演讲嘉宾

Daniele Trifirò Principal Software Engineer, Red Hat