SGLang Workshop

【实操实验】RL训练实验室：使用Miles RL框架启动真实训练任务

日期 5月6日时间 16:00 - 17:10 地点 Central Room

强化学习后训练已成为构建高能力基础模型的关键阶段——然而大多数开源实践者仍然难以搭建稳定、高吞吐的 RL 训练流水线。本次实操实验将 SGLang 经过实战检验的 RL 基础设施直接带给 GOSIM Paris 社区。参与者将逐步构建一个端到端的 RL 训练循环，使用 SGLang 作为采样后端，学习如何与 Miles 框架集成，并应对训练-推理不匹配和大规模采样效率等实际挑战。如今，SGLang 为全行业前沿模型的 RL 后训练提供支持，在全球超过 40 万块 GPU 上运行。本次课程将这些生产经验提炼为实用、可复现的技术——为开源开发者和研究人员提供在自有基础设施上运行稳健 RL 训练的具体路径。

演讲嘉宾

Ethan (Yusheng) Su Member of Technical Staff, RadixArk