GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片 演讲幻灯片 活动相册 活动相册
筛选
SGLang Workshop

【实操实验】RL训练实验室:使用Miles RL框架启动真实训练任务

日期 5月6日 时间 16:00 - 17:10 地点 Central Room
强化学习后训练已成为构建高能力基础模型的关键阶段——然而大多数开源实践者仍然难以搭建稳定、高吞吐的 RL 训练流水线。本次实操实验将 SGLang 经过实战检验的 RL 基础设施直接带给 GOSIM Paris 社区。参与者将逐步构建一个端到端的 RL 训练循环,使用 SGLang 作为采样后端,学习如何与 Miles 框架集成,并应对训练-推理不匹配和大规模采样效率等实际挑战。如今,SGLang 为全行业前沿模型的 RL 后训练提供支持,在全球超过 40 万块 GPU 上运行。本次课程将这些生产经验提炼为实用、可复现的技术——为开源开发者和研究人员提供在自有基础设施上运行稳健 RL 训练的具体路径。