GOSIM Paris 2026 已圆满结束
感谢所有参会者、演讲嘉宾和赞助商,让本次活动精彩纷呈!
演讲幻灯片
活动相册
活动已结束
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
议题
演讲嘉宾
日程
支持者
同期活动
志愿者
会场
English
中文
Français
活动已结束
筛选
上一个
Building the World's First Open-Source Multimodal Speedrun Model
所有日程
下一个
When Does Sparsity Mitigate the Curse of Depth in LLMs
open-source-model
Exploring HiFloat8: A Tapered Format Complementing the FP8 Ecosystem for Robust Model Training
日期
5月6日
时间
15:40 - 16:10
地点
Open Stage
FP8 格式的量化已显著加速了 LLM 训练。标准 FP8 格式存在频繁的梯度溢出问题,且严重依赖复杂的动态缩放(Delayed Scaling),这常常导致数十亿参数模型的训练不稳定或收敛次优。本次演讲介绍 HiFloat8(HiF8)——一种锥形精度格式,提供了一种管理动态范围的替代方法。这种与神经网络权重/梯度分布的“自然”对齐使 HiF8 能够捕获高幅值异常值,而无需标准 FP8 所需的激进缩放。我们将探讨 HiF8 如何在训练和推理过程中发挥作用。
我们将展示使用 torch.npu 在 PyTorch 生态中实现 HiF8 的过程,使开发者能够在当代 GPU 上评估 HiF8 的性能。同时,我们将分析训练稳定性和最终损失一致性,重点展示 HiF8 在特定场景下提供与 FP16 相当的精度且 GEMM 性能提升 1.5-1.7 倍的情况。最后,我们将分享在 HiF8 专用硬件支持方面正在进行的合作成果。
演讲嘉宾
Zhao Yun
Senior Engineer, Huawei