新闻中心
 
 
学术交流 当前位置: 学院首页 > 学术交流 > 正文
 
英国埃克塞特大学黄田进老师应邀为我院师生作学术报告
发布日期:2025-07-20   浏览次数:
 

7月18日下午,英国埃克塞特大学助理教授黄田进老师应邀为我院师生作学术报告。报告会由毛启容院长主持,相关研究领域的教师、研究生参加了此次报告会。

此次报告的主题是面向稳健大语言模型训练的优化器。报告围绕如何实现更稳健的大语言模型训练展开,重点揭示了训练过程中普遍存在的梯度突刺(gradient spike)现象,以及其对模型和最终性能带来的影响。此外,报告从优化器设计与梯度调控机制的角度切入,介绍SPAM(Spike-Aware Moment regularization)方法如何通过瞬态梯度突刺的检测与裁剪,有效缓解异常梯度放大效应,抑制由不均衡动量累积导致的训练震荡,显著改善大模型的训练。在此基础上,报告进一步介绍了Stable-SPAM,该方法通过引入自适应突刺识别阈值与动态缩放策略,可以更为稳定的进行大语言模型的低精度训练。

报告结束后,黄老师和与会师生进行了详细的交流探讨,对于师生提出的各种问题进行了耐心解答。黄田进老师生动详细的报告内容和求实创新的治学精神对我院师生有着很大的启发。

江苏大学计算机科学与通信工程学院 版权所有
Copyright (C) 2018-2023.cs.ujs.edu.cn. All rights resterved
地址:江苏省镇江市京口区学府路301号江苏大学计算机学院 邮编:212013   Tel:0511-88780371 Email:jsj@ujs.edu.cn