← 返回数学题库
2642机器学习简单derivationshort

BatchNorm 运行均值更新公式 13

题目

某个 BatchNorm 层按 mu_new = m mu_old + (1-m) mu_batch 更新运行均值。这个公式在操作上意味着什么?

解题计时

0:00

提交作答时记录,用于后续平均用时统计。