2642机器学习简单derivationshort
BatchNorm 运行均值更新公式 13
题目
某个 BatchNorm 层按 mu_new = m mu_old + (1-m) mu_batch 更新运行均值。这个公式在操作上意味着什么?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。
题目
某个 BatchNorm 层按 mu_new = m mu_old + (1-m) mu_batch 更新运行均值。这个公式在操作上意味着什么?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。