← 返回数学题库
2625机器学习困难derivationmedium

Decoupled Weight Decay Update 4

题目

Under decoupled weight decay with learning rate eta, decay lambda, parameters w_t, and gradient g_t, derive w_{t+1}.

解题计时

0:00

提交作答时记录,用于后续平均用时统计。