2643机器学习中等数值题medium
向量参数上的裁剪加权重衰减计算 25
题目
参数向量当前为 w_t=(3,4)。其梯度是 g=(6,8),范数为 10。先做阈值为 5 的全局范数裁剪,再做学习率 eta=0.1、lambda=0.1 的解耦权重衰减更新。新的参数向量是多少?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。
题目
参数向量当前为 w_t=(3,4)。其梯度是 g=(6,8),范数为 10。先做阈值为 5 的全局范数裁剪,再做学习率 eta=0.1、lambda=0.1 的解耦权重衰减更新。新的参数向量是多少?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。