2634机器学习困难derivationmedium
Batch-Average Gradient 9
题目
If the minibatch loss is the average L = (1/B) sum_{i=1}^B L_i, derive dL/dw in terms of the per-example gradients.
解题计时
0:00
提交作答时记录,用于后续平均用时统计。
题目
If the minibatch loss is the average L = (1/B) sum_{i=1}^B L_i, derive dL/dw in terms of the per-example gradients.
解题计时
0:00
提交作答时记录,用于后续平均用时统计。