题目
团队训练了一个模型,画出随 boosting 轮数变化的测试损失曲线,并汇报测试值最好的那个轮数。为什么这个测试分数已经不能作为最终检验?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。