4226机器学习中等derivationmedium
高基数 ID 陷阱
题目
一个随机森林按 impurity decrease 排名时,把哈希化的客户 ID 评为最重要特征,但验证集上的置换降幅却几乎为零。最可能的陷阱是什么?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。
题目
一个随机森林按 impurity decrease 排名时,把哈希化的客户 ID 评为最重要特征,但验证集上的置换降幅却几乎为零。最可能的陷阱是什么?
解题计时
0:00
提交作答时记录,用于后续平均用时统计。