INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
453

18 / 23

非代码面试题

显示 20 / 453 道匹配题目

答题状态:未尝试未正确已正确
4225不同基准下的相对退化 8某个特征的置换重要性定义为“基准准确率减去置换后的准确率”。在验证集 A 上,这两个数是 0.80 和 0.78;在更嘈杂的验证集 B 上,它们是 0.74 和 0.72。两种情况下,相对退化占基准的比例各是多少?机器学习中等数值题未尝试面试订阅4226高基数 ID 陷阱一个随机森林按 impurity decrease 排名时,把哈希化的客户 ID 评为最重要特征,但验证集上的置换降幅却几乎为零。最可能的陷阱是什么?机器学习中等derivation未尝试面试订阅4227泄露代理陷阱在一个欺诈预测模型中,'距结算已过天数' 被排成很高的重要性,但这个字段只有在结果已经可见之后才知道。把它当成真实预测能力为什么是错的?机器学习中等derivation未尝试面试订阅4228代理特征陷阱一个树模型把大部分重要性给了邮编,而不是背后的收入和地区变量。为什么在下结论说“邮编才是真正驱动因素”之前必须谨慎?机器学习中等derivation未尝试面试订阅4229相关变量分账陷阱两个几乎相同的特征在不同随机种子下轮流成为最常用的分裂变量。这是否一定说明信号本身不稳定?机器学习中等derivation未尝试面试订阅4230负置换重要性某个弱特征在有限验证集上出现了略微负的置换重要性。你是否应立刻断言它真的具有“反向预测性”?机器学习中等derivation未尝试面试订阅4231分组置换修复如果若干个行业虚拟变量一起移动、共享同一份经济信息,什么诊断方法通常比逐个置换单个 dummy 更合适?机器学习中等derivation未尝试面试订阅4232针对泄露风险的时序切分修复某个特征只有在存在报告延迟的情况下才能获得。相比随机切分训练测试集,什么评估方式更有说服力?机器学习中等derivation未尝试面试订阅4233删除后重训检查为什么“删掉特征 X 再重训”得到的结论,可能和在原模型上做置换重要性完全不同?机器学习中等derivation未尝试面试订阅4234条件重要性修复如果一个特征和其他变量高度相关,那么使用条件重要性而不是普通边际置换的意义是什么?机器学习中等derivation未尝试面试订阅4235稳定性修复如果特征重要性排名在不同折之间大幅摆动,正确的反应是什么?机器学习中等derivation未尝试面试订阅4236重要性不等于因果性为什么把特征重要性当成因果排序会很危险?机器学习中等essay未尝试面试订阅4237为什么树模型会高估容易切分的特征为什么基于 impurity 的重要性往往会高估那些可切分点很多的特征?机器学习中等essay未尝试面试订阅4238为什么相关性会让重要性排名脆弱为什么强相关特征会让重要性排名变得脆弱?机器学习中等essay未尝试面试订阅4239为什么需要多种重要性视角为什么实务中通常应该同时看不止一种特征重要性诊断?机器学习中等essay未尝试面试订阅4241PCA 主方向 1一个已经中心化的双特征数据集,其协方差矩阵为 [[4.2, 1.6], [1.6, 1.8]]。第一主成分方向及其方差是多少?机器学习中等数值题未尝试面试订阅4246解释方差占比 6某个协方差矩阵做 PCA 后得到特征值 12、3 和 1。第一主成分解释了总方差的多少比例?机器学习简单数值题未尝试面试订阅4247达到方差阈值所需维数 7PCA 得到的特征值是 12、3 和 1。若要求至少解释 90% 的方差,最少需要保留多少个主成分?机器学习简单数值题未尝试面试订阅4248主成分得分 8某个中心化点为 x=(3,1),第一主成分载荷向量为 v=(2,1)/sqrt(5)。x 在 PC1 上的得分是多少?机器学习简单数值题未尝试面试订阅4249rank-1 重构 9某个 rank-1 PCA 近似只保留载荷向量 v=(1,2)/sqrt(5) 上的得分 4。它对应的中心化重构点是什么?机器学习简单数值题未尝试面试订阅