第 14 / 37 页
非代码面试题
显示 20 / 738 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
4231分组置换修复如果若干个行业虚拟变量一起移动、共享同一份经济信息,什么诊断方法通常比逐个置换单个 dummy 更合适?机器学习中等derivation未尝试面试订阅4232针对泄露风险的时序切分修复某个特征只有在存在报告延迟的情况下才能获得。相比随机切分训练测试集,什么评估方式更有说服力?机器学习中等derivation未尝试面试订阅4233删除后重训检查为什么“删掉特征 X 再重训”得到的结论,可能和在原模型上做置换重要性完全不同?机器学习中等derivation未尝试面试订阅4234条件重要性修复如果一个特征和其他变量高度相关,那么使用条件重要性而不是普通边际置换的意义是什么?机器学习中等derivation未尝试面试订阅4235稳定性修复如果特征重要性排名在不同折之间大幅摆动,正确的反应是什么?机器学习中等derivation未尝试面试订阅4236重要性不等于因果性为什么把特征重要性当成因果排序会很危险?机器学习中等essay未尝试面试订阅4237为什么树模型会高估容易切分的特征为什么基于 impurity 的重要性往往会高估那些可切分点很多的特征?机器学习中等essay未尝试面试订阅4238为什么相关性会让重要性排名脆弱为什么强相关特征会让重要性排名变得脆弱?机器学习中等essay未尝试面试订阅4239为什么需要多种重要性视角为什么实务中通常应该同时看不止一种特征重要性诊断?机器学习中等essay未尝试面试订阅4261为什么不同量纲下先标准化 21当原始变量的量纲差异很大时,为什么在 PCA 之前通常要先做标准化?机器学习中等essay未尝试面试订阅4262为什么 Whitening 可能放大噪声为什么过度 whitening 可能让下游模型在数值上更嘈杂?机器学习中等essay未尝试面试订阅4263为什么主成分符号翻转不影响本质 22为什么把主成分载荷向量整体乘以 -1,并不会改变 PCA 解的本质?机器学习中等essay未尝试面试订阅4264什么时候 PCA 会有害什么时候 PCA 反而可能伤害预测流程?机器学习中等essay未尝试面试订阅4265为什么第一主成分不一定最会预测 23为什么第一主成分即使解释了最多方差,也不一定最适合拿来预测标签?机器学习中等essay未尝试面试订阅4286非凸簇加噪声先试什么 21如果你预期数据里是弯月形这类非凸簇,而且还混有一些噪声点,通常会先试 k-means 还是 DBSCAN?为什么?机器学习中等essay未尝试面试订阅4287为什么尺度失衡会伤害 k-means 22为什么当某个特征的尺度明显大于其他特征时,k-means 往往会表现很差?机器学习中等essay未尝试面试订阅4288为什么 silhouette 可能偏向更小的 k 23为什么即使更大的 k 能继续降低 SSE,silhouette score 也可能仍然偏向更小的 k?机器学习中等essay未尝试面试订阅4289为什么直接聚类价格水平会误导 24为什么把股票的原始价格水平直接拿来聚类,往往不如聚类标准化后的收益或特征更合理?机器学习中等essay未尝试面试订阅4290为什么随机种子会影响聚类结果 25为什么即使数据集不变,聚类结果也可能会随着随机种子的不同而变化很大?机器学习中等essay未尝试面试订阅4301mixup 标签混合 11在一个 4 分类问题里,mixup 以 lambda = 0.3 混合“类别 1 的样本”和“类别 4 的样本”的 one-hot 标签。最终得到的目标向量是什么?机器学习中等数值题未尝试面试订阅