INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 622

第 18 / 32 页

非代码面试题

显示 20 / 622 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4208C 增大时目标值上升 18一个软间隔 SVM 保持 ||w|| 2 和总 hinge loss 不变，但 C 从 0.5 提高到 1.5，且总 hinge loss 为 2.0。目标函数会上升多少？机器学习中等derivation未尝试面试订阅 4209对偶系数减半后的贡献 19在某个测试点，一个支持向量原本贡献 +0.9。如果它的对偶系数减半，而其他部分都不变，那么这个支持向量的新贡献是多少？机器学习中等derivation未尝试面试订阅 4210特征加倍时线性得分变化 20一个线性 SVM 在某个点上的线性得分原本是 1.2。如果相关特征值全部加倍，而 w 保持不变，这个线性项的新得分会是多少？机器学习中等derivation未尝试面试订阅 4211稀疏高维下先试哪种 SVM 21如果特征是维度极高且极度稀疏的 one-hot 指标，通常会先试线性 SVM 还是 RBF SVM？为什么？机器学习中等essay未尝试面试订阅 4212为什么 RBF SVM 特别依赖特征缩放 22为什么在使用 RBF SVM 之前，特征缩放会显得尤其重要？机器学习中等essay未尝试面试订阅 4213为什么预测时只需要支持向量 23为什么在 SVM 做预测时，只需要支持向量而不需要所有训练点？机器学习中等essay未尝试面试订阅 4214为什么极大的 C 会提高过拟合风险 24为什么在软间隔 SVM 里，把 C 设得极大可能会增加过拟合风险？机器学习中等essay未尝试面试订阅 4215为什么高次多项式核在未缩放特征上会变得尴尬 25为什么高次多项式核在未经缩放的特征上，常常会在数值上和统计上都很别扭？机器学习中等essay未尝试面试订阅 4216归一化 MDI 占比 1一个随机森林报告的平均不纯度下降总贡献为 spread=0.42, imbalance=0.21, id bucket=0.07。问归一化后的特征重要性占比分别是多少？哪一个特征排第一？机器学习简单数值题未尝试面试订阅 4217置换重要性与排序 1一个模型的基准验证集 AUC 是 0.62。分别置换三个特征后，AUC 变成：value signal 对应 0.57，momentum 对应 0.60，zip code 对应 0.61。它们的置换重要性下降是多少？谁排第一？机器学习简单数值题未尝试面试订阅 4218聚合 one-hot 特征组 2一个 sector 特征被拆成三个 one-hot 列，它们的 impurity-gain 重要性分别是 0.04、0.03 和 0.01。另外两个特征的重要性分别是 0.05 和 0.07。如果把这三个 one-hot 列聚合成一个组，那么各组的归一化占比分别是多少？谁排第一？机器学习简单数值题未尝试面试订阅 4219跨树汇总 gain 重要性 3两棵树分别给特征 A 和 B 带来 split gain。Tree 1 的贡献是 A=12、B=5；Tree 2 的贡献是 A=8、B=10。A 和 B 的总归一化 gain 重要性各是多少？机器学习简单数值题未尝试面试订阅 4220以 log loss 衡量置换重要性 4一个模型的基准 log loss 是 0.400。置换特征 X 后，log loss 升到 0.455；置换特征 Y 后，升到 0.420。按 log loss 指标定义，它们的置换重要性各是多少？哪个更重要？机器学习简单数值题未尝试面试订阅 4221分组置换降幅模式 1一个模型的验证准确率原本是 0.82。只打乱特征 X1 后降到 0.79，只打乱 X2 后降到 0.8，把二者一起打乱后降到 0.7。问这三种重要性降幅各是多少？这说明了什么模式？机器学习中等数值题未尝试面试订阅 4223移除相关特征后的重要性变化 6某模型的基准 AUC 为 0.70。在存在一个高相关孪生特征时，置换特征 A 会把 AUC 降到 0.64；删掉这个孪生特征后，置换 A 会把 AUC 降到 0.58。特征 A 的置换重要性增加了多少？机器学习中等数值题未尝试面试订阅 4224限制树深后的新占比 7某个基于 impurity 的特征排名原本是 id hash=0.40、signal 1=0.35、signal 2=0.25。限制 max depth 之后，id hash 的原始 gain 减半，而其他 raw gain 保持不变。新的归一化份额是多少？机器学习中等数值题未尝试面试订阅 4225不同基准下的相对退化 8某个特征的置换重要性定义为“基准准确率减去置换后的准确率”。在验证集 A 上，这两个数是 0.80 和 0.78；在更嘈杂的验证集 B 上，它们是 0.74 和 0.72。两种情况下，相对退化占基准的比例各是多少？机器学习中等数值题未尝试面试订阅 4226高基数 ID 陷阱一个随机森林按 impurity decrease 排名时，把哈希化的客户 ID 评为最重要特征，但验证集上的置换降幅却几乎为零。最可能的陷阱是什么？机器学习中等derivation未尝试面试订阅 4227泄露代理陷阱在一个欺诈预测模型中，'距结算已过天数' 被排成很高的重要性，但这个字段只有在结果已经可见之后才知道。把它当成真实预测能力为什么是错的？机器学习中等derivation未尝试面试订阅 4228代理特征陷阱一个树模型把大部分重要性给了邮编，而不是背后的收入和地区变量。为什么在下结论说“邮编才是真正驱动因素”之前必须谨慎？机器学习中等derivation未尝试面试订阅