INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
420

6 / 21

非代码面试题

显示 20 / 420 道匹配题目

答题状态:未尝试未正确已正确
4206gamma 翻倍时相似度变化 16一个 RBF 核对应的距离平方为 2。如果 γ 从 0.5 翻倍到 1.0,核相似度会乘上什么因子?机器学习中等derivation未尝试面试订阅4207点积变大时多项式核涨幅 17二次多项式核为 K=(x·z+1) 2。如果 x·z 从 1.0 升到 1.5,K 会增加多少百分比?机器学习中等derivation未尝试面试订阅4208C 增大时目标值上升 18一个软间隔 SVM 保持 ||w|| 2 和总 hinge loss 不变,但 C 从 0.5 提高到 1.5,且总 hinge loss 为 2.0。目标函数会上升多少?机器学习中等derivation未尝试面试订阅4209对偶系数减半后的贡献 19在某个测试点,一个支持向量原本贡献 +0.9。如果它的对偶系数减半,而其他部分都不变,那么这个支持向量的新贡献是多少?机器学习中等derivation未尝试面试订阅4210特征加倍时线性得分变化 20一个线性 SVM 在某个点上的线性得分原本是 1.2。如果相关特征值全部加倍,而 w 保持不变,这个线性项的新得分会是多少?机器学习中等derivation未尝试面试订阅4216归一化 MDI 占比 1一个随机森林报告的平均不纯度下降总贡献为 spread=0.42, imbalance=0.21, id bucket=0.07。问归一化后的特征重要性占比分别是多少?哪一个特征排第一?机器学习简单数值题未尝试面试订阅4217置换重要性与排序 1一个模型的基准验证集 AUC 是 0.62。分别置换三个特征后,AUC 变成:value signal 对应 0.57,momentum 对应 0.60,zip code 对应 0.61。它们的置换重要性下降是多少?谁排第一?机器学习简单数值题未尝试面试订阅4218聚合 one-hot 特征组 2一个 sector 特征被拆成三个 one-hot 列,它们的 impurity-gain 重要性分别是 0.04、0.03 和 0.01。另外两个特征的重要性分别是 0.05 和 0.07。如果把这三个 one-hot 列聚合成一个组,那么各组的归一化占比分别是多少?谁排第一?机器学习简单数值题未尝试面试订阅4219跨树汇总 gain 重要性 3两棵树分别给特征 A 和 B 带来 split gain。Tree 1 的贡献是 A=12、B=5;Tree 2 的贡献是 A=8、B=10。A 和 B 的总归一化 gain 重要性各是多少?机器学习简单数值题未尝试面试订阅4220以 log loss 衡量置换重要性 4一个模型的基准 log loss 是 0.400。置换特征 X 后,log loss 升到 0.455;置换特征 Y 后,升到 0.420。按 log loss 指标定义,它们的置换重要性各是多少?哪个更重要?机器学习简单数值题未尝试面试订阅4221分组置换降幅模式 1一个模型的验证准确率原本是 0.82。只打乱特征 X1 后降到 0.79,只打乱 X2 后降到 0.8,把二者一起打乱后降到 0.7。问这三种重要性降幅各是多少?这说明了什么模式?机器学习中等数值题未尝试面试订阅4223移除相关特征后的重要性变化 6某模型的基准 AUC 为 0.70。在存在一个高相关孪生特征时,置换特征 A 会把 AUC 降到 0.64;删掉这个孪生特征后,置换 A 会把 AUC 降到 0.58。特征 A 的置换重要性增加了多少?机器学习中等数值题未尝试面试订阅4224限制树深后的新占比 7某个基于 impurity 的特征排名原本是 id hash=0.40、signal 1=0.35、signal 2=0.25。限制 max depth 之后,id hash 的原始 gain 减半,而其他 raw gain 保持不变。新的归一化份额是多少?机器学习中等数值题未尝试面试订阅4225不同基准下的相对退化 8某个特征的置换重要性定义为“基准准确率减去置换后的准确率”。在验证集 A 上,这两个数是 0.80 和 0.78;在更嘈杂的验证集 B 上,它们是 0.74 和 0.72。两种情况下,相对退化占基准的比例各是多少?机器学习中等数值题未尝试面试订阅4231分组置换修复如果若干个行业虚拟变量一起移动、共享同一份经济信息,什么诊断方法通常比逐个置换单个 dummy 更合适?机器学习中等derivation未尝试面试订阅4232针对泄露风险的时序切分修复某个特征只有在存在报告延迟的情况下才能获得。相比随机切分训练测试集,什么评估方式更有说服力?机器学习中等derivation未尝试面试订阅4233删除后重训检查为什么“删掉特征 X 再重训”得到的结论,可能和在原模型上做置换重要性完全不同?机器学习中等derivation未尝试面试订阅4234条件重要性修复如果一个特征和其他变量高度相关,那么使用条件重要性而不是普通边际置换的意义是什么?机器学习中等derivation未尝试面试订阅4235稳定性修复如果特征重要性排名在不同折之间大幅摆动,正确的反应是什么?机器学习中等derivation未尝试面试订阅4246解释方差占比 6某个协方差矩阵做 PCA 后得到特征值 12、3 和 1。第一主成分解释了总方差的多少比例?机器学习简单数值题未尝试面试订阅