INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
811

20 / 41

非代码面试题

显示 20 / 811 道匹配题目

答题状态:未尝试未正确已正确
4204由 α 判断点的角色 14在一个 SVM 的对偶解中,某个训练点的 α i=0.4,且 C=1.0。这个结果暗示该点相对间隔扮演什么角色?机器学习中等derivation未尝试面试订阅4206gamma 翻倍时相似度变化 16一个 RBF 核对应的距离平方为 2。如果 γ 从 0.5 翻倍到 1.0,核相似度会乘上什么因子?机器学习中等derivation未尝试面试订阅4207点积变大时多项式核涨幅 17二次多项式核为 K=(x·z+1) 2。如果 x·z 从 1.0 升到 1.5,K 会增加多少百分比?机器学习中等derivation未尝试面试订阅4208C 增大时目标值上升 18一个软间隔 SVM 保持 ||w|| 2 和总 hinge loss 不变,但 C 从 0.5 提高到 1.5,且总 hinge loss 为 2.0。目标函数会上升多少?机器学习中等derivation未尝试面试订阅4209对偶系数减半后的贡献 19在某个测试点,一个支持向量原本贡献 +0.9。如果它的对偶系数减半,而其他部分都不变,那么这个支持向量的新贡献是多少?机器学习中等derivation未尝试面试订阅4210特征加倍时线性得分变化 20一个线性 SVM 在某个点上的线性得分原本是 1.2。如果相关特征值全部加倍,而 w 保持不变,这个线性项的新得分会是多少?机器学习中等derivation未尝试面试订阅4211稀疏高维下先试哪种 SVM 21如果特征是维度极高且极度稀疏的 one-hot 指标,通常会先试线性 SVM 还是 RBF SVM?为什么?机器学习中等essay未尝试面试订阅4212为什么 RBF SVM 特别依赖特征缩放 22为什么在使用 RBF SVM 之前,特征缩放会显得尤其重要?机器学习中等essay未尝试面试订阅4213为什么预测时只需要支持向量 23为什么在 SVM 做预测时,只需要支持向量而不需要所有训练点?机器学习中等essay未尝试面试订阅4214为什么极大的 C 会提高过拟合风险 24为什么在软间隔 SVM 里,把 C 设得极大可能会增加过拟合风险?机器学习中等essay未尝试面试订阅4215为什么高次多项式核在未缩放特征上会变得尴尬 25为什么高次多项式核在未经缩放的特征上,常常会在数值上和统计上都很别扭?机器学习中等essay未尝试面试订阅4226高基数 ID 陷阱一个随机森林按 impurity decrease 排名时,把哈希化的客户 ID 评为最重要特征,但验证集上的置换降幅却几乎为零。最可能的陷阱是什么?机器学习中等derivation未尝试面试订阅4227泄露代理陷阱在一个欺诈预测模型中,'距结算已过天数' 被排成很高的重要性,但这个字段只有在结果已经可见之后才知道。把它当成真实预测能力为什么是错的?机器学习中等derivation未尝试面试订阅4228代理特征陷阱一个树模型把大部分重要性给了邮编,而不是背后的收入和地区变量。为什么在下结论说“邮编才是真正驱动因素”之前必须谨慎?机器学习中等derivation未尝试面试订阅4229相关变量分账陷阱两个几乎相同的特征在不同随机种子下轮流成为最常用的分裂变量。这是否一定说明信号本身不稳定?机器学习中等derivation未尝试面试订阅4230负置换重要性某个弱特征在有限验证集上出现了略微负的置换重要性。你是否应立刻断言它真的具有“反向预测性”?机器学习中等derivation未尝试面试订阅4236重要性不等于因果性为什么把特征重要性当成因果排序会很危险?机器学习中等essay未尝试面试订阅4237为什么树模型会高估容易切分的特征为什么基于 impurity 的重要性往往会高估那些可切分点很多的特征?机器学习中等essay未尝试面试订阅4238为什么相关性会让重要性排名脆弱为什么强相关特征会让重要性排名变得脆弱?机器学习中等essay未尝试面试订阅4239为什么需要多种重要性视角为什么实务中通常应该同时看不止一种特征重要性诊断?机器学习中等essay未尝试面试订阅