INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 738

第 13 / 37 页

非代码面试题

显示 20 / 738 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4187为什么更多特征反而可能伤害线性模型为什么加入大量“看起来合理”的工程化特征，反而可能让线性模型变差？机器学习中等essay未尝试面试订阅 4188为什么虚拟变量陷阱不只是编码小错误为什么虚拟变量陷阱并不只是一个无伤大雅的编码疏忽？机器学习中等essay未尝试面试订阅 4189为什么领域特征依然重要在模型越来越灵活的时代，为什么对线性方法来说，仔细的领域驱动特征工程仍然非常重要？机器学习中等essay未尝试面试订阅 4190如何快速检查一道特征工程题在做完一道特征工程面试题后，最快的 sanity check 是什么？机器学习中等essay未尝试面试订阅 4196支持向量打分 6某个核 SVM 在测试点上的两个支持向量有符号贡献分别为 +1.2 和 -0.4，偏置项为 -0.1。最终得分和预测类别是什么？机器学习中等数值题未尝试面试订阅 4198三次多项式核值 8使用三次多项式核 K(x,z)=(x·z+1) 3，求 K((1,1),(2,-1))。机器学习中等数值题未尝试面试订阅 4201哪些点还在惩罚里 11一个软间隔 SVM 在四个样本上的 y f(x) 分别为 [1.4, 0.8, -0.3, 1.0]。哪些点会因为严格处于间隔内或被误分类，而继续进入 hinge-loss 惩罚项？机器学习中等derivation未尝试面试订阅 4202哪条超平面间隔最宽 12三条分离超平面对训练集都能正确分类，但它们的 ||w|| 分别为 2.0、4.0 和 1.6。哪一条的几何间隔最宽？机器学习中等derivation未尝试面试订阅 4203比较两个 SVM 目标值 13模型 A 满足 ||w|| 2=1.0、总 hinge loss=3.0；模型 B 满足 ||w|| 2=4.0、总 hinge loss=0.5。如果 C=0.2，哪一个 SVM 目标函数更小？机器学习中等derivation未尝试面试订阅 4204由 α 判断点的角色 14在一个 SVM 的对偶解中，某个训练点的 α i=0.4，且 C=1.0。这个结果暗示该点相对间隔扮演什么角色？机器学习中等derivation未尝试面试订阅 4211稀疏高维下先试哪种 SVM 21如果特征是维度极高且极度稀疏的 one-hot 指标，通常会先试线性 SVM 还是 RBF SVM？为什么？机器学习中等essay未尝试面试订阅 4212为什么 RBF SVM 特别依赖特征缩放 22为什么在使用 RBF SVM 之前，特征缩放会显得尤其重要？机器学习中等essay未尝试面试订阅 4213为什么预测时只需要支持向量 23为什么在 SVM 做预测时，只需要支持向量而不需要所有训练点？机器学习中等essay未尝试面试订阅 4214为什么极大的 C 会提高过拟合风险 24为什么在软间隔 SVM 里，把 C 设得极大可能会增加过拟合风险？机器学习中等essay未尝试面试订阅 4215为什么高次多项式核在未缩放特征上会变得尴尬 25为什么高次多项式核在未经缩放的特征上，常常会在数值上和统计上都很别扭？机器学习中等essay未尝试面试订阅 4226高基数 ID 陷阱一个随机森林按 impurity decrease 排名时，把哈希化的客户 ID 评为最重要特征，但验证集上的置换降幅却几乎为零。最可能的陷阱是什么？机器学习中等derivation未尝试面试订阅 4227泄露代理陷阱在一个欺诈预测模型中，'距结算已过天数' 被排成很高的重要性，但这个字段只有在结果已经可见之后才知道。把它当成真实预测能力为什么是错的？机器学习中等derivation未尝试面试订阅 4228代理特征陷阱一个树模型把大部分重要性给了邮编，而不是背后的收入和地区变量。为什么在下结论说“邮编才是真正驱动因素”之前必须谨慎？机器学习中等derivation未尝试面试订阅 4229相关变量分账陷阱两个几乎相同的特征在不同随机种子下轮流成为最常用的分裂变量。这是否一定说明信号本身不稳定？机器学习中等derivation未尝试面试订阅 4230负置换重要性某个弱特征在有限验证集上出现了略微负的置换重要性。你是否应立刻断言它真的具有“反向预测性”？机器学习中等derivation未尝试面试订阅