第 8 / 11 页
非代码面试题
显示 20 / 215 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2458根据测试曲线来选早停轮数团队训练了一个模型,画出随 boosting 轮数变化的测试损失曲线,并汇报测试值最好的那个轮数。为什么这个测试分数已经不能作为最终检验?机器学习中等essay未尝试面试订阅2460一直用验证集试到某个模型靠运气赢两个候选模型本来很接近。研究员不断微调随机种子和预处理,直到其中一个在同一份验证切片上胜出。为什么这个看起来的胜利应该打折看待?机器学习困难essay未尝试面试订阅2465为什么会需要嵌套验证如果同一份验证集被反复用于模型族选择、特征工程和阈值调节,为什么从概念上说需要第二层外部留出集或嵌套流程?机器学习困难essay未尝试面试订阅2472由样本均值与斜率求截距 2推导带截距一元回归中,在已知 beta hat 之后 OLS 截距的表达式。机器学习简单derivation未尝试免费2474响应变量整体平移常数 4在带截距的 OLS 模型里,如果把每个目标值都替换成 y i + k,拟合斜率和截距会怎样变化?机器学习中等derivation未尝试面试订阅2475为什么重复特征会导致系数不唯一 5为什么两个完全重复的特征会让 OLS 系数向量不唯一,而拟合预测却仍然可以唯一?机器学习困难essay未尝试面试订阅2477为什么中心化能简化 OLS 代数 7为什么在带截距时,对特征和目标做中心化,常常能让 OLS 推导更干净?机器学习中等essay未尝试免费2479为什么多重共线性更伤系数稳定性而不是拟合值 10为什么严重多重共线性会让系数非常不稳定,即使训练预测几乎没变化?机器学习中等essay未尝试面试订阅2480正交特征会给出逐坐标系数 9设两个特征 x1 和 x2 都已中心化且彼此正交。请用 x1 T y、x2 T y、||x1|| 2、||x2|| 2 推导 OLS 系数。机器学习困难derivation未尝试面试订阅2484响应变量缩放 14如果把每个目标值都乘上 c,OLS 系数向量和截距会怎样变化?机器学习困难derivation未尝试面试订阅2487等价参数化下预测不变 16为什么当设计矩阵秩亏时,两个不同的系数向量仍可能产生完全相同的 OLS 预测?机器学习中等derivation未尝试面试订阅2490为什么 OLS 在失配下仍可能预测得不错 20为什么即使真实数据生成过程并不严格线性,OLS 仍可能是有用的预测器?机器学习困难essay未尝试面试订阅2499soft-threshold 后的 lasso 系数 4在正交单特征问题里,若 x T x = d、x T y = z > 0,请推导 0 < lambda < z 时的 lasso 系数。机器学习中等derivation未尝试面试订阅2500达到目标 ridge 收缩比例所需的 lambda 5在正交坐标里,ridge 会用 d/(d+lambda) 的比例收缩 beta ols。若目标收缩比例是 r in (0,1),lambda 应是多少?机器学习困难derivation未尝试面试订阅2503ridge 的 MAP 解释 10在线性模型的高斯噪声设定下,给 beta 施加什么样的高斯先验会让 ridge 成为 MAP 估计?机器学习中等derivation未尝试面试订阅2505正交单特征下 ridge 不会翻符号 12在正交单特征情形下,若 z = x T y,为什么 ridge 对所有 lambda >= 0 都会保留 z 的符号?机器学习困难derivation未尝试面试订阅2508为什么 elastic net 保留 lasso 阈值又额外加入 ridge 收缩 14为什么 elastic net 仍然需要 |z| 先跨过一个 L1 阈值,坐标才会激活,但在激活之后又会比 lasso 收缩得更多?机器学习中等derivation未尝试面试订阅2509ridge 范数会随 lambda 单调收缩 15为什么 ridge 解的范数通常会随着 lambda 增大而下降?机器学习困难derivation未尝试面试订阅2510lambda 为零时会回到 OLS 16为什么 ridge 与 lasso 在正则化参数设为零时都会退化成 OLS?机器学习困难derivation未尝试面试订阅2515为什么小 lambda 意味着弱正则 20为什么很小的 lambda 会让正则化解贴近 OLS?机器学习困难derivation未尝试面试订阅