全站搜索 — 锐望实验室

全部 · 4546 课程 · 299 模块 · 72 题目 · 4169 帮助 · 6 收藏题单 · 0

找到 30 个结果

English questions

题目2648 · 机器学习

为什么带重叠滚动特征时随机 k 折无效

为什么当每个特征向量都依赖一个 20 天滚动历史时，随机 k 折交叉验证会失效？

打开 →

题目2647 · 机器学习

为什么重复实体数据更适合分组 CV

为什么当每个实体会反复出现、模型还能识别实体特征时，按行做交叉验证并不合适？

打开 →

题目2653 · 机器学习

分组交叉验证中每折的训练样本数

共有 12 个发行人，每个发行人贡献 5 条样本。在 3 折分组交叉验证中，每次留出 4 个发行人。每一折训练会使用多少条样本？

打开 →

题目5041 · 机器学习

反推缺失折的性能差 1

一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.02, 0.01, -0.01, 0.03]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少？

打开 →

题目5042 · 机器学习

反推缺失折的性能差 2

一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.05, 0.02, 0.04, -0.01]。交易台报告说 5 折的总体平均差为 0.026。缺失的第 5 折差值是多少？

打开 →

题目5043 · 机器学习

反推缺失折的性能差 3

一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[-0.02, 0.01, 0.0, -0.01]。交易台报告说 5 折的总体平均差为 0.002。缺失的第 5 折差值是多少？

打开 →

题目5044 · 机器学习

反推缺失折的性能差 4

一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.01, 0.01, 0.02, 0.0]。交易台报告说 5 折的总体平均差为 0.014。缺失的第 5 折差值是多少？

打开 →

题目5045 · 机器学习

反推缺失折的性能差 5

一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.04, -0.02, 0.01, 0.02]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少？

打开 →

题目2457 · 机器学习

在交叉验证之前一次性拟合 PCA

某个笔记本先在全特征矩阵上做 PCA，再把得到的主成分送进每个交叉验证折。为什么这不是无害的提速优化？

打开 →

题目2656 · 机器学习

标签窗口重叠时为什么不能随机按行做 CV

如果每个标签都依赖未来 5 个交易日，而相邻样本的标签窗口彼此重叠，为什么普通的按行随机交叉验证会严重高估表现？

打开 →

题目2667 · 机器学习

面对重复实体时，按类别分层还不够

当同一发行人反复出现且发行人身份本身带有预测信息时，为什么按类别分层的交叉验证仍然可能失败得很厉害？

打开 →

题目2702 · 机器学习

50 个零假设变体里最佳 t 统计量超过 2.4 的概率

假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少？

打开 →

题目4368 · 机器学习

successive halving 总训练次数 3

successive halving 从 27 个配置开始。每一轮保留三分之一的配置，并让所有幸存者各训练一次。如果总共运行 3 轮，会执行多少次模型训练？

打开 →

题目4366 · 机器学习

一倍标准误规则选模 1

三个模型复杂度对应的平均交叉验证 AUC 分别为 0.790、0.802 和 0.808。最佳分数的标准误是 0.010。按 one-standard-error rule，应该保留哪个最简单的模型？

打开 →

题目2460 · 机器学习

一直用验证集试到某个模型靠运气赢

两个候选模型本来很接近。研究员不断微调随机种子和预处理，直到其中一个在同一份验证切片上胜出。为什么这个看起来的胜利应该打折看待？

打开 →

题目2464 · 机器学习

不碰测试标签并不够

有人辩称不存在泄漏，因为代码从未访问测试标签。给出这个辩护在真实机器学习流水线里为什么会失效的核心原因。

打开 →

题目2574 · 机器学习

为什么 bagging 最能帮助不稳定学习器 10

为什么 bagging 通常对深树帮助很大，却对本来就稳定的学习器帮助较小？

打开 →

题目2599 · 机器学习

为什么 boosting 主要是在压偏差 9

为什么 boosting 通常被描述成“主要降偏差”的方法，而不是“主要降方差”的方法？

打开 →

题目2511 · 机器学习

为什么 L1 的尖角会产生稀疏性 11

为什么人们常用 L1 球的几何形状来解释 lasso 会产生稀疏解？

打开 →

题目2669 · 机器学习

为什么 purge 和 embargo 解决的是不同问题

为什么在时间序列验证里，purge 与 embargo 并不是同一件事？

打开 →

题目5065 · 机器学习

为什么一个数字不够

为什么单个保留集分数往往不足以支持“某模型绝对更好”的结论？

打开 →

题目2465 · 机器学习

为什么会需要嵌套验证

如果同一份验证集被反复用于模型族选择、特征工程和阈值调节，为什么从概念上说需要第二层外部留出集或嵌套流程？

打开 →

题目2670 · 机器学习

为什么最佳 CV 设计取决于部署单元

为什么折分规则应该去贴近模型在生产环境里真正需要泛化的那个单元？

打开 →

题目2580 · 机器学习

为什么增加树数通常不会制造经典意义上的过拟合 15

为什么给随机森林继续加树，通常只是收益趋于平台，而不会出现某些单模型家族那种爆炸式过拟合？

打开 →

题目5061 · 机器学习

为什么嵌套评估重要

为什么把两个已经调过参的模型，直接拿在同一组“调参时用过的验证折”上比较，会是不公平的？

打开 →

题目2657 · 机器学习

为什么折间波动不等于部署误差的标准误

为什么各折得分的标准差，不能自动被解释成未来生产表现的标准误？

打开 →

题目2661 · 机器学习

为什么时间序列 CV 的重点是信息可得性，而不是日历洁癖

为什么时间序列 CV 真正的原则是“永远不要用未来信息训练”，而不是“永远采用某种固定折几何”？

打开 →

题目2469 · 机器学习

为什么点时特征库很重要

团队说只要统一使用最新的 vendor 表，就能避免泄漏，因为这些值更准确。关于真实部署环境，他们忽略了什么核心点？

打开 →

题目5062 · 机器学习

为什么相关性重要

为什么当模型评分来自相互重叠的滚动窗口时，标准 iid 显著性论证往往会过于乐观？

打开 →

题目2513 · 机器学习

为什么相关特征会让纯 lasso 难受 17

为什么当多个特征高度相关且预测力相近时，纯 lasso 往往会表现得很不稳定？

打开 →