为什么带重叠滚动特征时随机 k 折无效
为什么当每个特征向量都依赖一个 20 天滚动历史时,随机 k 折交叉验证会失效?
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions为什么当每个特征向量都依赖一个 20 天滚动历史时,随机 k 折交叉验证会失效?
打开 →为什么当每个实体会反复出现、模型还能识别实体特征时,按行做交叉验证并不合适?
打开 →共有 12 个发行人,每个发行人贡献 5 条样本。在 3 折分组交叉验证中,每次留出 4 个发行人。每一折训练会使用多少条样本?
打开 →一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.02, 0.01, -0.01, 0.03]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少?
打开 →一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.05, 0.02, 0.04, -0.01]。交易台报告说 5 折的总体平均差为 0.026。缺失的第 5 折差值是多少?
打开 →一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[-0.02, 0.01, 0.0, -0.01]。交易台报告说 5 折的总体平均差为 0.002。缺失的第 5 折差值是多少?
打开 →一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.01, 0.01, 0.02, 0.0]。交易台报告说 5 折的总体平均差为 0.014。缺失的第 5 折差值是多少?
打开 →一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.04, -0.02, 0.01, 0.02]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少?
打开 →某个笔记本先在全特征矩阵上做 PCA,再把得到的主成分送进每个交叉验证折。为什么这不是无害的提速优化?
打开 →如果每个标签都依赖未来 5 个交易日,而相邻样本的标签窗口彼此重叠,为什么普通的按行随机交叉验证会严重高估表现?
打开 →当同一发行人反复出现且发行人身份本身带有预测信息时,为什么按类别分层的交叉验证仍然可能失败得很厉害?
打开 →假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少?
打开 →successive halving 从 27 个配置开始。每一轮保留三分之一的配置,并让所有幸存者各训练一次。如果总共运行 3 轮,会执行多少次模型训练?
打开 →三个模型复杂度对应的平均交叉验证 AUC 分别为 0.790、0.802 和 0.808。最佳分数的标准误是 0.010。按 one-standard-error rule,应该保留哪个最简单的模型?
打开 →两个候选模型本来很接近。研究员不断微调随机种子和预处理,直到其中一个在同一份验证切片上胜出。为什么这个看起来的胜利应该打折看待?
打开 →有人辩称不存在泄漏,因为代码从未访问测试标签。给出这个辩护在真实机器学习流水线里为什么会失效的核心原因。
打开 →为什么 bagging 通常对深树帮助很大,却对本来就稳定的学习器帮助较小?
打开 →为什么 boosting 通常被描述成“主要降偏差”的方法,而不是“主要降方差”的方法?
打开 →为什么人们常用 L1 球的几何形状来解释 lasso 会产生稀疏解?
打开 →为什么在时间序列验证里,purge 与 embargo 并不是同一件事?
打开 →为什么单个保留集分数往往不足以支持“某模型绝对更好”的结论?
打开 →如果同一份验证集被反复用于模型族选择、特征工程和阈值调节,为什么从概念上说需要第二层外部留出集或嵌套流程?
打开 →为什么折分规则应该去贴近模型在生产环境里真正需要泛化的那个单元?
打开 →为什么给随机森林继续加树,通常只是收益趋于平台,而不会出现某些单模型家族那种爆炸式过拟合?
打开 →为什么把两个已经调过参的模型,直接拿在同一组“调参时用过的验证折”上比较,会是不公平的?
打开 →为什么各折得分的标准差,不能自动被解释成未来生产表现的标准误?
打开 →为什么时间序列 CV 真正的原则是“永远不要用未来信息训练”,而不是“永远采用某种固定折几何”?
打开 →团队说只要统一使用最新的 vendor 表,就能避免泄漏,因为这些值更准确。关于真实部署环境,他们忽略了什么核心点?
打开 →为什么当模型评分来自相互重叠的滚动窗口时,标准 iid 显著性论证往往会过于乐观?
打开 →为什么当多个特征高度相关且预测力相近时,纯 lasso 往往会表现得很不稳定?
打开 →