全站搜索 — 锐望实验室

使用等样本权重的 expected calibration error。现在有两个非空分箱：A 箱的预测概率是 [0.2, 0.3]，标签是 [0, 1]；B 箱的预测概率是 [0.8, 0.9]，标签是 [1, 1]。按 ECE = 各箱 (样本占比)*|平均置信度 - 准确率| 计算，结果是多少？

打开 →

题目4434 · 机器学习

Embargo 太短

如果 embargo 比标签 horizon 还短，最可能的后果是什么？

打开 →

题目4428 · 机器学习

Embargo 的直觉

当标签依赖未来收益、而相邻样本的标签窗口会相互重叠时，为什么加入 time embargo 会有帮助？

打开 →

题目4406 · 机器学习

horizon 越长，平滑越强

如果你把未来收益标签从 1 天拉长到 20 天，但依然按日采样，那么重叠程度和有效样本独立性会怎样变化？

打开 →

题目1777 · 统计

Lasso 阈值校准 2

一个标准化 lasso 拟合的绝对得分大小是 (3.8, 2.5, 0.9)。要让最弱的特征刚好变成 0、但另外两个仍保持活跃，最小的 lambda 是多少？

打开 →

题目1819 · 统计

Ljung-Box 的解释

Ljung-Box 检验在收益序列上针对的零假设是什么？若拒绝了它，在实践中意味着什么担忧？

打开 →

题目1833 · 统计

MA(1) 可逆性检查 3

一个 MA(1) 执行噪声模型使用 theta = -0.7。该模型是否可逆？

打开 →

题目1790 · 统计

Ridge 有效自由度 5

一个标准化 ridge 模型的奇异值平方为 d_j^2 = [12.25, 4, 0.25]，惩罚参数 lambda = 0.25。其有效自由度 tr(S_lambda) = sum d_j^2/(d_j^2+lambda) 等于多少？

打开 →

题目4394 · 机器学习

RMS 实现波动率特征 4

某个实现波动率特征被定义为最近 4 个日收益的均方根。如果这 4 个收益是 [1%, -1%, 2%, 0%]，那么得到的实现波动率特征是多少？

打开 →

题目1543 · 数学

Sherman-Morrison 向量更新 C 3

设 A 可逆，A^(-1)b = [5, 0]^T，A^(-1)u = [2, 1]^T，v^T A^(-1)b = 1，v^T A^(-1)u = -1/2。问 (A + u v^T)^(-1) b 等于多少？

打开 →

题目4368 · 机器学习

successive halving 总训练次数 3

successive halving 从 27 个配置开始。每一轮保留三分之一的配置，并让所有幸存者各训练一次。如果总共运行 3 轮，会执行多少次模型训练？

打开 →

题目4429 · 机器学习

Walk-Forward 不是魔法

为什么即使 walk-forward 流程做得很干净，也不能保证策略一定能在实盘里活下来？

打开 →

题目1686 · 统计

z 检验所需样本量

你希望做一个双侧 z 检验 $H_0:\mu=0$，已知 $\sigma=4$，并希望在 5% 显著性水平下以 80% power 检测真实均值为 $1$ 的情形。大约需要多少样本量？

打开 →

题目4452 · 机器学习

一个很吵的强信号

一个新信号在样本内的单独 Sharpe 最高，但它很不稳定，而且和已有信号高度相关。为什么相比给它极高权重，更温和的 shrinkage 组合可能更明智？

打开 →

题目4366 · 机器学习

一倍标准误规则选模 1

三个模型复杂度对应的平均交叉验证 AUC 分别为 0.790、0.802 和 0.808。最佳分数的标准误是 0.010。按 one-standard-error rule，应该保留哪个最简单的模型？

打开 →

题目1762 · 统计

一阶效应太小，就是弱工具变量警告

两个候选 rollout 对 PnL 的 reduced-form 影响相同： $$E[Y\mid Z=1]-E[Y\mid Z=0]=0.02。$$ 其中 rollout A 的 first stage 是 $0.20$，rollout B 的 first stage 是 $0.01$。哪一个设计的工具变量更弱？为什么？

打开 →

题目4396 · 机器学习

下一交易日日内标签 6

如果今天收盘价是 100，明天开盘价是 98，明天收盘价是 99，那么在明天收盘后可见的“下一交易日日内收益”标签是多少？

打开 →

题目4373 · 机器学习

不同保留比例下的训练节省 8

successive halving 从 64 个配置开始。比较两种总共 3 轮的保留策略：每轮保留一半 vs 每轮保留四分之一。后者会少训练多少次模型？

打开 →

题目2427 · 机器学习

不对称分类代价下的最优阈值

一次假阴性的代价是 5，一次假阳性的代价是 1。若 p 是正类的预测概率，那么当 p 高于什么阈值时，应把样本判成正类？

打开 →

题目1713 · 统计

不显著不等于没效果

一个小盘执行试点报告 p = 0.18，备注里写着“没有效果，所以应该停掉项目”。为什么这个结论太强？

打开 →