第 3 / 17 页
非代码面试题
显示 20 / 333 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
1714为什么“边看边停”会放大假阳性某 PM 每小时都看一次 p 值,只要发现 p < 0.05 就立刻停止实验。为什么这种做法会放大假阳性?统计中等essay未尝试面试订阅1715交易场景里的“检察官谬误”某种异常形态在正常交易日里只会以 1/10,000 的概率出现。模型发现今天出现了这种形态,于是有人断言原假设几乎肯定是假的。这里忽略了哪个关键的基率问题?统计中等essay未尝试面试订阅1716复现概率不是 1 - p某研究员说:“这个 alpha 的 p 值是 0.04,因此它下季度复现的概率有 96%。” 为什么这种解释无效?统计简单essay未尝试免费1717显著但商业上仍不确定一个路由微调方案的 p 值是 0.01,但其年节省额的 95% 置信区间为 [10k, 1.2m]。为什么团队仍应谨慎?统计简单essay未尝试免费1718从 50 个结果里挑最小 p 值为什么会误导研究员测试了 50 个候选特征,只报告其中 p 值最小的一个,而这个最小 p 值恰好是 0.01。为什么把这个 0.01 当成单个预先指定检验的结果来解读会有误导性?统计中等essay未尝试面试订阅17190.049 与 0.051 的决策悬崖两个回测几乎相同:一个报告 p = 0.049,另一个报告 p = 0.051。为什么仅仅因为一个低于 0.05、另一个高于 0.05,就把前者叫做“真的”、后者叫做“不真的”是糟糕做法?统计简单essay未尝试免费1720低先验概率下的阳性结果可信度假设被测试的交易想法里,真正有预测力的只有 1%。某个检验流程的 power 为 80%,假阳性率为 5%。在得到一个“阳性结果”的条件下,其中真正有效的比例是多少?统计中等derivation未尝试面试订阅1721看完数据再改成单侧检验为什么不对某个双侧检验没有显著,但估计系数的符号恰好符合预期。于是分析师转而报告单侧 p 值。为什么如果方向是在看完数据后才决定的,这种做法是不合适的?统计中等essay未尝试面试订阅1722挑选端点汇报一份报告测试了 12 个策略诊断指标,却只重点展示 p = 0.02 的那一个。评审应指出什么陷阱?统计简单essay未尝试免费1723低功效下的赢家诅咒一个稀疏信号库在很短的样本上被筛选,最终留下的信号虽然显著,但来自功效很低的环境。为什么应当对它的样本内效应量保持怀疑?统计中等essay未尝试面试订阅1724条件方向错误某位评审写道:“p = 0.07 表明零假设为真的概率是 7%。” 这里的条件方向哪里错了?统计简单essay未尝试免费1725未拒绝不等于接受某实验在 5% 水平下未能拒绝零假设。团队于是写道“零假设被接受了”。正确的修正应该是什么?统计简单essay未尝试免费1756由斜率回落反推遗漏协方差某交易台把滑点 Y 回归在库存压力 X 上。不加入紧急度控制时,X 的 OLS 斜率是 0.90;加入一个对紧急度 U 的完美观测后,斜率降到 0.60。设结构模型为 Y = beta X + 0.5 U + noise,并且 Var(X)=1。问 Cov(X,U) 等于多少?统计简单derivation未尝试免费1757由两次衰减斜率反推信噪比潜在因子 X* 被观测两次:X1 = X* + e1,X2 = X* + e2,其中 e1 与 e2 是方差相同的独立经典测量误差,并且都与 X* 独立。用 X1 单独回归 Y 得到斜率 0.80;用平均值 (X1+X2)/2 回归 Y 得到斜率 1.00。若两次回归的真实结构斜率 beta 相同,问 Var(X*)/Var(e) 等于多少?统计简单derivation未尝试免费1758只看幸存策略时的选择偏差某交易台只会记录那些先通过内部回测门槛的策略在上线之后的表现。为什么只在“被上线”的策略集合内,用真实表现去回归回测分数,通常无法恢复无条件关系?统计中等derivation未尝试面试订阅1759把两个带噪测量取平均以后会怎样仍然考虑结构模型 Y=2X+u 且 E[u\mid X]=0,但现在你能观察到两个带噪代理变量: W 1=X+\eta 1, \qquad W 2=X+\eta 2, 其中 \eta 1,\eta 2 相互独立,也与 X,u 独立。设 Var (X)=4,两个噪声项的方差都为 1。 如果把 Y 回归到平均代理变量 W=(W 1+W 2)/2 上,斜率的概率极限是多少?统计中等derivation未尝试面试订阅1760带显式符号约定的 Wald 比率某交易所延迟冲击 Z∈ 0,1 会把激进下单比例从 Z=0 时的 0.30 变成 Z=1 时的 0.18,并把平均滑点从 Z=0 时的 4.2bp 变成 Z=1 时的 5.4bp。若采用一致方向的 Delta Y / Delta X = (E[Y|Z=1]-E[Y|Z=0]) / (E[X|Z=1]-E[X|Z=0]),那么“激进下单比例每增加 1 个单位,滑点变化多少”的 Wald IV 估计是多少?统计中等derivation未尝试面试订阅1761拆分路由中介渠道后的直接效应与总效应某路由信号 X 平均会把子单碎片化程度 M 提高 2 个单位。结果变量满足 Y = 1.3 X + 0.4 M + noise,并且除此之外 X 是外生的。如果在回归中控制 M,X 的系数应是多少?如果只把 Y 回归在 X 上,一单位 X 的总效应又是多少?统计简单derivation未尝试免费1762一阶效应太小,就是弱工具变量警告两个候选 rollout 对 PnL 的 reduced-form 影响相同: E[Y\mid Z=1]-E[Y\mid Z=0]=0.02。 其中 rollout A 的 first stage 是 0.20,rollout B 的 first stage 是 0.01。 哪一个设计的工具变量更弱?为什么?统计中等multi part未尝试面试订阅1763哪个候选工具变量更站得住脚你想估计报价更新强度 X 对已实现点差捕获 Y 的因果效应。 候选工具变量 A 是交易所随机分配的网关方案。候选工具变量 B 是同日订单流失衡,而它本身也会直接影响点差捕获。 哪个候选工具变量更合理?另一个候选工具变量违反了哪条 IV 条件?统计中等multi part未尝试面试订阅