INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
60

2 / 3

非代码面试题

显示 20 / 60 道匹配题目

答题状态:未尝试未正确已正确
1701让三个主题都通过 Holm 所需的改进幅度三个按从小到大排序的家族 p 值分别是 0.012、0.027 和 0.030。交易台在 5% 的整体族误差率下使用 Holm 程序。要让三个主题都通过,中间那个 p 值至少要下降多少?统计中等derivation未尝试面试订阅170225 次零假设试验中最小 p 值的中位数某研究员总是从 25 个真正零假设的回测里,挑出最小的 p 值来汇报。若在零假设下这些 p 值独立且精确服从 Uniform(0,1),这个“最小 p 值”的中位数是多少?统计简单derivation未尝试免费1703全年策略挖掘会带来多少假阳性?假设你每天都测试 20 条纯噪声交易规则,一年按 252 个交易日计算,每次都用 5% 显著性水平且不做任何校正。 那么全年期望会出现多少个假阳性?统计简单derivation未尝试免费170410 个滞后搜索后所需的样本内筛选阈值某交易台对一个真正无效的信号尝试 10 个滞后设定。只要任一滞后的样本内 p 值低于 alpha,它就保留其中最优的那个滞后,并再要求一次新的样本外 p 值低于 10%。假设零假设下各检验独立,要使整体伪上线概率恰好为 2%,alpha 应取多少?统计简单derivation未尝试免费1705大规模探索性筛选更适合 FWER 还是 FDR?你正在筛选 500 个候选 alpha,最终真正能进入实盘的可能只有很少几个。在这种探索性场景下,通常更适合先用 FWER 控制还是 FDR 控制?为什么?统计中等essay未尝试面试订阅1706为什么相关性改变的是调整方式,而不是问题本身某位 PM 检验了 40 个信号,但这些信号实际上都建立在少数几个共同的宏观主题上,因此 p 值高度相关。为什么“直接把 alpha 除以 40”通常过于粗糙?正确的概念性处理方式是什么?统计简单essay未尝试免费1707为什么分层检验能减轻多重比较负担研究员先检验某个行业整体是否有效,只有行业层面通过后才继续检验该行业内部的股票。为什么这种分层设计有助于减轻多重比较带来的负担?统计中等essay未尝试面试订阅1708BH 过程到底控制的是什么在目标 q=0.10 的 Benjamini-Hochberg 过程中,你最终拒绝了 5 个假设。这个方法是否保证这 5 个里面恰好有 10% 是假发现?统计中等essay未尝试面试订阅1709相关性会降低“有效检验个数”假设 100 个候选因子其实可以归成大约 20 组,每组内部信号都高度相似。与 100 个真正独立的检验相比,这对多重比较问题会产生什么定性影响?统计中等essay未尝试面试订阅1710由单桶阈值反推的整体误差率某交易台在 20 个彼此独立的事件桶上统一使用 0.0045 的单桶阈值。这样对应的整体族误报概率是多少?统计中等derivation未尝试面试订阅1711回测汇报误读 p = 0.03某 PM 汇报写道:“事件研究的 p 值是 0.03,因此这个信号有 97% 的概率是真的。” 这里的统计错误是什么?统计简单essay未尝试免费1712统计显著不等于经济显著在数百万个观测上,某策略的平均优势被估计为 0.2 个基点,而且在统计上高度显著。为什么仅凭“高度显著”还不足以说明这个策略具有经济意义?统计简单essay未尝试免费1713不显著不等于没效果一个小盘执行试点报告 p = 0.18,备注里写着“没有效果,所以应该停掉项目”。为什么这个结论太强?统计简单essay未尝试免费1714为什么“边看边停”会放大假阳性某 PM 每小时都看一次 p 值,只要发现 p < 0.05 就立刻停止实验。为什么这种做法会放大假阳性?统计中等essay未尝试面试订阅1715交易场景里的“检察官谬误”某种异常形态在正常交易日里只会以 1/10,000 的概率出现。模型发现今天出现了这种形态,于是有人断言原假设几乎肯定是假的。这里忽略了哪个关键的基率问题?统计中等essay未尝试面试订阅1716复现概率不是 1 - p某研究员说:“这个 alpha 的 p 值是 0.04,因此它下季度复现的概率有 96%。” 为什么这种解释无效?统计简单essay未尝试免费1717显著但商业上仍不确定一个路由微调方案的 p 值是 0.01,但其年节省额的 95% 置信区间为 [10k, 1.2m]。为什么团队仍应谨慎?统计简单essay未尝试免费1718从 50 个结果里挑最小 p 值为什么会误导研究员测试了 50 个候选特征,只报告其中 p 值最小的一个,而这个最小 p 值恰好是 0.01。为什么把这个 0.01 当成单个预先指定检验的结果来解读会有误导性?统计中等essay未尝试面试订阅17190.049 与 0.051 的决策悬崖两个回测几乎相同:一个报告 p = 0.049,另一个报告 p = 0.051。为什么仅仅因为一个低于 0.05、另一个高于 0.05,就把前者叫做“真的”、后者叫做“不真的”是糟糕做法?统计简单essay未尝试免费1720低先验概率下的阳性结果可信度假设被测试的交易想法里,真正有预测力的只有 1%。某个检验流程的 power 为 80%,假阳性率为 5%。在得到一个“阳性结果”的条件下,其中真正有效的比例是多少?统计中等derivation未尝试面试订阅