INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
4169

42 / 209

非代码面试题

显示 20 / 4169 道匹配题目

答题状态:未尝试未正确已正确
1714为什么“边看边停”会放大假阳性某 PM 每小时都看一次 p 值,只要发现 p < 0.05 就立刻停止实验。为什么这种做法会放大假阳性?统计中等essay未尝试面试订阅1715交易场景里的“检察官谬误”某种异常形态在正常交易日里只会以 1/10,000 的概率出现。模型发现今天出现了这种形态,于是有人断言原假设几乎肯定是假的。这里忽略了哪个关键的基率问题?统计中等essay未尝试面试订阅1716复现概率不是 1 - p某研究员说:“这个 alpha 的 p 值是 0.04,因此它下季度复现的概率有 96%。” 为什么这种解释无效?统计简单essay未尝试免费1717显著但商业上仍不确定一个路由微调方案的 p 值是 0.01,但其年节省额的 95% 置信区间为 [10k, 1.2m]。为什么团队仍应谨慎?统计简单essay未尝试免费1718从 50 个结果里挑最小 p 值为什么会误导研究员测试了 50 个候选特征,只报告其中 p 值最小的一个,而这个最小 p 值恰好是 0.01。为什么把这个 0.01 当成单个预先指定检验的结果来解读会有误导性?统计中等essay未尝试面试订阅17190.049 与 0.051 的决策悬崖两个回测几乎相同:一个报告 p = 0.049,另一个报告 p = 0.051。为什么仅仅因为一个低于 0.05、另一个高于 0.05,就把前者叫做“真的”、后者叫做“不真的”是糟糕做法?统计简单essay未尝试免费1720低先验概率下的阳性结果可信度假设被测试的交易想法里,真正有预测力的只有 1%。某个检验流程的 power 为 80%,假阳性率为 5%。在得到一个“阳性结果”的条件下,其中真正有效的比例是多少?统计中等derivation未尝试面试订阅1721看完数据再改成单侧检验为什么不对某个双侧检验没有显著,但估计系数的符号恰好符合预期。于是分析师转而报告单侧 p 值。为什么如果方向是在看完数据后才决定的,这种做法是不合适的?统计中等essay未尝试面试订阅1722挑选端点汇报一份报告测试了 12 个策略诊断指标,却只重点展示 p = 0.02 的那一个。评审应指出什么陷阱?统计简单essay未尝试免费1723低功效下的赢家诅咒一个稀疏信号库在很短的样本上被筛选,最终留下的信号虽然显著,但来自功效很低的环境。为什么应当对它的样本内效应量保持怀疑?统计中等essay未尝试面试订阅1724条件方向错误某位评审写道:“p = 0.07 表明零假设为真的概率是 7%。” 这里的条件方向哪里错了?统计简单essay未尝试免费1725未拒绝不等于接受某实验在 5% 水平下未能拒绝零假设。团队于是写道“零假设被接受了”。正确的修正应该是什么?统计简单essay未尝试免费1726簇随机化下的设计效应某个实验按门店而不是按顾客做随机化。若平均簇大小为 m,簇内相关系数为 ,方差的标准设计效应倍数是什么?统计中等derivation未尝试面试订阅1727CUPED 式降方差之后的等效样本量某种降方差方法把处理效应估计量的方差缩小到原来的 c 倍,其中 0<c<1。等效样本量会放大多少倍?统计中等derivation未尝试面试订阅1728触发式分析中的曝光比例在被随机化的用户中,只有比例 q 的人真正接触到被测试功能。若处理效应只存在于这些被触发的用户身上,那么 intent-to-treat 效应与 triggered-user 效应之间是什么关系?统计中等derivation未尝试面试订阅1729为什么按会话随机化会在用户层面泄漏为什么当同一个用户会多次回来、并且行为会在会话之间延续时,按会话随机化会具有误导性?统计简单essay未尝试免费1730为什么每天偷看都会破坏固定样本阈值为什么每天都用未调整的固定样本 p 值阈值去查看显著性,会抬高假阳性?统计中等essay未尝试面试订阅1731为什么触发式分析有时优于朴素总体平均为什么触发式分析有时会比在全部随机化用户上直接取平均更干净?统计简单essay未尝试免费1732为什么干扰效应会毁掉用户级随机化为什么在社交产品或双边市场功能上,即使随机分配本身完全正确,实验也可能违背常规随机试验逻辑?统计简单essay未尝试免费1733为什么即使主指标赢了也要看护栏指标为什么即使主指标赢了,如果延迟、投诉或取消率恶化,实验也仍然不能直接上线?统计中等essay未尝试面试订阅