第 2 / 4 页
非代码面试题
显示 20 / 64 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
3440为什么熵可以被理解为平均惊讶度为什么熵常常被描述成一个源的平均惊讶度?数学中等essay未尝试面试订阅344170% 事件上的基准率预测惩罚某个二元事件的真实发生概率是 0.7。一个预测却使用了 0.55 而不是真实概率。相对于校准预测,这会多付出多少 bit 的期望对数损失?数学困难derivation未尝试面试订阅3446噪声方差为 4 的信号互信息隐藏的高斯 alpha X ~ N(0,1) 通过 Y = X + eps 被观察到,其中 eps ~ N(0,4)。Y 关于 X 携带多少 bit 的互信息?数学中等derivation未尝试面试订阅3447信号方差为 2、噪声方差为 6 时的互信息一个隐藏高斯因子的方差是 2,观测噪声方差是 6。一次观测关于该因子携带多少 bit 的互信息?数学困难derivation未尝试面试订阅3448第二个独立传感器带来的增量信息隐藏变量 X ~ N(0,1) 通过两个条件独立的传感器被观测,噪声方差分别为 4 和 9。在已经看过第一个传感器之后,再加入第二个传感器会多带来多少 bit 的信息?数学中等derivation未尝试面试订阅3449达到 0.25 bit 信息量所需的噪声方差隐藏变量 X ~ N(0,1) 通过 Y = X + eps 被观测,其中 eps ~ N(0,sigma 2)。要让互信息恰好等于 0.25 bit,需要什么 sigma 2?数学中等derivation未尝试面试订阅3450达到总信息量 0.4 bit 所需的第二个传感器噪声隐藏变量 X ~ N(0,1) 已经被一个噪声方差为 3 的传感器观测。现在再加一个噪声方差为 v 的独立传感器。要让总互信息达到 0.4 bit,需要什么 v?数学中等derivation未尝试面试订阅3451非对称二元告警的互信息隐藏状态 R 取 1 的概率为 0.3。告警变量 Y 的命中率为 0.8,误报率为 0.2。Y 关于 R 携带多少 bit 的互信息?数学简单derivation未尝试面试订阅3452高质量告警触发后后验与先验之间的 KL某个状态的先验概率是 0.1。告警的命中率为 0.9,误报率为 0.05。若告警真的触发,状态后验相对于先验的 KL 散度是多少 bit?数学简单derivation未尝试面试订阅3454两个状态下信号分布之间的 KL二元信号 Y 满足 P(Y=1|R=1) = 0.8、P(Y=1|R=0) = 0.3。KL(P(Y|R=1) || P(Y|R=0)) 等于多少 bit?数学中等derivation未尝试面试订阅3455未触发告警时后验与先验之间的 KL某个状态的先验概率是 0.25。告警的命中率为 0.85,误报率为 0.15。若没有触发告警,状态后验相对于先验的 KL 散度是多少 bit?数学困难derivation未尝试面试订阅3456为什么 KL 是失配校准的自然代价在概率预测里,为什么 KL 散度会自然地表现成“用错预测分布”所付出的代价?数学中等essay未尝试面试订阅3457为什么一个有用信号的互信息仍可能很小请给出一个清晰理由:为什么在稀有事件问题里,一个信号可能在经济上有用,但互信息仍然只有很少几个 bit?数学中等essay未尝试面试订阅3458把数据处理不等式看成信息预算为什么把一个预测分数粗化成少数几个桶,最好理解为“花掉了一部分信息预算”?数学中等essay未尝试面试订阅3459为什么两个高度相关的信号几乎不增加互信息为什么第二个大体上只是重复第一个的预测通道,通常只会额外提供很少的互信息?数学中等essay未尝试面试订阅3460为什么 KL 虽然不对称却仍然有用KL 散度不是对称的。为什么在预测问题里,这种不对称不是缺陷,反而是合理的?数学中等essay未尝试面试订阅3461为什么对数损失提升可以很小但仍然真实一个新模型只让平均对数损失略有改善。为什么这仍可能对应于真实的信息质量提升?数学中等essay未尝试面试订阅3463什么时候高斯 MI 公式是合理近似为什么量化研究里常常会把高斯互信息公式当成一个快速近似,即便真实信号并不完全高斯?数学中等essay未尝试面试订阅3464为什么标签泄漏会让互信息看起来异常夸张为什么标签泄漏或前视信息会让估计出来的互信息在样本内看起来特别大,但到了样本外却会消失?数学中等essay未尝试面试订阅3465为什么条件 KL 和无条件 MI 不是一回事请用一段清晰的话解释:一次具体观测之后后验与先验之间的 KL,为什么不是和无条件互信息同一个对象?数学中等essay未尝试面试订阅