第 79 / 88 页
非代码面试题
显示 20 / 1751 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
4334使用 CNN 之前在把 CNN 作为主要架构之前,你首先应该确认哪种结构性质?机器学习中等essay未尝试面试订阅4335混合结构思维如果你怀疑一个任务既有很强的局部模式,又有偶发的长距离依赖,那么在争论模型家族之前,你第一步应该做什么分解?机器学习中等essay未尝试面试订阅4336为什么 CNN 会赢为什么在一个小样本、标签主要取决于短局部模式的任务上,一个中等规模的 CNN 可能打败更大的 Transformer?机器学习中等essay未尝试面试订阅4337为什么 RNN 仍有价值为什么即使 Transformer 离线 benchmark 更强,生产里的事件流模型仍可能更适合用 RNN?机器学习中等essay未尝试面试订阅4338什么时候注意力值得其成本什么样的任务结构会让注意力的二次成本变得值得?机器学习中等essay未尝试面试订阅4339为什么结构错配很伤为什么在性能很差时,结构错配往往比参数量更致命?机器学习中等essay未尝试面试订阅4340混合结构还是纯结构什么时候比起坚持纯 CNN、纯 RNN 或纯 Transformer,更适合考虑混合架构?机器学习中等essay未尝试面试订阅4341由流行率与 TPR/FPR 推精确率 1在某个固定阈值下,正例流行率为 20%,TPR 为 80%,FPR 为 10%。这对应的 precision 是多少?机器学习简单数值题未尝试面试订阅4342流行率漂移下的 precision 2某个欺诈模型在新市场里仍保持 TPR = 0.90、FPR = 0.03,但正例流行率从 10% 降到了 2%。在同一阈值下,现在应预期什么 precision?机器学习简单数值题未尝试面试订阅4343Brier 分数计算 3预测概率为 [0.8, 0.6, 0.3, 0.1],真实标签为 [1, 0, 1, 0]。Brier score 是多少?机器学习简单数值题未尝试面试订阅4344ECE 分箱计算 4使用等样本权重的 expected calibration error。现在有两个非空分箱:A 箱的预测概率是 [0.2, 0.3],标签是 [0, 1];B 箱的预测概率是 [0.8, 0.9],标签是 [1, 1]。按 ECE = 各箱 (样本占比)*|平均置信度 - 准确率| 计算,结果是多少?机器学习简单数值题未尝试面试订阅4345校准概率对应的期望正例数 5某个模型对一个包含 200 个标的的分组给出的平均预测概率是 0.18。如果模型是校准的,那么这个分组里平均应出现多少个正例?机器学习简单数值题未尝试面试订阅4346由 ROC 点映射到 PR 点 6在某个阈值下,正例流行率是 5%,TPR 是 80%,FPR 是 10%。这个 ROC 空间中的点对应到 PR 空间时,(recall, precision) 是什么?机器学习中等数值题未尝试面试订阅4347总体平均概率对应的期望正例 7在 500 个样本上,一个校准模型的平均预测概率是 0.12。总体上平均应出现多少个正例?机器学习中等数值题未尝试面试订阅4348整体校准偏差 8在一个验证集上,模型的平均预测概率是 9%,而实际正例比例是 6%。这意味着多大的整体校准偏差(calibration-in-the-large error)?机器学习中等数值题未尝试面试订阅4349按错判成本算期望损失 9某个阈值规则运行在一个正例流行率为 10% 的样本空间里,其 TPR 为 70%,FPR 为 5%。若漏判一个正例的成本是 4,误报一个负例的成本是 1,那么每个样本的期望错判成本是多少?机器学习中等数值题未尝试面试订阅4350分箱经验频率与平均预测的偏差 10某个校准分箱包含 80 个标的,平均预测概率为 0.35。如果实际只观察到 20 个正例,那么这个分箱的经验正例率是多少?它相对平均预测低了多少个百分点?机器学习中等数值题未尝试面试订阅4351非对称代价阈值选择 1同一个分类器的三个候选阈值表现为:t=0.3 -> FP=18, FN=4; t=0.5 -> FP=9, FN=7; t=0.7 -> FP=4, FN=14。若一次 false negative 的代价是 5,一次 false positive 的代价是 1,哪个阈值在这个样本上使分类总成本最小?机器学习中等数值题未尝试面试订阅4356排序质量与概率质量的取舍模型 A 的 ROC AUC 略高,但概率明显过度自信;模型 B 的 ROC AUC 略低,但校准明显更好。如果你需要把预测概率直接拿去做头寸规模决策,通常哪个模型更安全?机器学习中等essay未尝试面试订阅4357极端不平衡下的指标选择你在筛查极其罕见的欺诈案例,基准发生率低于 1%。为什么在业务讨论里,PR 分析通常比 ROC 分析更有信息量?机器学习中等essay未尝试面试订阅