第 9 / 21 页
非代码面试题
显示 20 / 420 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
4344ECE 分箱计算 4使用等样本权重的 expected calibration error。现在有两个非空分箱:A 箱的预测概率是 [0.2, 0.3],标签是 [0, 1];B 箱的预测概率是 [0.8, 0.9],标签是 [1, 1]。按 ECE = 各箱 (样本占比)*|平均置信度 - 准确率| 计算,结果是多少?机器学习简单数值题未尝试面试订阅4345校准概率对应的期望正例数 5某个模型对一个包含 200 个标的的分组给出的平均预测概率是 0.18。如果模型是校准的,那么这个分组里平均应出现多少个正例?机器学习简单数值题未尝试面试订阅4346由 ROC 点映射到 PR 点 6在某个阈值下,正例流行率是 5%,TPR 是 80%,FPR 是 10%。这个 ROC 空间中的点对应到 PR 空间时,(recall, precision) 是什么?机器学习中等数值题未尝试面试订阅4347总体平均概率对应的期望正例 7在 500 个样本上,一个校准模型的平均预测概率是 0.12。总体上平均应出现多少个正例?机器学习中等数值题未尝试面试订阅4348整体校准偏差 8在一个验证集上,模型的平均预测概率是 9%,而实际正例比例是 6%。这意味着多大的整体校准偏差(calibration-in-the-large error)?机器学习中等数值题未尝试面试订阅4349按错判成本算期望损失 9某个阈值规则运行在一个正例流行率为 10% 的样本空间里,其 TPR 为 70%,FPR 为 5%。若漏判一个正例的成本是 4,误报一个负例的成本是 1,那么每个样本的期望错判成本是多少?机器学习中等数值题未尝试面试订阅4350分箱经验频率与平均预测的偏差 10某个校准分箱包含 80 个标的,平均预测概率为 0.35。如果实际只观察到 20 个正例,那么这个分箱的经验正例率是多少?它相对平均预测低了多少个百分点?机器学习中等数值题未尝试面试订阅4351非对称代价阈值选择 1同一个分类器的三个候选阈值表现为:t=0.3 -> FP=18, FN=4; t=0.5 -> FP=9, FN=7; t=0.7 -> FP=4, FN=14。若一次 false negative 的代价是 5,一次 false positive 的代价是 1,哪个阈值在这个样本上使分类总成本最小?机器学习中等数值题未尝试面试订阅4371更密的对数网格带来多少额外训练 6某个正则强度 C 的搜索网格从 5 个对数间隔值扩展到 9 个,而其他设置不变。若另一个超参数有 4 个取值,并使用 6 折交叉验证,那么更密的 C 网格会额外带来多少次模型训练?机器学习中等数值题未尝试面试订阅4372随机搜索命中好区域的概率 7某个随机搜索会独立抽取 20 个配置,而真正好的区域占整个超参数空间的 8%。至少命中一次该区域的概率是多少?机器学习中等数值题未尝试面试订阅4373不同保留比例下的训练节省 8successive halving 从 64 个配置开始。比较两种总共 3 轮的保留策略:每轮保留一半 vs 每轮保留四分之一。后者会少训练多少次模型?机器学习中等数值题未尝试面试订阅4374折数减半带来的训练节省 9一次调参运行要测试 30 个配置。如果在配置集合不变的情况下,把 10 折交叉验证改成 5 折,会节省多少次模型训练?机器学习中等数值题未尝试面试订阅4375预算增加后的额外耗时 10某个随机搜索的预算从 40 个配置增加到 55 个。每个配置都使用 4 折交叉验证,并且每次训练耗时 12 分钟。如果串行执行,这会额外增加多少训练时间?机器学习中等数值题未尝试面试订阅4381时段差异很大时的第一反应 16由于不同时间段的行为差异很大,各个 fold 的分数波动剧烈。在轻信一个平均 CV 分数之前,调参时首先该考虑什么?机器学习中等essay未尝试面试订阅4382最优点落在边界时下一步做什么 17当前搜索里,最优分数出现在正则强度网格的最大取值上。这通常说明下一步应该做什么?机器学习中等essay未尝试面试订阅4383训练升验证平时的调参方向 18随着模型容量增加,训练表现持续提高,但验证表现基本不动。从调参角度看,下一步更应该往什么方向测试?机器学习中等essay未尝试面试订阅4384好区域很宽时还要不要加密搜索 19某次 random search 在一个很宽的超参数区域里都不断找到相近的好结果。这通常说明把那个区域的搜索网格继续大幅加密,边际价值如何?机器学习中等essay未尝试面试订阅4385单个小 fold 主导波动时先改什么 20如果某个交叉验证 fold 明显比其他 fold 小得多,并且主导了平均分的波动,那么调参时首先该处理什么设计问题?机器学习中等essay未尝试面试订阅4396下一交易日日内标签 6如果今天收盘价是 100,明天开盘价是 98,明天收盘价是 99,那么在明天收盘后可见的“下一交易日日内收益”标签是多少?机器学习简单数值题未尝试面试订阅4397横截面去均值收益 7某个资产今天的收益是 1.2%,而其所在股票池的横截面平均收益是 0.4%。这个资产对应的 demeaned return 特征是多少?机器学习简单数值题未尝试面试订阅