第 68 / 87 页
非代码面试题
显示 20 / 1721 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
5021由 EM 均值更新反推缺失观测 6某高斯混合模型在 M 步把一个分量的均值更新为 0.875。有三个观测以责任度 0.8、0.6 和 0.1 贡献给该分量。已知其中两个观测值为 0 和 1,第三个观测 x 在日志里缺失。由更新后的均值可反推出 x 是多少?机器学习中等数值题未尝试面试订阅5023由 EM 均值更新反推缺失观测 8某高斯混合模型在 M 步把一个分量的均值更新为 0.4。有三个观测以责任度 0.4、0.4 和 0.2 贡献给该分量。已知其中两个观测值为 -1 和 1,第三个观测 x 在日志里缺失。由更新后的均值可反推出 x 是多少?机器学习中等数值题未尝试面试订阅5026由更新后的混合权重反推有效成员数 11一次 EM 拟合使用了 80 个观测,而在 M 步之后某个分量的更新权重为 0.35。分配给该分量的总责任度质量是多少?机器学习简单数值题未尝试面试订阅5041反推缺失折的性能差 1一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.02, 0.01, -0.01, 0.03]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5042反推缺失折的性能差 2一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.05, 0.02, 0.04, -0.01]。交易台报告说 5 折的总体平均差为 0.026。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5043反推缺失折的性能差 3一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[-0.02, 0.01, 0.0, -0.01]。交易台报告说 5 折的总体平均差为 0.002。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5044反推缺失折的性能差 4一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.01, 0.01, 0.02, 0.0]。交易台报告说 5 折的总体平均差为 0.014。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5045反推缺失折的性能差 5一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.04, -0.02, 0.01, 0.02]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5046由 McNemar 摘要反推不一致计数 6两个分类器在同一测试集上比较。已知不一致样本总数为 b+c=16,且模型 A 更好,因此 b>c。同时连续性修正后的 McNemar 统计量为 3.0625。由此隐含的 (b,c) 是多少?机器学习中等数值题未尝试面试订阅5051成本敏感部署选择 11模型 A 在验证集上产生 8 个假阳性和 2 个假阴性;模型 B 产生 6 个假阳性和 5 个假阴性。若一个假阴性的成本是 10,一个假阳性的成本是 1,哪一个模型的验证成本更低?两者成本分别是多少?机器学习中等数值题未尝试面试订阅5066由 Bellman 价值反推自循环概率 1在固定策略下,状态 s 每一步都会给出即时奖励 1。下一步以概率 p 回到 s,否则回合结束。若折扣因子为 0.9,且状态价值被报告为 V(s)=2.5,由此隐含的 p 是多少?机器学习简单数值题未尝试面试订阅5067由 Bellman 价值反推自循环概率 2在固定策略下,状态 s 每一步都会给出即时奖励 0.5。下一步以概率 p 回到 s,否则回合结束。若折扣因子为 0.95,且状态价值被报告为 V(s)=2,由此隐含的 p 是多少?机器学习简单数值题未尝试面试订阅5068由 Bellman 价值反推自循环概率 3在固定策略下,状态 s 每一步都会给出即时奖励 2。下一步以概率 p 回到 s,否则回合结束。若折扣因子为 0.8,且状态价值被报告为 V(s)=4,由此隐含的 p 是多少?机器学习简单数值题未尝试面试订阅5069由 Bellman 价值反推自循环概率 4在固定策略下,状态 s 每一步都会给出即时奖励 1.2。下一步以概率 p 回到 s,否则回合结束。若折扣因子为 0.85,且状态价值被报告为 V(s)=2.4,由此隐含的 p 是多少?机器学习简单数值题未尝试面试订阅5071由 Q-learning 更新反推未来最优值 6一次表格型 Q-learning 从旧值 Q=0.2 开始,使用学习率 alpha=1、奖励 0.5、折扣因子 gamma=0.9。更新后 Q 值变为 2.9。算法隐含使用的 max a' Q(s',a') 是多少?机器学习简单数值题未尝试面试订阅5072由 Q-learning 更新反推未来最优值 7一次表格型 Q-learning 从旧值 Q=1.1 开始,使用学习率 alpha=0.5、奖励 0.2、折扣因子 gamma=0.8。更新后 Q 值变为 1.6。算法隐含使用的 max a' Q(s',a') 是多少?机器学习简单数值题未尝试面试订阅5073由 Q-learning 更新反推未来最优值 8一次表格型 Q-learning 从旧值 Q=-0.4 开始,使用学习率 alpha=0.25、奖励 1、折扣因子 gamma=0.95。更新后 Q 值变为 1.2。算法隐含使用的 max a' Q(s',a') 是多少?机器学习简单数值题未尝试面试订阅5074由 Q-learning 更新反推未来最优值 9一次表格型 Q-learning 从旧值 Q=0.7 开始,使用学习率 alpha=0.4、奖励 0.3、折扣因子 gamma=0.9。更新后 Q 值变为 2。算法隐含使用的 max a' Q(s',a') 是多少?机器学习简单数值题未尝试面试订阅5075由 Q-learning 更新反推未来最优值 10一次表格型 Q-learning 从旧值 Q=0 开始,使用学习率 alpha=0.5、奖励 0.1、折扣因子 gamma=0.99。更新后 Q 值变为 3。算法隐含使用的 max a' Q(s',a') 是多少?机器学习简单数值题未尝试面试订阅5076选择贪心备份动作 11在某个状态中,动作 1 先给出即时奖励 0.6,之后以概率 0.4 转到价值为 3 的状态,否则转到价值为 1 的状态。动作 2 先给出即时奖励 0.9,之后以概率 0.1 转到价值为 0.2 的状态,否则转到价值为 2 的状态。若 gamma=0.9,哪一个动作是贪心动作?对应的备份值是多少?机器学习中等数值题未尝试面试订阅