第 11 / 14 页
非代码面试题
显示 20 / 268 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2646嵌套交叉验证中的模型拟合次数某团队使用 5 个外层折。在每个外层训练集内部,他们用 4 折 CV 评估 6 组超参数,随后再用整个外层训练集把选中的模型重拟合一次。总共会发生多少次模型拟合?机器学习简单数值题未尝试免费2647为什么重复实体数据更适合分组 CV为什么当每个实体会反复出现、模型还能识别实体特征时,按行做交叉验证并不合适?机器学习中等essay未尝试免费2651为什么重复 CV 的多次结果不是独立实验为什么从业者不应该把 20 次重复 CV 的得分当成 20 个相互独立的实验?机器学习简单essay未尝试免费2656标签窗口重叠时为什么不能随机按行做 CV如果每个标签都依赖未来 5 个交易日,而相邻样本的标签窗口彼此重叠,为什么普通的按行随机交叉验证会严重高估表现?机器学习简单essay未尝试免费2657为什么折间波动不等于部署误差的标准误为什么各折得分的标准差,不能自动被解释成未来生产表现的标准误?机器学习简单essay未尝试免费2661为什么时间序列 CV 的重点是信息可得性,而不是日历洁癖为什么时间序列 CV 真正的原则是“永远不要用未来信息训练”,而不是“永远采用某种固定折几何”?机器学习简单essay未尝试免费2663为什么跨不同折规则直接比较 CV 得分会误导为什么把某个模型在随机 k 折上的得分,和另一个模型在分组或分块 CV 上的得分直接相比,是危险的?机器学习中等essay未尝试面试订阅2666为什么外层折之间的分歧本身就有信息如果嵌套 CV 的不同外层折总是选出不同的超参数,这通常说明了什么?机器学习简单essay未尝试免费2667面对重复实体时,按类别分层还不够当同一发行人反复出现且发行人身份本身带有预测信息时,为什么按类别分层的交叉验证仍然可能失败得很厉害?机器学习简单essay未尝试免费2670为什么最佳 CV 设计取决于部署单元为什么折分规则应该去贴近模型在生产环境里真正需要泛化的那个单元?机器学习困难essay未尝试面试订阅2681为什么上线部署会改变生成标签的环境为什么一个在回测里看起来有预测力的模型,一旦交易台真的开始按它交易,预测力反而可能下降?机器学习简单essay未尝试免费2691为什么更多面板数据也解决不了状态漂移为什么增加更多证券或更多公司,并不能自动解决时间上的状态漂移问题?机器学习简单essay未尝试免费2706为什么“没碰过的留出集”一旦反复看就不再没碰过为什么研究者在想法迭代过程中反复查看最终留出集后,它就失去了原本的证据价值?机器学习简单essay未尝试面试订阅2707为什么成本假设本身也算超参数为什么在看过回测表现之后再去调整滑点曲线、费用表或融券假设,也算额外的模型搜索?机器学习简单essay未尝试面试订阅2760四家供应商下的一般逆向拍卖报价函数某逆向拍卖中有四家风险中性的供应商,成本独立同分布于 Uniform (0,1)。最低报价者中标并按自己的报价获得支付。推导对称均衡报价函数,并计算成本为 0.3 的供应商应报多少。脑筋急转弯中等derivation未尝试面试订阅2769一般 2x2 零和矩阵的公式对零和矩阵博弈 \[ \begin pmatrix a & b \\ c & d \end pmatrix , \] 假设不存在纯策略鞍点,且 a-b-c+d 0。推导行玩家的混合策略、列玩家的混合策略以及博弈价值。脑筋急转弯困难derivation未尝试面试订阅2867由四阶矩得到的广义 Markov 上界设 X 是任意随机变量,且 E[X 4]=81。请把 Markov 不等式用在一个合适的非负随机变量上,给出 P(|X|\ge 6) 的上界。概率中等derivation未尝试面试订阅2989五段划分中最短一段的期望在区间 [0,1] 上独立均匀抽取四个切点并排序,得到五段。记最短一段长度为 M。求 E[M]。概率困难derivation未尝试面试订阅2990五段划分中最长一段的期望在区间 [0,1] 上独立均匀抽取四个切点并排序,得到五段。记最长一段长度为 L。求 E[L]。概率困难derivation未尝试面试订阅3437为什么粗粒化会降低熵为什么把多个标签合并后,熵通常会下降而不是上升?数学中等essay未尝试面试订阅