第 4 / 6 页
非代码面试题
显示 20 / 108 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2532logistic 负对数似然的 Hessian 4对单个观测,若打分为 z = w T x,则其负对数似然关于 w 的 Hessian 是什么?机器学习简单derivation未尝试免费2534在一个极小逻辑回归问题上做一次梯度更新一个无截距的一维逻辑回归模型初始 beta = 0,学习率为 0.2,数据为 x = [-1, 0, 1],标签为 y = [0, 0, 1]。对负对数似然做一次梯度下降后,beta 变成多少?机器学习困难数值题未尝试面试订阅2535不对称分类代价下的判决阈值某交易台对假阳性的代价为 1,对假阴性的代价为 5。在校准好的逻辑回归概率 p = P(Y=1|x) 下,应该在大于什么阈值时预测类别 1,才能最小化期望代价?机器学习困难derivation未尝试面试订阅2536为什么 softmax 能修复联合归一化 16softmax 相对于 one-vs-rest logistic 自动额外提供了什么?机器学习简单essay未尝试免费2537为什么 logistic 概率对下游有用 18为什么 logistic 回归输出经过校准的概率估计,而不是只给一个硬标签,会很有价值?机器学习中等essay未尝试面试订阅2538为什么训练时 logistic 比硬阈值规则更好 23为什么一个平滑的概率损失,比直接对一个硬分类规则训练更容易优化?机器学习中等essay未尝试免费2540部署先验变化引起的截距修正某个逻辑回归模型是在类别先验 0.5 下训练的,截距为 -0.4。部署时基准率下降到 0.2,并假设特征似然比保持不变。调整后的截距应该是多少?机器学习困难数值题未尝试面试订阅2541单个 logistic 观测的一步梯度更新 22对一个观测,若 x = 2、y = 1、当前权重 w = 0、学习率 eta = 0.4,那么对负对数似然做一步梯度下降更新后的权重是多少?机器学习简单数值题未尝试免费4166中心化与缩放后的系数改写 1一个线性模型是 y = 1.5 + 2 x。现在把特征替换为工程化特征 z=(x-10)/2。问把模型改写成 y = a + b z 时,新的截距和斜率分别是多少?机器学习简单数值题未尝试面试订阅4167中心化与缩放后的系数改写 2一个线性模型是 y = -0.5 + 1.2 x。现在把特征替换为工程化特征 z=(x-5)/0.5。问把模型改写成 y = a + b z 时,新的截距和斜率分别是多少?机器学习简单数值题未尝试面试订阅4171交互特征下的边际效应 1一个模型使用了交互项:y = β0 + 0.8 x1 + β2 x2 + 0.5 x1 x2。当 x2 = 2 时,x1 的边际效应是多少?机器学习中等数值题未尝试面试订阅4172交互特征下的边际效应 2一个模型使用了交互项:y = β0 + -0.2 x1 + β2 x2 + 1.2 x1 x2。当 x2 = -1 时,x1 的边际效应是多少?机器学习中等数值题未尝试面试订阅4176周期时间特征编码 1把一天中的小时 h 编码成 (sin(2πh/24), cos(2πh/24))。当 h=6 时,编码结果是什么?机器学习简单数值题未尝试面试订阅4177独热编码与交互项列数计算一个类别变量有 5 个水平。你对它做去掉基准组的 one-hot 编码,保留一个原始数值特征 x,并再创建 x 与所有保留哑变量的交互项。这个特征块最终一共产生多少列?机器学习简单数值题未尝试面试订阅4178裁剪再标准化 3一笔原始日收益 4.8% 先被 winsorize 到区间 [-3%, 3%],再用滚动均值 0.5% 和滚动标准差 1.0% 做标准化。最后得到的 z-score 特征是多少?机器学习简单数值题未尝试面试订阅4179对成交量做 log1p 变换 4某个流动性特征使用 log1p(volume)。如果今天成交量是 999999 股,应该存下什么变换后的值?机器学习简单数值题未尝试面试订阅4180无泄漏滚动均值特征 5在今天开盘时,你要用最近 4 个已经完成的日收益 [1.0%, -2.0%, 0.5%, 1.5%] 构造一个无泄漏的滚动均值特征。应使用什么数值?机器学习简单数值题未尝试面试订阅4181带前瞻窗口的滚动均值候选人构造了一个“5日均值”,在第 t 天使用从 t-2 到 t+2 的价格。若模型打算在第 t 天收盘时交易,这样做是否有效?机器学习中等derivation未尝试面试订阅4182先标准化再切分训练测试一个流程在划分训练集和测试集之前,先用全量数据的均值和标准差对每个特征做标准化。这样干净吗?机器学习中等derivation未尝试面试订阅4183没有 OOF 逻辑的目标编码一个类别特征先用全样本里该类别的平均标签做 target encoding,然后把这些编码拿去做交叉验证。这样安全吗?机器学习中等derivation未尝试面试订阅