INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 622

第 16 / 32 页

非代码面试题

显示 20 / 622 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4151缺失特征下的生成式分类 1一个两特征的朴素贝叶斯模型采用生成式方式训练，但在预测时 X2 缺失。已知先验 P(Y=1)=0.5，P(X1=1|Y=1)=0.8，P(X1=1|Y=0)=0.3，P(X2=1|Y=1)=0.75，P(X2=1|Y=0)=0.4。现在只观测到 X1=1。问生成式模型应当使用的后验 P(Y=1|X1) 是多少？机器学习中等数值题未尝试面试订阅 4156似然比与先验推出后验决策 11对样本 x，一个生成式模型把证据概括成似然比 p(x|Y=1)/p(x|Y=0) = 5。如果 1 类的先验概率为 0.2，那么后验概率 P(Y=1|x) 是多少？在 0.5 阈值下应如何决策？机器学习中等derivation未尝试面试订阅 4157似然比与先验推出后验决策 12对样本 x，一个生成式模型把证据概括成似然比 p(x|Y=1)/p(x|Y=0) = 0.5。如果 1 类的先验概率为 0.4，那么后验概率 P(Y=1|x) 是多少？在 0.5 阈值下应如何决策？机器学习中等derivation未尝试面试订阅 4161小样本且有结构假设时先选哪类模型 16你手里只有几百个带标签样本，但领域知识给出了比较可信的类条件结构，而且还有很多无标签特征样本。你会先从生成式模型还是判别式模型开始？机器学习中等essay未尝试面试订阅 4162只有先验漂移时哪类模型更好调 17某个分类器是在上季度训练的，现在只有类别出现率变了，而“给定类别时的特征分布形状”看起来仍然稳定。在这种情况下，生成式还是判别式更容易快速调整？机器学习中等essay未尝试面试订阅 4163大样本只求预测时先选哪类模型 18如果你有数百万带标签样本，而且只关心部署标签上的预测精度，并不需要生成 x，那么通常更值得先试哪一侧？机器学习中等essay未尝试面试订阅 4164测试时常缺特征时哪类模型占优 19线上系统在测试时经常会缺失一个传感器特征，但你的模型族可以很干净地分解联合特征似然。在这种情况下，哪一类模型会获得更现实的优势？机器学习中等essay未尝试面试订阅 4165需要按类别生成样本时先选哪类模型 20研究团队不仅想要分类标签，还想在每个类别条件下生成合成特征样本来做压力测试。哪一类模型是更自然的起点？机器学习中等essay未尝试面试订阅 4166中心化与缩放后的系数改写 1一个线性模型是 y = 1.5 + 2 x。现在把特征替换为工程化特征 z=(x-10)/2。问把模型改写成 y = a + b z 时，新的截距和斜率分别是多少？机器学习简单数值题未尝试面试订阅 4167中心化与缩放后的系数改写 2一个线性模型是 y = -0.5 + 1.2 x。现在把特征替换为工程化特征 z=(x-5)/0.5。问把模型改写成 y = a + b z 时，新的截距和斜率分别是多少？机器学习简单数值题未尝试面试订阅 4171交互特征下的边际效应 1一个模型使用了交互项：y = β0 + 0.8 x1 + β2 x2 + 0.5 x1 x2。当 x2 = 2 时，x1 的边际效应是多少？机器学习中等数值题未尝试面试订阅 4172交互特征下的边际效应 2一个模型使用了交互项：y = β0 + -0.2 x1 + β2 x2 + 1.2 x1 x2。当 x2 = -1 时，x1 的边际效应是多少？机器学习中等数值题未尝试面试订阅 4176周期时间特征编码 1把一天中的小时 h 编码成 (sin(2πh/24), cos(2πh/24))。当 h=6 时，编码结果是什么？机器学习简单数值题未尝试面试订阅 4177独热编码与交互项列数计算一个类别变量有 5 个水平。你对它做去掉基准组的 one-hot 编码，保留一个原始数值特征 x，并再创建 x 与所有保留哑变量的交互项。这个特征块最终一共产生多少列？机器学习简单数值题未尝试面试订阅 4178裁剪再标准化 3一笔原始日收益 4.8% 先被 winsorize 到区间 [-3%, 3%]，再用滚动均值 0.5% 和滚动标准差 1.0% 做标准化。最后得到的 z-score 特征是多少？机器学习简单数值题未尝试面试订阅 4179对成交量做 log1p 变换 4某个流动性特征使用 log1p(volume)。如果今天成交量是 999999 股，应该存下什么变换后的值？机器学习简单数值题未尝试面试订阅 4180无泄漏滚动均值特征 5在今天开盘时，你要用最近 4 个已经完成的日收益 [1.0%, -2.0%, 0.5%, 1.5%] 构造一个无泄漏的滚动均值特征。应使用什么数值？机器学习简单数值题未尝试面试订阅 4181带前瞻窗口的滚动均值候选人构造了一个“5日均值”，在第 t 天使用从 t-2 到 t+2 的价格。若模型打算在第 t 天收盘时交易，这样做是否有效？机器学习中等derivation未尝试面试订阅 4182先标准化再切分训练测试一个流程在划分训练集和测试集之前，先用全量数据的均值和标准差对每个特征做标准化。这样干净吗？机器学习中等derivation未尝试面试订阅 4183没有 OOF 逻辑的目标编码一个类别特征先用全样本里该类别的平均标签做 target encoding，然后把这些编码拿去做交叉验证。这样安全吗？机器学习中等derivation未尝试面试订阅