INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
1721

55 / 87

非代码面试题

显示 20 / 1721 道匹配题目

答题状态:未尝试未正确已正确
4178裁剪再标准化 3一笔原始日收益 4.8% 先被 winsorize 到区间 [-3%, 3%],再用滚动均值 0.5% 和滚动标准差 1.0% 做标准化。最后得到的 z-score 特征是多少?机器学习简单数值题未尝试面试订阅4179对成交量做 log1p 变换 4某个流动性特征使用 log1p(volume)。如果今天成交量是 999999 股,应该存下什么变换后的值?机器学习简单数值题未尝试面试订阅4180无泄漏滚动均值特征 5在今天开盘时,你要用最近 4 个已经完成的日收益 [1.0%, -2.0%, 0.5%, 1.5%] 构造一个无泄漏的滚动均值特征。应使用什么数值?机器学习简单数值题未尝试面试订阅4191多项式核值 1使用多项式核 K(x,z)=(x·z+1) 2,求 K((1,2),(2,0))。机器学习中等数值题未尝试面试订阅4192RBF 核相似度 2一个 RBF SVM 使用 K(x,z)=exp(-γ||x-z|| 2),其中 γ=0.5。若 ||x-z|| 2=4,得到的核相似度是多少?机器学习中等数值题未尝试面试订阅4193铰链损失 3对一个软间隔 SVM,某训练点的标签 y=1,模型得分 f(x)=0.3。它产生的铰链损失 max(0,1-yf(x)) 是多少?机器学习中等数值题未尝试面试订阅4194单点惩罚项 4一个软间隔 SVM 的目标函数为 0.5||w|| 2 + C Σ hinge i。如果某个样本的 hinge loss 为 1.2,且 C=2,这个样本会给目标函数增加多少惩罚项?机器学习中等数值题未尝试面试订阅4195几何间隔宽度 5如果一个线性 SVM 的 ||w||=5,那么几何间隔宽度 2/||w|| 是多少?机器学习中等数值题未尝试面试订阅4196支持向量打分 6某个核 SVM 在测试点上的两个支持向量有符号贡献分别为 +1.2 和 -0.4,偏置项为 -0.1。最终得分和预测类别是什么?机器学习中等数值题未尝试面试订阅4198三次多项式核值 8使用三次多项式核 K(x,z)=(x·z+1) 3,求 K((1,1),(2,-1))。机器学习中等数值题未尝试面试订阅4216归一化 MDI 占比 1一个随机森林报告的平均不纯度下降总贡献为 spread=0.42, imbalance=0.21, id bucket=0.07。问归一化后的特征重要性占比分别是多少?哪一个特征排第一?机器学习简单数值题未尝试面试订阅4217置换重要性与排序 1一个模型的基准验证集 AUC 是 0.62。分别置换三个特征后,AUC 变成:value signal 对应 0.57,momentum 对应 0.60,zip code 对应 0.61。它们的置换重要性下降是多少?谁排第一?机器学习简单数值题未尝试面试订阅4218聚合 one-hot 特征组 2一个 sector 特征被拆成三个 one-hot 列,它们的 impurity-gain 重要性分别是 0.04、0.03 和 0.01。另外两个特征的重要性分别是 0.05 和 0.07。如果把这三个 one-hot 列聚合成一个组,那么各组的归一化占比分别是多少?谁排第一?机器学习简单数值题未尝试面试订阅4219跨树汇总 gain 重要性 3两棵树分别给特征 A 和 B 带来 split gain。Tree 1 的贡献是 A=12、B=5;Tree 2 的贡献是 A=8、B=10。A 和 B 的总归一化 gain 重要性各是多少?机器学习简单数值题未尝试面试订阅4220以 log loss 衡量置换重要性 4一个模型的基准 log loss 是 0.400。置换特征 X 后,log loss 升到 0.455;置换特征 Y 后,升到 0.420。按 log loss 指标定义,它们的置换重要性各是多少?哪个更重要?机器学习简单数值题未尝试面试订阅4221分组置换降幅模式 1一个模型的验证准确率原本是 0.82。只打乱特征 X1 后降到 0.79,只打乱 X2 后降到 0.8,把二者一起打乱后降到 0.7。问这三种重要性降幅各是多少?这说明了什么模式?机器学习中等数值题未尝试面试订阅4223移除相关特征后的重要性变化 6某模型的基准 AUC 为 0.70。在存在一个高相关孪生特征时,置换特征 A 会把 AUC 降到 0.64;删掉这个孪生特征后,置换 A 会把 AUC 降到 0.58。特征 A 的置换重要性增加了多少?机器学习中等数值题未尝试面试订阅4224限制树深后的新占比 7某个基于 impurity 的特征排名原本是 id hash=0.40、signal 1=0.35、signal 2=0.25。限制 max depth 之后,id hash 的原始 gain 减半,而其他 raw gain 保持不变。新的归一化份额是多少?机器学习中等数值题未尝试面试订阅4225不同基准下的相对退化 8某个特征的置换重要性定义为“基准准确率减去置换后的准确率”。在验证集 A 上,这两个数是 0.80 和 0.78;在更嘈杂的验证集 B 上,它们是 0.74 和 0.72。两种情况下,相对退化占基准的比例各是多少?机器学习中等数值题未尝试面试订阅4241PCA 主方向 1一个已经中心化的双特征数据集,其协方差矩阵为 [[4.2, 1.6], [1.6, 1.8]]。第一主成分方向及其方差是多少?机器学习中等数值题未尝试面试订阅