第 19 / 41 页
非代码面试题
显示 20 / 811 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
4166中心化与缩放后的系数改写 1一个线性模型是 y = 1.5 + 2 x。现在把特征替换为工程化特征 z=(x-10)/2。问把模型改写成 y = a + b z 时,新的截距和斜率分别是多少?机器学习简单数值题未尝试面试订阅4167中心化与缩放后的系数改写 2一个线性模型是 y = -0.5 + 1.2 x。现在把特征替换为工程化特征 z=(x-5)/0.5。问把模型改写成 y = a + b z 时,新的截距和斜率分别是多少?机器学习简单数值题未尝试面试订阅4181带前瞻窗口的滚动均值候选人构造了一个“5日均值”,在第 t 天使用从 t-2 到 t+2 的价格。若模型打算在第 t 天收盘时交易,这样做是否有效?机器学习中等derivation未尝试面试订阅4182先标准化再切分训练测试一个流程在划分训练集和测试集之前,先用全量数据的均值和标准差对每个特征做标准化。这样干净吗?机器学习中等derivation未尝试面试订阅4183没有 OOF 逻辑的目标编码一个类别特征先用全样本里该类别的平均标签做 target encoding,然后把这些编码拿去做交叉验证。这样安全吗?机器学习中等derivation未尝试面试订阅4184带 as-of 时间戳的滞后特征一个特征使用昨天的收盘价,但前提是数据商时间戳显示该数值在今天决策时点之前已经可用。这个构造在概念上是否可接受?机器学习中等derivation未尝试面试订阅4185先筛选股票池再做横截面排序一个横截面信号只在“通过了一个依赖未来信息的流动性筛选”的股票子集里做排序。对于回测来说,这算是有效的工程化特征吗?机器学习中等derivation未尝试面试订阅4186为什么中心化有助于交互特征为什么实务中常常会在向线性模型加入交互项之前,先对特征做中心化?机器学习中等essay未尝试面试订阅4187为什么更多特征反而可能伤害线性模型为什么加入大量“看起来合理”的工程化特征,反而可能让线性模型变差?机器学习中等essay未尝试面试订阅4188为什么虚拟变量陷阱不只是编码小错误为什么虚拟变量陷阱并不只是一个无伤大雅的编码疏忽?机器学习中等essay未尝试面试订阅4189为什么领域特征依然重要在模型越来越灵活的时代,为什么对线性方法来说,仔细的领域驱动特征工程仍然非常重要?机器学习中等essay未尝试面试订阅4190如何快速检查一道特征工程题在做完一道特征工程面试题后,最快的 sanity check 是什么?机器学习中等essay未尝试面试订阅4191多项式核值 1使用多项式核 K(x,z)=(x·z+1) 2,求 K((1,2),(2,0))。机器学习中等数值题未尝试面试订阅4192RBF 核相似度 2一个 RBF SVM 使用 K(x,z)=exp(-γ||x-z|| 2),其中 γ=0.5。若 ||x-z|| 2=4,得到的核相似度是多少?机器学习中等数值题未尝试面试订阅4193铰链损失 3对一个软间隔 SVM,某训练点的标签 y=1,模型得分 f(x)=0.3。它产生的铰链损失 max(0,1-yf(x)) 是多少?机器学习中等数值题未尝试面试订阅4194单点惩罚项 4一个软间隔 SVM 的目标函数为 0.5||w|| 2 + C Σ hinge i。如果某个样本的 hinge loss 为 1.2,且 C=2,这个样本会给目标函数增加多少惩罚项?机器学习中等数值题未尝试面试订阅4195几何间隔宽度 5如果一个线性 SVM 的 ||w||=5,那么几何间隔宽度 2/||w|| 是多少?机器学习中等数值题未尝试面试订阅4201哪些点还在惩罚里 11一个软间隔 SVM 在四个样本上的 y f(x) 分别为 [1.4, 0.8, -0.3, 1.0]。哪些点会因为严格处于间隔内或被误分类,而继续进入 hinge-loss 惩罚项?机器学习中等derivation未尝试面试订阅4202哪条超平面间隔最宽 12三条分离超平面对训练集都能正确分类,但它们的 ||w|| 分别为 2.0、4.0 和 1.6。哪一条的几何间隔最宽?机器学习中等derivation未尝试面试订阅4203比较两个 SVM 目标值 13模型 A 满足 ||w|| 2=1.0、总 hinge loss=3.0;模型 B 满足 ||w|| 2=4.0、总 hinge loss=0.5。如果 C=0.2,哪一个 SVM 目标函数更小?机器学习中等derivation未尝试面试订阅