INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
738

12 / 37

非代码面试题

显示 20 / 738 道匹配题目

答题状态:未尝试未正确已正确
4134收盘集合竞价的适用场景一个组合必须尽量减小相对于官方收盘价的跟踪误差,而该股票在收盘集合竞价时流动性很深。此时哪种执行渠道或执行组件会变得特别有吸引力?金融与交易中等derivation未尝试面试订阅4135薄成交股票中的参与率上限在成交稀薄的股票里,为什么交易员即便进度落后,也可能仍然坚持一个严格的最高参与率上限?金融与交易中等derivation未尝试面试订阅4136为什么报价价差会低估真实成本为什么对真实的机构订单来说,报价价差往往不是执行成本的好总结指标?金融与交易中等essay未尝试面试订阅4137为什么被动挂单也可能亏钱为什么认为“被动挂单一定便宜,因为它不吃价差”是错误的?金融与交易中等essay未尝试面试订阅4138为什么冲击模型里需要紧迫性项为什么一个只建模市场冲击、却忽略 alpha 衰减或紧迫性的执行问题是不完整的?金融与交易中等essay未尝试面试订阅4139为什么暗池流动性并不是“免费流动性”为什么暗池虽然能降低可见 footprint,但真实成本却未必明显下降?金融与交易中等essay未尝试面试订阅4151缺失特征下的生成式分类 1一个两特征的朴素贝叶斯模型采用生成式方式训练,但在预测时 X2 缺失。已知先验 P(Y=1)=0.5,P(X1=1|Y=1)=0.8,P(X1=1|Y=0)=0.3,P(X2=1|Y=1)=0.75,P(X2=1|Y=0)=0.4。现在只观测到 X1=1。问生成式模型应当使用的后验 P(Y=1|X1) 是多少?机器学习中等数值题未尝试面试订阅4156似然比与先验推出后验决策 11对样本 x,一个生成式模型把证据概括成似然比 p(x|Y=1)/p(x|Y=0) = 5。如果 1 类的先验概率为 0.2,那么后验概率 P(Y=1|x) 是多少?在 0.5 阈值下应如何决策?机器学习中等derivation未尝试面试订阅4157似然比与先验推出后验决策 12对样本 x,一个生成式模型把证据概括成似然比 p(x|Y=1)/p(x|Y=0) = 0.5。如果 1 类的先验概率为 0.4,那么后验概率 P(Y=1|x) 是多少?在 0.5 阈值下应如何决策?机器学习中等derivation未尝试面试订阅4161小样本且有结构假设时先选哪类模型 16你手里只有几百个带标签样本,但领域知识给出了比较可信的类条件结构,而且还有很多无标签特征样本。你会先从生成式模型还是判别式模型开始?机器学习中等essay未尝试面试订阅4162只有先验漂移时哪类模型更好调 17某个分类器是在上季度训练的,现在只有类别出现率变了,而“给定类别时的特征分布形状”看起来仍然稳定。在这种情况下,生成式还是判别式更容易快速调整?机器学习中等essay未尝试面试订阅4163大样本只求预测时先选哪类模型 18如果你有数百万带标签样本,而且只关心部署标签上的预测精度,并不需要生成 x,那么通常更值得先试哪一侧?机器学习中等essay未尝试面试订阅4164测试时常缺特征时哪类模型占优 19线上系统在测试时经常会缺失一个传感器特征,但你的模型族可以很干净地分解联合特征似然。在这种情况下,哪一类模型会获得更现实的优势?机器学习中等essay未尝试面试订阅4165需要按类别生成样本时先选哪类模型 20研究团队不仅想要分类标签,还想在每个类别条件下生成合成特征样本来做压力测试。哪一类模型是更自然的起点?机器学习中等essay未尝试面试订阅4181带前瞻窗口的滚动均值候选人构造了一个“5日均值”,在第 t 天使用从 t-2 到 t+2 的价格。若模型打算在第 t 天收盘时交易,这样做是否有效?机器学习中等derivation未尝试面试订阅4182先标准化再切分训练测试一个流程在划分训练集和测试集之前,先用全量数据的均值和标准差对每个特征做标准化。这样干净吗?机器学习中等derivation未尝试面试订阅4183没有 OOF 逻辑的目标编码一个类别特征先用全样本里该类别的平均标签做 target encoding,然后把这些编码拿去做交叉验证。这样安全吗?机器学习中等derivation未尝试面试订阅4184带 as-of 时间戳的滞后特征一个特征使用昨天的收盘价,但前提是数据商时间戳显示该数值在今天决策时点之前已经可用。这个构造在概念上是否可接受?机器学习中等derivation未尝试面试订阅4185先筛选股票池再做横截面排序一个横截面信号只在“通过了一个依赖未来信息的流动性筛选”的股票子集里做排序。对于回测来说,这算是有效的工程化特征吗?机器学习中等derivation未尝试面试订阅4186为什么中心化有助于交互特征为什么实务中常常会在向线性模型加入交互项之前,先对特征做中心化?机器学习中等essay未尝试面试订阅