决策树:CART、不纯度准则与剪枝
周一早盘九点二十,你接手了离职同事留下的 alpha 模型——一棵深度 15 的 CART(Classification and Regression Tree, CART)树,在三年 沪深300 成分股日度面板上训练,特征是动量、价值、质量、低波、5 日收益、20 日波动率、换手率等 12 个变量,目标是预测下一日超额收益方向(涨/跌)。样本内训练精度 1...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 9 个结果
English questions周一早盘九点二十,你接手了离职同事留下的 alpha 模型——一棵深度 15 的 CART(Classification and Regression Tree, CART)树,在三年 沪深300 成分股日度面板上训练,特征是动量、价值、质量、低波、5 日收益、20 日波动率、换手率等 12 个变量,目标是预测下一日超额收益方向(涨/跌)。样本内训练精度 1...
打开 →周五午盘,一家 50 亿规模的 CN 私募把一份沪深300 alpha 数据甩到你工位:30 个特征、日频次日超额收益作标签。上一课那棵深度 15 的 CART 树样本内方向准确率 100%、样本外只有 51%——比抛硬币好不了多少,Sharpe 几乎为零。你把它换成 500 棵在 bootstrap 样本上独立训练的深树取平均,样本外跳到 57%。这一跳,...
打开 →machine-learning · tree-based-methods · decision-tree · cart · impurity · pruning · bagging · random-forest
打开 →第一轮从 $\{1, 2, 3, 4\}$ 中独立等概率有放回抽取 3 个数;第二轮从 $\{3, 4, 5, 6\}$ 中独立等概率有放回抽取 2 个数。两个取值池在 $\{3, 4\}$ 处重叠。在全部 5 次抽取中,求 $P(\text{恰好有一个值出现多于一次,且该值恰好出现两次})$。用最简分数表示。
打开 →在一个两阶段实验中,首先从 $\{1, 2, 3, 4, 5, 6\}$ 中不放回抽取 2 个数,然后独立地从 $\{1, 2, 3, 4, 5\}$ 中等概率抽取 1 个数。设 $P$ 为三个数的乘积。求 $P(6 \mid P)$,即乘积被 6 整除的概率。
打开 →周一开盘前一小时,你坐在上海一家中型私募基金(private fund)的研究室。投研经理把一张 CSV 推到桌上:沪深300 成分股 300 只,每只配 15 维因子向量(PE、PB、12 个月动量、20 日波动率、换手率、分析师上调比例),本质上是一张轻量级因子模型(factor model)输入表;标签 公式 表示下月相对指数 outperform /...
打开 →上海某私募的因子研究员把上一节的 500 棵随机森林训完,沪深300 + 中证500 上的样本外准确率 57%——比单棵深树的 51% 上了 6 个点。她把 max features 从 sqrt(p) 调到 p/3、把树数加到 2000,准确率纹丝不动停在 57.2%——bagging 的方差红利已经吃干净了。PM 在因子复盘会上一句话:「方差降到底了,把...
打开 →钩子:一笔 5000 手的 IF 单与一个等待你的 4 小时 周二上午 10:00,你的私募(private fund)风控屏上闪着一个标红:旗下中证500 多因子产品需要在午盘后到收盘前,把一个 5000 手的 CFFEX IF(沪深300 股指期货, stock index future)空头头寸全部减仓。合约乘数 ¥300/点,IF 当前 3,520 ...
打开 →2 名员工和 2 名受训快递员起始在走廊一侧。一辆摆渡车最多载 2 人,且只有快递员会开车。假设至少有两名快递员,那么若员工过河时必须由快递员陪同,最少需要多少次单程摆渡才能把所有人运到对侧?
打开 →