GLOBAL SEARCH

搜索课程、模块、题目与收藏题单

搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。

找到 9 个结果

English questions
模块2.6.2 · 数学与统计能力 · 机器学习理论

树模型与核方法

machine-learning · tree-based-methods · decision-tree · cart · impurity · pruning · bagging · random-forest

打开 →
课程树模型与核方法 · 机器学习理论

Bagging 与随机森林

周五午盘,一家 50 亿规模的 CN 私募把一份沪深300 alpha 数据甩到你工位:30 个特征、日频次日超额收益作标签。上一课那棵深度 15 的 CART 树样本内方向准确率 100%、样本外只有 51%——比抛硬币好不了多少,Sharpe 几乎为零。你把它换成 500 棵在 bootstrap 样本上独立训练的深树取平均,样本外跳到 57%。这一跳,...

打开 →
课程树模型与核方法 · 机器学习理论

决策树:CART、不纯度准则与剪枝

周一早盘九点二十,你接手了离职同事留下的 alpha 模型——一棵深度 15 的 CART(Classification and Regression Tree, CART)树,在三年 沪深300 成分股日度面板上训练,特征是动量、价值、质量、低波、5 日收益、20 日波动率、换手率等 12 个变量,目标是预测下一日超额收益方向(涨/跌)。样本内训练精度 1...

打开 →
课程树模型与核方法 · 机器学习理论

核方法与支持向量机

周一开盘前一小时,你坐在上海一家中型私募基金(private fund)的研究室。投研经理把一张 CSV 推到桌上:沪深300 成分股 300 只,每只配 15 维因子向量(PE、PB、12 个月动量、20 日波动率、换手率、分析师上调比例),本质上是一张轻量级因子模型(factor model)输入表;标签 公式 表示下月相对指数 outperform /...

打开 →
课程树模型与核方法 · 机器学习理论

梯度提升与 XGBoost / LightGBM

上海某私募的因子研究员把上一节的 500 棵随机森林训完,沪深300 + 中证500 上的样本外准确率 57%——比单棵深树的 51% 上了 6 个点。她把 max features 从 sqrt(p) 调到 p/3、把树数加到 2000,准确率纹丝不动停在 57.2%——bagging 的方差红利已经吃干净了。PM 在因子复盘会上一句话:「方差降到底了,把...

打开 →
题目2547 · 机器学习

最弱链接 alpha 的数值计算 16

某个节点若被剪成单个叶节点,误差为 18;它当前子树的训练误差为 10,且有 3 个叶节点。该子树对应的最弱链接 alpha 是多少?

打开 →
题目2565 · 机器学习

带 alpha 收费的验证剪枝决策 23

把一个单叶节点替换成一个 3 叶子树后,验证损失下降了 4.5。若每增加一个叶节点要付出 alpha = 1.2 的复杂度收费,是否应保留该子树?

打开 →
题目2566 · 机器学习

选择应该先剪掉的最弱链接节点 24

节点 A 若被剪成单叶,误差为 12;其当前子树误差为 7,且有 3 个叶节点。节点 B 若被剪成单叶,误差为 9;其当前子树误差为 6,且有 2 个叶节点。在 cost-complexity 剪枝下,哪个节点是更弱的链接、应更早被剪掉?

打开 →