GLOBAL SEARCH

搜索课程、模块、题目与收藏题单

搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。

找到 30 个结果

English questions
模块2.5.2 · 数学与统计能力 · 最优化

迭代法与正则化方法

optimization · gradient-descent · line-search · convergence · iterative-methods · newton-method · quasi-newton · bfgs

打开 →
题目2608 · 机器学习

两次 shrinkage 更新后的残差 24

某个点当前的残差是 6。两轮 boosting 中,它所在区域的叶节点更新分别为 1.5 和 0.8,且两轮学习率都为 eta=0.2。两轮之后还剩多少残差?

打开 →
题目2643 · 机器学习

向量参数上的裁剪加权重衰减计算 25

参数向量当前为 w_t=(3,4)。其梯度是 g=(6,8),范数为 10。先做阈值为 5 的全局范数裁剪,再做学习率 eta=0.1、lambda=0.1 的解耦权重衰减更新。新的参数向量是多少?

打开 →
题目2597 · 机器学习

带权区域更新值 2

若 boosting 某个区域 R 内的样本带有正权重 w_i,推导能使 sum_{i in R} w_i (r_i-gamma)^2 最小的常数更新 gamma。

打开 →
题目2596 · 机器学习

平方损失下叶节点最优更新值 1

在平方误差的梯度提升里,某个终端区域 R 会被赋予一个常数更新 gamma。推导能使 sum_{i in R} (r_i-gamma)^2 最小的 gamma,其中 r_i 是当前残差。

打开 →
课程迭代法与正则化方法 · 最优化

梯度下降与线搜索

周五下午两点,你在上海某私募的因子研究组里收到一张 12,000 × 600 的设计矩阵——600 个候选 alpha 因子在沪深300 成分股上 18 个月日频的横截面暴露。组合经理希望你下班前给一组系数,明早接入回测。你写下普通最小二乘(ordinary least squares, OLS)的闭式解 beta = np.linalg.solve(X.T...

打开 →
课程迭代法与正则化方法 · 最优化

正则化最小二乘:岭回归与 Lasso

深圳某私募的多因子研究员手头有 60 个交易日的沪深300 成分股横截面收益,外加一份「因子动物园」(factor zoo)清单:动量、价值、质量、低波,再加上 70 多个另类与基本面因子,合计 公式 个候选预测变量、公式 个观测——一个典型的 公式 病态设计矩阵。她直接套用上一模块的普通最小二乘(ordinary least squares, OLS),解...

打开 →
课程迭代法与正则化方法 · 最优化

牛顿法与拟牛顿法

周一开盘后 15 分钟,沪深300 ETF 期权(300ETF options on SSE)的隐含波动率(implied volatility, IV)整体上抬了 3 个 vol。你在一家私募的做市账户上挂着一组 50ETF 与 300ETF 近月平值 call,定价模型需要把每张合约的市场报价反推成 IV。上一节用梯度下降跑过同样的题:在某些深度虚值(o...

打开 →
课程迭代法与正则化方法 · 最优化

随机与小批量优化方法

钩子:当一次完整梯度要四个小时 某上海百亿私募的研究员准备把一套基于沪深300 成分股的多因子神经网络 α 信号搬上生产。训练集是过去 5 年的日频面板:约 180 万行样本 × 300 只成分股 × 80 个特征。前两课的工具一一被排除——海森矩阵(Hessian matrix, 公式)装不进显存,L BFGS 一次方向计算也要把整批数据过一遍。退到最朴素...

打开 →