反向传播与自动微分
反向传播与自动微分 Hook:四分钟一步的梯度 你刚加入一家以沪深300 alpha 为主力的私募(private fund),上手第一件事是把上一课那张 5 层、宽度 128 的多层感知机(multi layer perceptron, MLP)跑通——目标是用一个标准的 Barra 因子模型(factor model)的截面特征去拟合 公式,本质上是在学...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 8 个结果
中文题目反向传播与自动微分 Hook:四分钟一步的梯度 你刚加入一家以沪深300 alpha 为主力的私募(private fund),上手第一件事是把上一课那张 5 层、宽度 128 的多层感知机(multi layer perceptron, MLP)跑通——目标是用一个标准的 Barra 因子模型(factor model)的截面特征去拟合 公式,本质上是在学...
打开 →Hook:周三晚上的训练日志 上海一家中等规模私募的初级量化研究员小陈,把上一课刚学会的反向传播搬到了沪深300 选股因子模型(factor model)的 alpha 预测上。模型是一个深度 5、宽度 256 的多层感知机(multi layer perceptron, MLP),约 33 万参数,输入是 60 个标准化后的截面风格因子,标签是次日截面超额...
打开 →machine-learning · neural-networks · feedforward · mlp · activation-functions · universal-approximation · depth-vs-width · backpropagation
打开 →开篇场景 (Hook):Ridge 之外,还有什么 上海一家私募的初级量化研究员陈晨把过去 36 个月沪深300(CSI 300)成分股的 30 列因子拼成一张面板:价值、动量、低波、质量、规模、换手、分析师修正等等,每月做一次截面回归,标签是下月超额收益。她用岭回归(ridge regression)跑了一遍 5 折交叉验证,OOS 上的 公式 只有 0....
打开 →结构化数据的架构:CNN、RNN 与 Transformer Hook:三次翻倍的 OOS R² 某上海私募的小张盯着屏幕,样本外曲线又一次贴着零线晃。他在沪深300 成份股上做日内分钟收益预测,输入是过去 60 根 1 分钟 OHLCV(open / high / low / close / volume)五通道、共 300 维向量,模型是上一课刚训完的深...
打开 →A wide MLP on 8k tabular rows drives training AUC to 0.99 while validation AUC stalls at 0.76. Feature semantics do not support label-preserving augmentation, and the largest weights sit on sparse one-hot inputs. Which regularization control should you try first?
打开 →某 私募 量化研究组的季末复盘。组长把 沪深300 上跑了一个季度的两条信号摊在桌上:一条是上一课构造的 12 1 月动量,样本外 21 日 rank IC 约 0.03;另一条是组里 ML 工程师用 LightGBM 训出来的 ranker,同一个 universe、同一段样本外、同一个 21 日远期 rank return,样本外 rank IC 跳到 ...
打开 →策略梯度与深度强化学习 开篇场景:表格放不下的盘口 周三盘后,上海一家头部 私募 的初级量化把成果摊给组长:CFFEX 上 沪深300 股指期货 日内大单切片,建成 144 个离散状态的 MDP,跑通了表格 Q 学习,比 TWAP 省了约 2bp 的 实施差额(implementation shortfall)。组长翻两页就皱眉:「线上要吃 5 档盘口 + ...
打开 →