全站搜索 — 锐望实验室

全部 · 4546 课程 · 299 模块 · 72 题目 · 4169 帮助 · 6 收藏题单 · 0

找到 8 个结果

课程神经网络 · 机器学习理论

反向传播与自动微分

反向传播与自动微分 Hook：四分钟一步的梯度你刚加入一家以沪深300 alpha 为主力的私募（private fund），上手第一件事是把上一课那张 5 层、宽度 128 的多层感知机（multi layer perceptron, MLP）跑通——目标是用一个标准的 Barra 因子模型（factor model）的截面特征去拟合公式，本质上是在学...

打开 →

课程神经网络 · 机器学习理论

深度网络的训练:优化与正则化

Hook:周三晚上的训练日志上海一家中等规模私募的初级量化研究员小陈,把上一课刚学会的反向传播搬到了沪深300 选股因子模型(factor model)的 alpha 预测上。模型是一个深度 5、宽度 256 的多层感知机(multi layer perceptron, MLP),约 33 万参数,输入是 60 个标准化后的截面风格因子,标签是次日截面超额...

打开 →

模块2.6.3 · 数学与统计能力 · 机器学习理论

神经网络

machine-learning · neural-networks · feedforward · mlp · activation-functions · universal-approximation · depth-vs-width · backpropagation

打开 →

课程神经网络 · 机器学习理论

前馈神经网络作为函数逼近器

开篇场景 (Hook)：Ridge 之外，还有什么上海一家私募的初级量化研究员陈晨把过去 36 个月沪深300（CSI 300）成分股的 30 列因子拼成一张面板：价值、动量、低波、质量、规模、换手、分析师修正等等，每月做一次截面回归，标签是下月超额收益。她用岭回归（ridge regression）跑了一遍 5 折交叉验证，OOS 上的公式只有 0....

打开 →

课程神经网络 · 机器学习理论

结构化数据的架构:CNN、RNN 与 Transformer

结构化数据的架构:CNN、RNN 与 Transformer Hook:三次翻倍的 OOS R² 某上海私募的小张盯着屏幕,样本外曲线又一次贴着零线晃。他在沪深300 成份股上做日内分钟收益预测,输入是过去 60 根 1 分钟 OHLCV(open / high / low / close / volume)五通道、共 300 维向量,模型是上一课刚训完的深...

打开 →

题目4306 · 机器学习

A wide MLP on 8k tabular rows drives training AUC to 0.99 while validation AUC stalls at 0.76. Feature semantics do not support label-preserving augmentation, and the largest weights sit on sparse one-hot inputs. Which regularization control should you try first?

打开 →

课程信号构建 · Alpha 研究

机器学习信号——特征工程与非线性模型

某私募量化研究组的季末复盘。组长把沪深300 上跑了一个季度的两条信号摊在桌上:一条是上一课构造的 12 1 月动量,样本外 21 日 rank IC 约 0.03;另一条是组里 ML 工程师用 LightGBM 训出来的 ranker,同一个 universe、同一段样本外、同一个 21 日远期 rank return,样本外 rank IC 跳到 ...

打开 →

课程无监督学习与强化学习 · 机器学习理论

策略梯度与深度强化学习

策略梯度与深度强化学习开篇场景：表格放不下的盘口周三盘后，上海一家头部私募的初级量化把成果摊给组长：CFFEX 上沪深300 股指期货日内大单切片，建成 144 个离散状态的 MDP，跑通了表格 Q 学习，比 TWAP 省了约 2bp 的实施差额（implementation shortfall）。组长翻两页就皱眉：「线上要吃 5 档盘口 + ...

打开 →

搜索课程、模块、题目与收藏题单

反向传播与自动微分

深度网络的训练:优化与正则化

神经网络

前馈神经网络作为函数逼近器

结构化数据的架构:CNN、RNN 与 Transformer

Sparse Weights Blow Up

机器学习信号——特征工程与非线性模型

策略梯度与深度强化学习