全站搜索 — 锐望实验室

全部 · 4546 课程 · 299 模块 · 72 题目 · 4169 帮助 · 6 收藏题单 · 0

找到 11 个结果

课程迭代法与正则化方法 · 最优化

梯度下降与线搜索

周五下午两点，你在上海某私募的因子研究组里收到一张 12,000 × 600 的设计矩阵——600 个候选 alpha 因子在沪深300 成分股上 18 个月日频的横截面暴露。组合经理希望你下班前给一组系数，明早接入回测。你写下普通最小二乘（ordinary least squares, OLS）的闭式解 beta = np.linalg.solve(X.T...

打开 →

课程凸优化 · 最优化

凸优化问题与标准形式

开篇场景（Hook）：一位 PM 的两份委托书周一上午，你在一家沪深300 指数增强私募基金的研究台收到两份新增的客户委托书。第一份要求满仓多头、公式、公式、行业偏离度上限 ±3%（一组线性不等式）——干净的二次规划（quadratic program, QP）：二次目标 + 仿射约束，求解器十秒出结果。第二份加了一句「持仓数不得超过 50 只」，可...

打开 →

课程凸优化 · 最优化

凸集与凸函数

开篇场景（Hook）：基数约束如何把 MVO 从 QP 推到 MIP 周二下午，你在一家百亿规模的私募（private fund）量化部门里，给沪深300 成分股做一只全仓做多组合。脚本是教科书版本的均值方差优化（mean variance optimization, MVO）：最小化公式，约束公式、公式。CVXPY 在 80ms 内返回全局最优。你顺手...

打开 →

课程凸优化 · 最优化

拉格朗日对偶与 KKT 条件

开篇场景（Hook）：PM 真正想要的那个数上海一家中型私募的 PM 周一早盘正在跟风控拉锯：当前组合的总杠杆（gross leverage）顶在 200% 的合规上限，他想申请抬到 220%。风控的问题不是「能不能」，而是「值不值」——多 20 个百分点能换多少边际信息比率（marginal information ratio）？答案其实早就躺在凸求解器...

打开 →

课程凸优化 · 最优化

组合优化与锥规划建模

周五下午三点，你在某公募基金管理一只沪深300 指数增强（CSI 300 enhanced index）产品。当前基金合同把年化跟踪误差（tracking error）上限设在 300 bp。求解器把当日再平衡的解返回过来——主仓位都合理，但对偶价格表里跟踪误差约束的乘子写着公式 bp。翻译成 PM 听得懂的语言：若把上限从 300 bp 放到...

打开 →

课程面向最优化的微积分 · 线性代数与微积分

一阶最优性与凸性

Hook：两个看起来都「会优化」的求解器上海某私募基金的两位研究员同时打开 Python，一位在跑一个标的为沪深300 成分股、目标为均值方差优化（mean variance optimization）的组合优化（portfolio optimization）问题，另一位在调一个三层的因子神经网络。两人用的迭代算法是同一份梯度下降代码，第一位 200 步就...

打开 →

课程面向最优化的微积分 · 线性代数与微积分

泰勒展开与海森矩阵

Hook：一条卡在鞍点上的优化器某沪深300 增强组合的研究员发来一段日志：使用裸的梯度下降迭代 6000 次后，目标函数（一个带分段惩罚的跟踪误差）几乎不再变化——但梯度范数也没有逼近零，反而在公式量级上震荡。绘出参数空间上的曲面发现：当前点位于一个鞍点（saddle point），沿其中一个主轴是「碗」、沿另一个主轴是「山脊」，一阶信息把这两种几何...

打开 →

课程迭代法与正则化方法 · 最优化

牛顿法与拟牛顿法

周一开盘后 15 分钟，沪深300 ETF 期权（300ETF options on SSE）的隐含波动率（implied volatility, IV）整体上抬了 3 个 vol。你在一家私募的做市账户上挂着一组 50ETF 与 300ETF 近月平值 call，定价模型需要把每张合约的市场报价反推成 IV。上一节用梯度下降跑过同样的题：在某些深度虚值（o...

打开 →

课程神经网络 · 机器学习理论

反向传播与自动微分

反向传播与自动微分 Hook：四分钟一步的梯度你刚加入一家以沪深300 alpha 为主力的私募（private fund），上手第一件事是把上一课那张 5 层、宽度 128 的多层感知机（multi layer perceptron, MLP）跑通——目标是用一个标准的 Barra 因子模型（factor model）的截面特征去拟合公式，本质上是在学...

打开 →

课程神经网络 · 机器学习理论

深度网络的训练:优化与正则化

Hook:周三晚上的训练日志上海一家中等规模私募的初级量化研究员小陈,把上一课刚学会的反向传播搬到了沪深300 选股因子模型(factor model)的 alpha 预测上。模型是一个深度 5、宽度 256 的多层感知机(multi layer perceptron, MLP),约 33 万参数,输入是 60 个标准化后的截面风格因子,标签是次日截面超额...

打开 →

课程迭代法与正则化方法 · 最优化

随机与小批量优化方法

钩子：当一次完整梯度要四个小时某上海百亿私募的研究员准备把一套基于沪深300 成分股的多因子神经网络 α 信号搬上生产。训练集是过去 5 年的日频面板：约 180 万行样本 × 300 只成分股 × 80 个特征。前两课的工具一一被排除——海森矩阵（Hessian matrix, 公式）装不进显存，L BFGS 一次方向计算也要把整批数据过一遍。退到最朴素...

打开 →