梯度下降与线搜索
周五下午两点,你在上海某私募的因子研究组里收到一张 12,000 × 600 的设计矩阵——600 个候选 alpha 因子在沪深300 成分股上 18 个月日频的横截面暴露。组合经理希望你下班前给一组系数,明早接入回测。你写下普通最小二乘(ordinary least squares, OLS)的闭式解 beta = np.linalg.solve(X.T...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 11 个结果
中文题目周五下午两点,你在上海某私募的因子研究组里收到一张 12,000 × 600 的设计矩阵——600 个候选 alpha 因子在沪深300 成分股上 18 个月日频的横截面暴露。组合经理希望你下班前给一组系数,明早接入回测。你写下普通最小二乘(ordinary least squares, OLS)的闭式解 beta = np.linalg.solve(X.T...
打开 →开篇场景(Hook):一位 PM 的两份委托书 周一上午,你在一家 沪深300 指数增强 私募 基金的研究台收到两份新增的客户委托书。第一份要求满仓多头、公式、公式、行业偏离度上限 ±3%(一组线性不等式)——干净的二次规划(quadratic program, QP):二次目标 + 仿射约束,求解器十秒出结果。第二份加了一句「持仓数不得超过 50 只」,可...
打开 →开篇场景(Hook):基数约束如何把 MVO 从 QP 推到 MIP 周二下午,你在一家百亿规模的私募(private fund)量化部门里,给沪深300 成分股做一只全仓做多组合。脚本是教科书版本的均值方差优化(mean variance optimization, MVO):最小化 公式,约束 公式、公式。CVXPY 在 80ms 内返回全局最优。你顺手...
打开 →开篇场景(Hook):PM 真正想要的那个数 上海一家中型私募的 PM 周一早盘正在跟风控拉锯:当前组合的总杠杆(gross leverage)顶在 200% 的合规上限,他想申请抬到 220%。风控的问题不是「能不能」,而是「值不值」——多 20 个百分点能换多少边际信息比率(marginal information ratio)?答案其实早就躺在凸求解器...
打开 →周五下午三点,你在某 公募 基金管理一只 沪深300 指数增强(CSI 300 enhanced index)产品。当前基金合同把年化 跟踪误差(tracking error)上限设在 300 bp。求解器把当日再平衡的解返回过来——主仓位都合理,但对偶价格表里 跟踪误差 约束的乘子写着 公式 bp。翻译成 PM 听得懂的语言:若把上限从 300 bp 放到...
打开 →Hook:两个看起来都「会优化」的求解器 上海某私募基金的两位研究员同时打开 Python,一位在跑一个标的为沪深300 成分股、目标为均值方差优化(mean variance optimization)的组合优化(portfolio optimization)问题,另一位在调一个三层的因子神经网络。两人用的迭代算法是同一份梯度下降代码,第一位 200 步就...
打开 →Hook:一条卡在鞍点上的优化器 某沪深300 增强组合的研究员发来一段日志:使用裸的梯度下降迭代 6000 次后,目标函数(一个带分段惩罚的跟踪误差)几乎不再变化——但梯度范数也没有逼近零,反而在 公式 量级上震荡。绘出参数空间上的曲面发现:当前点位于一个鞍点(saddle point),沿其中一个主轴是「碗」、沿另一个主轴是「山脊」,一阶信息把这两种几何...
打开 →周一开盘后 15 分钟,沪深300 ETF 期权(300ETF options on SSE)的隐含波动率(implied volatility, IV)整体上抬了 3 个 vol。你在一家私募的做市账户上挂着一组 50ETF 与 300ETF 近月平值 call,定价模型需要把每张合约的市场报价反推成 IV。上一节用梯度下降跑过同样的题:在某些深度虚值(o...
打开 →反向传播与自动微分 Hook:四分钟一步的梯度 你刚加入一家以沪深300 alpha 为主力的私募(private fund),上手第一件事是把上一课那张 5 层、宽度 128 的多层感知机(multi layer perceptron, MLP)跑通——目标是用一个标准的 Barra 因子模型(factor model)的截面特征去拟合 公式,本质上是在学...
打开 →Hook:周三晚上的训练日志 上海一家中等规模私募的初级量化研究员小陈,把上一课刚学会的反向传播搬到了沪深300 选股因子模型(factor model)的 alpha 预测上。模型是一个深度 5、宽度 256 的多层感知机(multi layer perceptron, MLP),约 33 万参数,输入是 60 个标准化后的截面风格因子,标签是次日截面超额...
打开 →钩子:当一次完整梯度要四个小时 某上海百亿私募的研究员准备把一套基于沪深300 成分股的多因子神经网络 α 信号搬上生产。训练集是过去 5 年的日频面板:约 180 万行样本 × 300 只成分股 × 80 个特征。前两课的工具一一被排除——海森矩阵(Hessian matrix, 公式)装不进显存,L BFGS 一次方向计算也要把整批数据过一遍。退到最朴素...
打开 →