MV 的实践失败与收缩修正
某上海私募的初级量化:把 L2 的闭式 MV 直接套到 100 只 A 股、5 年月度数据上,优化器吐回的组合在三只票上占 90%(其中两只各做多 60%、一只做空 200%)。回测夏普 3.2,PM 拍板上线。半年后实盘亏 12%,同期沪深300 涨 8%。「教科书的东西在实盘上不工作」——但 不是 教科书错了,是 他没装收缩 (no sh...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions某上海私募的初级量化:把 L2 的闭式 MV 直接套到 100 只 A 股、5 年月度数据上,优化器吐回的组合在三只票上占 90%(其中两只各做多 60%、一只做空 200%)。回测夏普 3.2,PM 拍板上线。半年后实盘亏 12%,同期沪深300 涨 8%。「教科书的东西在实盘上不工作」——但 不是 教科书错了,是 他没装收缩 (no sh...
打开 →分类损失与 Logistic 回归 Hook:二元跑赢信号 上海某私募的因子研究员把上一节的 5 因子载荷在沪深300 全样本上重新拟过一遍,现在 PM 把问题反过来问:「不要预测下月超额收益率,直接给我一个『这只票下月跑赢沪深300 的概率』。」目标变量从连续的 公式 收缩成二值的 公式,这条信号要直接驱动一个多空叠加层(long/short overla...
打开 →国内某多空选股私募的资深研究员把一篇顶刊工作论文转给了基金经理:「作者在沪深300成分股范围内构造了一个基于净经营资产应计的因子,样本内夏普 1.8,t 值 2.4。是否纳入生产合成因子?」基金经理翻到方法论页只回了三行字:「三个问题。(1) 论文 t 值 2.4——文献已经发了大概 300 个这种因子,多重检验调整后的门槛是多少?(2) 用了断点宇宙断点和...
打开 →国内某头部 quant 的 510300.SH 做市组新入职 C++ 工程师,被安排与一位资深做一周入职配对。第一天:读 200 行 FIX 会话层代码。第二天:读 300 行 ITCH 5.0 解析器。第三天:把一笔 NEWORDERSINGLE 从策略层往下追,穿过桌内会话处理器、跨 TCP 套接字送到跨境清算柜台,再以 EXECUTIONREPORT ...
打开 →周二上午 11:14,某沪上 私募 量化 团队的研究员刚跑完 沪深300 ETF(510300)上 5 秒级订单流信号的回测:样本内 Sharpe 5.2,样本外 Sharpe 4.8。基金经理盯着权益曲线只问一句:「上规模交易会发生什么?」研究员不知道——回测假设每一笔成交都按中价(mid)拿到、零市场冲击。在 200,000 份的元订单(metaorde...
打开 →正则化与模型选择 Hook:一次「翻牌」事件 你在上海一家私募基金负责沪深300 选股策略。上周你按第 3 课的做法,用普通最小二乘(ordinary least squares, OLS)把 5 个 Barra 风格因子——估值、质量、动量、规模、低波动——回归到下一期超额收益上,得到一组 公式。这周把估计窗口前移 5 个交易日重跑,价值因子载荷从 公式 ...
打开 →某沪深300指增私募的策略部署组组长周一早会带着三份交付物走进风控委员会。PM 刚审批通过一只新主动股票策略,研究组把 4.2 alpha 管线(截面动量 + 质量 + 价值的复合 alpha,样本内 IR 约 0.5)、4.3 因子暴露矩阵 B (Barra 风格 5 个 + 中信一级行业 10 个 + 国家因子)、4.4.2 Barra 风险模型 (Si...
打开 →线性回归作为监督学习的基线 Hook:周二早会的 OLS 提问 周二早会上,你向一家头部私募(private fund)的 PM 汇报上周的因子归因。你用沪深300 成份股过去 60 个交易日的横截面数据,对 5 个 Barra 风格因子——市值、估值、动量、质量、低波动——跑了一次普通最小二乘(ordinary least squares, OLS),这是...
打开 →国内一家头部私募的 CSI 300 ETF 期权桌的 C++ 工程师,正在把一个新的 510300.SH 期权策略接进生产引擎。单线程回测跑十一秒;上线引擎要求一个线程从 CFFEX 行情链路喂 tick,第二个线程跑 Greeks 重估,第三个线程把订单分发到 SSE 的报盘网关。第一版在第二个 tick 就死锁了。第二版位置表被搞乱了——两条线程同时读写...
打开 →晚上 十点,你 启动 了 一个 沪深300 ETF(510300)的 5 分钟 均值回归 策略 回测,参数 扫了 三十 组,估计 要 跑 一整夜 加 半天。你 把 笔记本 一合 准备 回家,然后 突然 想起 一件 事: ssh 连接 一断,那个 Python 进程 就 死了。第二天 一早 你 还得 看 进度、还要 在 跑到 一半 时 杀掉 它 重启。这一课 ...
打开 →中信 CITIC 算法交易部一位资深执行交易员,正在与一家中型量化私募的投资经理通电话。私募需要在收盘前 30 分钟清掉 100 万股 600519 贵州茅台。到达价 RMB 1800.00;距离收盘 30 分钟。投资经理要求订单完成。交易员冷静地解释:「直接打盘口市价单,意味着接下来 30 秒 100% 参与率, 250 bp 冲击。30 分钟内做 TWA...
打开 →某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 今天的 沪深300 拉出来的(测试样本里每只标的都是...
打开 →偏差 方差分解与泛化 Hook:周一的因子复盘 上海某私募的因子研究员周一收到了风控的复盘邮件。他原本用 6 个 Barra 风格因子在沪深300 成份股上做截面回归预测次日超额收益,样本内 公式,模型经理觉得「不够性感」。一周后他把因子从 6 个铺到 36 个——叠加了 28 个行业哑变量、过去 30 日动量分位、几个高频微观结构特征——样本内 公式 一跃...
打开 →周三盘后,一位上海私募 (private fund) 的研究员把当日中金所 IF 四个到期合约抓下来作图:当月 3,841、下月 3,838、当季 3,830、下季 3,815。曲线向右下倾斜,差距随期限拉大——这是教科书上的 backwardation,但她隔壁桌的商品组研究员当天看到的 SHFE 铜 (CU) 曲线却是反向的:当月 67,500、下月 6...
打开 →周二早上 7:40,你坐在某家 私募 vol 自营桌前,盯着 SSE 50ETF 期权(510050)的隐含波动率(implied volatility, IV)曲面。昨夜风险系统已经把两套波动率模型校准好。第一套是 Dupire 局部波动率模型,确定性的 公式 能把所有 510050 vanilla 中间价复原到 0.5 vol 点之内——日间用于盯市与隔...
打开 →周三下午 15:05,SSE 主板刚收盘。某 私募 vol 套利团队的基金经理在 T+1 结算窗口前打开两个数字。第一是当天早盘 中金所 公布的 iVX 读数:18.3。第二是 沪深300 指数过去 30 个交易日的已实现波动率,按收盘到收盘对数收益率的年化标准差算:13.8。这 4.5 个 vol 点的缺口——隐含波动率(implied volatilit...
打开 →周一上午九点,一家做 A 股 量化的 私募 把研究机的账号交到你手上。你 ssh 上去,屏幕上只有一行 quant@research cn: 公式DIR 而 DIR 是空的——这一行会展开成 rm rf / ,把根目录递归扫掉。对策是养成两步习惯:先 ls lah 确认你正要删的就是你想删的,再敲 rm rf 。 权限: chmod 、 chown 、 um...
打开 →A 股 一家 私募 的 quant,下午 三点半 收盘 之后 收到 数据团队 的 一条 消息:「今天 沪深300 ETF 的 tick 文件 落到 /data/market data/cn/equity/tick/20250424/ 了,你 看看 行数 对不对、品种 有没有 缺、总成交额 大概 多少。」她 不打算 写一个 Python 脚本——这种 「看一眼...
打开 →周三早上 9:10,你在某 私募 vol 自营台前,盯着 SSE 50ETF 期权(510050)当月、次月与两档季月四个挂牌到期日,再加上 中金所 沪深300 IO 的当月、次月、当季、下季合约。屏幕上同时挂出大约 180 张报价。你不是逐张读:风险系统已经把它们拟合成一张光滑曲面 公式,在第二块显示器上以三维网格呈现。上一节课里你已经会把单笔报价反演到隐...
打开 →统计学习框架:损失、风险与经验风险最小化 开篇场景(Hook):下月信号要不要照搬 上海一家私募的量化研究员把过去三年沪深300(CSI 300)成分股的月度超额收益(excess return)整理成一张表:每一行是一只股票在某月的 公式,公式 是当月末的因子向量(规模、价值、动量、低波),公式 是下月的超额收益。她准备在这张大约一万行的样本里挑一个预测器...
打开 →周一上午 9:31,集合竞价刚收,你坐在某家私募波动率自营台前,屏幕上挂着一条 SSE 上市的 50ETF 期权(510050)一个月到期的合约链,标的中间价 2.853。前一节课已经把 Black Scholes 模型(Black Scholes, BS)的闭式定价公式写好——但模型要的输入里有一个 公式,盘面没有给你。市场给你的是价格。今天上午第一件事,...
打开 →上海陆家嘴一家头部量化私募的执行部门,资深交易员主持晨会。策略:中证500 + 中证1000 小盘股统计套利,纸面 Sharpe 2.2,毛 AUM RMB 20 亿,年化换手 1000%。L1 显性成本建模规范:ETF 端 8 bp round trip,单只小盘股端 12 bp。投资经理推动上线。交易员调出昨日 TCA 报告。中证1000 单只股票 fi...
打开 →A 股 一家 私募 的 数据 团队 每天 下午 15:00 收盘 后,要 把 沪深300 ETF(510300)的 tick 文件 从 staging 服务器 同步 到 本地 研究机,解压、做 一次 行数 校验、调 一个 Python loader 写 进 数据库;如果 任何 一步 失败,调度器 必须 拿到 非 0 退出 码,方便 把 这一晚 标 红。这套 ...
打开 →某私募的量化基础设施工程师把一个棘手问题摆到桌上:回测代码一份要在 CI 上跑(必须 deterministic、必须秒级、必须无网络),另一份要在研究 notebook 里跑(必须真接口、必须有缓存),两边的调用点不能动。本课把前三节的全部产物——L1 的 simulate basket 、L2 的 make cohort ,L3 的 fetch yiel...
打开 →国内某多策略私募的基金经理问:「这两个因子样本内夏普都是 1.0,都跨过 Hou Xue Zhang t 值 3,都在 Chen Zimmermann 开源库有复现。为什么权重不同?」研究员愣了一下。基金经理继续:「盈利能力因子有一个可引用的故事——q 理论:高 ROE 的公司资本成本低,这一差异就是状态变量风险溢价。低波动异象的故事是彩票偏好与杠杆厌恶:散...
打开 →某上海私募的多空策略台,周一早会上分析师汇报:某只白酒龙头跑赢沪深300 5.2 个百分点,「显著的 alpha」。基金经理把数据敲到 Bloomberg,跑了一遍 CAPM 回归,Jensen alpha 的 t 值 1.3——「不,这只是 beta 的 1.4 倍,加上沪深300 这一年涨了 4%,你看到的 5.2% 全在 beta 解释范围内,没有 a...
打开 →某私募的固定收益研究员要把过去三个月的 10 年期中国国债收益率拉成时间序列,放进久期模型的样本。AKShare 的公开接口 ak.bond china yield 不要 token、本地能跑、数据按日更新——但研究 notebook 一旦在用户面前演示时撞上 429,整场会议就要等十分钟手动 retry。本课把 AKShare 调用包成一个 fetch y...
打开 →周二下午两点,某上海私募的股票池经理把你叫到工位前:要 600519.SH 对沪深300 ETF(510300.SH)的市场 β,日简单收益(daily simple return),近252个交易日窗口,今晚9点前要见。教科书答案一行就能解决: beta = Cov(r stock, r mkt) / Var(r mkt) 。工程答案稍长:把 [1, r ...
打开 →2024 年 4 月 3 日上午 10 点 05 分,灵均投资几个账户在一分钟内集中向 SSE 提交了约 25 亿人民币的沪深300 ETF 套利申报,触发 SSE「短时间大额集中申报」类异常交易监控。当天下午,SSE 发出公开监管措施公告,对灵均实施 30 天交易限制——这是首次有头部量化私募被以此种方式公开点名。之后是数周的倒查审计,跨越多个季度的交易日...
打开 →周一早上九点,你作为新任合规负责人坐进上海某量化私募的办公室。墙上挂着四张框装证书:一张是中国证监会对该公司私募投资基金管理人身份的承认函,一张是中基协颁发的私募基金管理人登记证(编号 S 加八位数字),一张是上海证券交易所颁发的程序化交易报告备案与交易参与人编号,最后一张是中国证券登记结算公司的结算参与人证明,附带最新一次风险准备金缴存凭证。这四张「墙上的...
打开 →