AR、MA 与 ARMA 过程
周一开盘前,某沪深300 量化私募的研究员把昨天打捞回来的 1500 个日内对数收益样本(log returns)丢进 R,画了一张样本 ACF:lag 1 大约 0.18,lag 2 大约 0.05,再往后几乎全部落进 Bartlett 带里。她想问的是:这条「拖尾」曲线像不像一阶自回归(autoregressive, AR)模型该有的样子?如果是 AR,...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions周一开盘前,某沪深300 量化私募的研究员把昨天打捞回来的 1500 个日内对数收益样本(log returns)丢进 R,画了一张样本 ACF:lag 1 大约 0.18,lag 2 大约 0.05,再往后几乎全部落进 Bartlett 带里。她想问的是:这条「拖尾」曲线像不像一阶自回归(autoregressive, AR)模型该有的样子?如果是 AR,...
打开 →time-series · stationarity · autocorrelation · acf · pacf · white-noise · random-walk · ar
打开 →cpp · cpp17 · templates · function-template · class-template · type-deduction · auto · structured-bindings
打开 →收益由一个自回归系数为 0.5 的平稳 AR(1) 生成。Lo-MacKinlay 滞后 2 的方差比为 VR(2) = Var(r_t + r_(t+1)) / (2 Var(r_t))。计算 VR(2),并说明它指向动量还是均值回复。
打开 →周一早盘,某私募的时间序列研究员把过去 200 个交易日的对冲组合超额收益丢进 statsmodels。她想确认这条曲线是不是一个干净的 ARMA 过程——若是,残差就是一组白噪声,可以挂上下一阶段的 GARCH;若不是,她得回去重做特征工程。问题是:用 AR(1)、MA(1)、ARMA(1, 1) 还是 ARMA(2, 1)?拟合完之后怎么知道这一支模型确...
打开 →国内某私募衍生品桌的研究主管要在不动 Monte Carlo 引擎的前提下,对同一笔 CSI 300 ETF(510300.SH)4.30 行权价的欧式 call 跑三种 payoff——call、put、二元 digital。C++98 时代的答案是一棵 PayoffBase 指针继承树;C++11 之后的答案变成一行 lambda:把它直接传进 pric...
打开 →一个平稳价差满足 X_(t+1) = -0.4 X_t + epsilon_(t+1),冲击独立同分布且均值为 0。X_t 的一阶自相关是多少?其符号说明了相邻期之间怎样的动态?
打开 →周三下午两点。一家 A 股 私募 的资深同事打开你的 MR,标题是 feat(risk): 添加 沪深300 因子 z 列至业绩归因 。改了 12 个文件。二十秒之内审查线上铺满了「文件末尾多一个空行」「这个 import 没用到」「第 47 行行尾有空白」「import 没排序」之类的评论。你能感到审查时间正在漏走——这些评论没一条是关于你因子逻辑对不对的...
打开 →Hook(开场场景). 某资管公司多策略组合的固收风险经理,在月末复盘时盯着账上三笔头寸:(A)规模 5 亿元的 5 年期 FR007 利率互换(IRS),付固收浮,固定端 2.45%;(B)一笔参考某城投平台的 CRMW 1 亿元名义;(C)一只挂钩中证500 的 18 个月雪球结构化产品,由头部券商收益凭证渠道发出,规模 3 亿元,敲入线 75%、月...
打开 →反向传播与自动微分 Hook:四分钟一步的梯度 你刚加入一家以沪深300 alpha 为主力的私募(private fund),上手第一件事是把上一课那张 5 层、宽度 128 的多层感知机(multi layer perceptron, MLP)跑通——目标是用一个标准的 Barra 因子模型(factor model)的截面特征去拟合 公式,本质上是在学...
打开 →某平稳 OU 过程的均值回复速度为 kappa = 0.7。X_t 与 X_{t+2} 之间的自相关是多少?
打开 →某私募(private fund)交易日下午四点,你的 PM 把过去 500 个交易日的策略净值推过来,问:这条曲线的均值真的稳定吗?波动率有没有结构性变化?只看一条路径,凭什么相信估出来的均值与自相关有意义?这是时间序列分析(time series analysis)的元问题。横截面统计里你有 公式 个独立同分布(i.i.d.)样本,推断建立在「重复抽样」...
打开 →国内某私募 CSI 300 ETF 期权桌的资深 C++ engineer 在审一份六年前写就的策略库——它要进 live engine。他贴在每一份源码上的 PR review 评论只有一行:「这里裸 new ——改成 std::make unique 。」这份库是 C++03 风格写的, delete 散布在异常处理路径上,等一个错位的 throw 就足...
打开 →国内某私募的 C++ 研究桌周一例会:新入职的研究员上线了 mean double 、 mean float 、 mean long double 三份函数——同一个九行的均值计算被复制了三次,只是浮点精度不同。Senior C++ engineer 的 review 意见只有一句话:「这里要写成模板。」周五新人交回的版本里,三份代码合成了一个 templa...
打开 →国内某私募 CSI 300 ETF 期权桌的风险分析师在翻夜间对账日志:四十笔 510300 期权报价的隐含波动率(IV)显示为整齐的 1.0 。这不是市场信号,而是上一代 IV 求解器在「未收敛」时使用的 sentinel value。当下游的偏斜模型把 1.0 一起平均进去,报告的偏斜被肉眼可见地拖偏,早会因此浪费了三十分钟去追一个根本不存在的数字。修复...
打开 →在 Roll 模型下,成交价格变动的一阶序列自协方差为 -0.0009(价格平方单位)。请估计其隐含的有效价差。
打开 →周三下午,你在上海的一家 量化 私募。L1 走通了 12 1 动量 的 IC 与 IR 报告,头条 数字 是 月度 rank IC ≈ 0.03、 IR ≈ 0.5。 在 投决会 上 提交 前,合规 与 交易 部门 同时 提了 三 个 问题:这个 IC 在 多 长 视界 上 仍然 有效? 月度 跑 一遍 会 产生 多大 换手率? 等到 私募 规模 上到 5 ...
打开 →在均匀 iid 的 $\{A,B,C\}$ 符号流中,记 $T$ 为 $ABA$ 或 $BAA$ 任一模式首次出现的时间。求 $E[T]$。
打开 →一枚公平六面骰不断掷出。记 $T$ 为连续长度 3 的块中首次出现 $1,2,3$ 或 $3,2,1$ 的时刻。求 $E[T]$。
打开 →在一个 iid 符号流中,每个符号都从 $\{A,B,C,D\}$ 中等概率选取。求直到 $ABCA$ 首次出现的期望等待时间。
打开 →在一个 iid 符号流中,每个符号都从 $\{A,B,C\}$ 中等概率选取。求直到 $ABAB$ 第一次出现的期望等待时间。
打开 →一枚公平六面骰不断掷出。已知当前观察到的后缀恰好为 $1,2$。从此状态开始,到 $1,2,3$ 第一次出现还需要多少期望掷骰次数?
打开 →在均匀 iid 的 $\{A,B,C,D\}$ 符号流中,假设当前观察到的后缀恰好为 $ABC$。从现在起,到 $ABCA$ 第一次出现还需要多少期望符号数?
打开 →一枚公平硬币重复抛掷。记 $T$ 为直到 $HTHT$ 首次出现的等待时间。求 $E[T]$。
打开 →一枚公平六面骰不断掷出。求直到连续模式 $1,2,3$ 第一次出现所需的期望掷骰次数。
打开 →一个符号流在 $\{A,B,C\}$ 上 iid 且均匀。求直到 $ABC$ 或 $CBA$ 任一模式首次出现的期望符号数。
打开 →一枚公平硬币重复抛掷。求直到模式 $HHTH$ 第一次出现的期望抛掷次数。
打开 →Hook:没有 Barra 许可证的统计风险模型 周二早上,某中型多空对冲私募给初级量化研究员的任务:周五交一套「统计风险模型」——把沪深300 成分股最近 1000 个交易日的日度收益拆成几个共同因子加特异噪声,做成数据驱动的因子模型(factor model)。没有 Barra 模型(Barra model)授权,基本面数据要月底涨价,只有 1000×3...
打开 →一个 iid 信源分别以概率 $rac{1}{2}, rac{1}{3}, rac{1}{6}$ 发出 $A,B,C$。求直到 $AABA$ 首次出现的期望等待时间。
打开 →一个 iid 信源分别以概率 $rac{1}{2}, rac{1}{3}, rac{1}{6}$ 发出 $A,B,C$。求直到 $ABAC$ 首次出现的期望等待时间。
打开 →