为什么后验均值会变而 MLE 不会
某交易台只观察到了 4 次新的违约事件,研究的是一个很罕见的违约率。加入一个较强的历史 Beta 先验后,Bayesian 的后验均值明显低于样本比例;而 frequentist 的 MLE 却恰好等于样本比例。为什么这两个答案可以合理不同?它们各自是在什么条件下做推断?
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 29 个结果
English questions某交易台只观察到了 4 次新的违约事件,研究的是一个很罕见的违约率。加入一个较强的历史 Beta 先验后,Bayesian 的后验均值明显低于样本比例;而 frequentist 的 MLE 却恰好等于样本比例。为什么这两个答案可以合理不同?它们各自是在什么条件下做推断?
打开 →上海某私募的量化研究员把上一课跑出来的两个候选估计量并排放着:一个是无偏的样本方差 公式(分母 公式),另一个是极大似然估计(maximum likelihood estimation, MLE)的方差版 公式(分母 公式)。直觉告诉他「无偏」听起来更值得信赖,但当真到了要在波动率模型里塞一个数,他需要的是一把明确可比较的「好坏」尺子——能告诉他在 公式 的...
打开 →MLE · 假设检验 · 置信区间 · Bootstrap
打开 →某个二元交易信号在最近 80 个交易日中有 44 天为正收益。将每天是否赚钱建模为相互独立的 Bernoulli$(p)$ 结果。 请先求 $p$ 的极大似然估计,再在该估计下给出未来 3 天都赚钱的概率。
打开 →设短周期定价误差服从 i.i.d. Laplace$(\mu,b)$,其中尺度参数已知为 $b=2$,密度与 $e^{-|x-\mu|/2}$ 成正比。样本为 $$-1,\;0,\;2,\;2,\;3,\;5,\;7。$$ 请给出 $\mu$ 的极大似然估计。
打开 →设大额执行滑点的绝对值服从已知尺度 $x_m=1$、未知尾指数 $\alpha$ 的 Pareto 分布,其密度为 $$f(x)=\alpha x^{-\alpha-1}, \qquad x\ge 1.$$ 若 $n=8$ 个观测满足 $$\sum_{i=1}^8 \log X_i = 12,$$ 请先求 $\alpha$ 的极大似然估计,再估计拟合模型下 $P(X>10)$。
打开 →某交易场所在连续 40 分钟内记录到 120 次子单到达。假设到达过程服从强度为 $\lambda$(单位:每分钟)的齐次 Poisson 过程。 请先求 $\lambda$ 的极大似然估计,再给出拟合模型下下一分钟没有任何到达的概率。
打开 →一个市场状态模型有三种情形:平稳、趋势和失衡,对应概率为 $(p_1,p_2,p_3)$。在 100 个交易日中,观测到 20 天平稳、30 天趋势、50 天失衡。 请给出 $(p_1,p_2,p_3)$ 的极大似然估计。
打开 →某策略会不断重复尝试,直到第一次得到盈利成交。记 $X$ 为第一次成功前所需的尝试次数,取值为 $1,2,\ldots$,并假设 $X\sim \mathrm{Geometric}(p)$。 若大量独立样本的样本均值为 $4$,请给出 $p$ 的极大似然估计;在该拟合下,至少需要 4 次尝试的概率是多少?
打开 →设 5 个独立样本来自 $\mathrm{Uniform}(0,\theta)$,其中样本最大值为 $7.4$。 请先求 $\theta$ 的极大似然估计,再给出拟合分布的中位数估计。
打开 →设成交持续时间服从形状参数已知为 $k=3$、尺度参数未知为 $\theta$ 的 Gamma 分布。在这一参数化下,有 $$E[X]=k\theta。$$ 若样本均值为 $12$,请给出 $\theta$ 的极大似然估计。
打开 →设执行延迟服从 Weibull 分布,已知形状参数 $k=2$、未知尺度参数 $\lambda$,其密度为 $$f(x)=\frac{2x}{\lambda^2}e^{-(x/\lambda)^2}, \qquad x>0.$$ 若 $n=10$ 个观测满足 $$\sum_{i=1}^{10} X_i^2 = 90,$$ 请给出 $\lambda$ 的极大似然估计。
打开 →设 $X_1,\dots,X_{25}\sim N(\mu,4)$ 独立同分布,样本均值为 $\bar X=1.2$。 请先求 $\mu$ 的极大似然估计,再利用不变性给出 $e^{\mu}$ 的估计。
打开 →某交易场所研究下一次价差扩大的等待时间。8 个观测窗口都最多跟踪 5 秒,其中 5 个窗口在 5 秒内发生了事件,另外 3 个窗口在 5 秒处右删失。所有窗口累计暴露时间总和为 40 秒。 假设事件时间独立且服从 $\mathrm{Exp}(\lambda)$,请给出 $\lambda$ 的极大似然估计。
打开 →10 个相互独立的中间价跳变等待时间总和为 25 秒。假设每个等待时间都服从参数为 $\lambda$ 的指数分布 $\mathrm{Exp}(\lambda)$。 请求出 $\lambda$ 的极大似然估计,并在拟合模型下给出等待时间的中位数。
打开 →设观测满足 $$Y_i = \beta X_i + \varepsilon_i, \qquad \varepsilon_i\stackrel{iid}{\sim}N(0,\sigma^2),$$ 其中没有截距项,误差为已知方差的高斯噪声。已知 $$\sum X_iY_i = 48, \qquad \sum X_i^2 = 16。$$ 请给出 $\beta$ 的极大似然估计。
打开 →设 $X_1,\dots,X_9$ 独立同分布于 $N(\mu,\sigma^2)$。样本给出的统计量为 $$\bar X = 5, \qquad \sum_{i=1}^9 (X_i-\bar X)^2 = 18.$$ 请求出 $\mu$ 和 $\sigma^2$ 的极大似然估计。
打开 →上海某私募的量化研究员周一上午把过去 200 个交易日的沪深300 日内对数收益堆在屏幕上,准备给一个新的日频股指期货策略估出「年化波动率」。他知道收益的真实分布参数永远看不见,手里有的只是一串样本。问题就此变形:从这 200 个数里挤出哪个数字配叫做「波动率的估计」?另一位同事在 50ETF 期权交易台做做市,他需要从最近一周的成交频次里估出每秒到单率 公...
打开 →设正的持有期乘数服从对数正态分布:若 $X\sim \mathrm{Lognormal}(\mu,\sigma^2)$,则 $\log X\sim N(\mu,\sigma^2)$。样本量为 12,且给出 $$\overline{\log X} = 0.3, \qquad \sum_{i=1}^{12}(\log X_i-0.3)^2 = 10.8。$$ 请先求 $\mu$ 与 $\sigma^2$ 的极大似然估计,再给出 $X$ 的拟合中位数。
打开 →某私募的量化研究员把新风控流程在 60 个交易日上跑出的日收益序列丢到屏幕上,样本均值比对照组高出 12 bp,样本标准差 35 bp。组合经理只关心一个问题:这 12 bp 究竟是流程改造带来的真效应,还是 60 个数里凑巧抖出来的噪声?把「凑巧」翻译成数学,就是本课要交付的工具:在一个明确的概率模型下,把「真效应」与「凑巧」分到拒绝域与接受域两边,并给做...
打开 →周一上午,某私募的量化研究员要给 LP 周报里的「日均超额收益」配上一句免责声明。点估计给出 公式、样本标准差 公式、样本量 公式。市场部追问:「这个 5.2 准吗?能不能告诉我一个区间?」她不能回答「真值有 95% 的概率落在某段里」——后面会看到这是个语言陷阱——但她可以给出一段 置信区间 (confidence interval, CI),并把...
打开 →周一上午十点,你坐在一家中型私募的研究台。3.2.2 收尾那张 tear sheet 昨晚跑完了,落到磁盘的中间产物里有一行 returns = (closes['510300.SH'].pct change().dropna()).to numpy() ——一根长度 252 的 np.ndarray ,是沪深300 ETF(510300.SH)在 2024...
打开 →为什么稀有事件型 payoff 的 Monte Carlo 估计会非常不稳定,即使大多数路径看起来都很正常?
打开 →为什么改变可交易股票池应该被视为研究搜索树上的一个额外分支,而不是无害的背景设定?
打开 →为什么虚拟变量陷阱并不只是一个无伤大雅的编码疏忽?
打开 →对于一个仅含截距的 logistic 模型,若样本中有 n_1 个正类、n_0 个负类,什么样的拟合概率 p_hat 会最大化对数似然?
打开 →某个笔记本先在全特征矩阵上做 PCA,再把得到的主成分送进每个交叉验证折。为什么这不是无害的提速优化?
打开 →上海某量化私募的两位研究员同一天上午被同一类工具卡住:小赵在搭一个「明日是否跑赢沪深300」的择时信号,标签是二元的 0/1;小李在 50ETF 期权做市数据上估「下一分钟到单笔数」,响应是非负整数 公式。模块前三课的普通最小二乘(ordinary least squares, OLS)对这两个任务都派不上用场——OLS 默认响应在正态分布(Gaussian...
打开 →线性回归作为监督学习的基线 Hook:周二早会的 OLS 提问 周二早会上,你向一家头部私募(private fund)的 PM 汇报上周的因子归因。你用沪深300 成份股过去 60 个交易日的横截面数据,对 5 个 Barra 风格因子——市值、估值、动量、质量、低波动——跑了一次普通最小二乘(ordinary least squares, OLS),这是...
打开 →