为什么后验均值会变而 MLE 不会
某交易台只观察到了 4 次新的违约事件,研究的是一个很罕见的违约率。加入一个较强的历史 Beta 先验后,Bayesian 的后验均值明显低于样本比例;而 frequentist 的 MLE 却恰好等于样本比例。为什么这两个答案可以合理不同?它们各自是在什么条件下做推断?
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 21 个结果
English questions某交易台只观察到了 4 次新的违约事件,研究的是一个很罕见的违约率。加入一个较强的历史 Beta 先验后,Bayesian 的后验均值明显低于样本比例;而 frequentist 的 MLE 却恰好等于样本比例。为什么这两个答案可以合理不同?它们各自是在什么条件下做推断?
打开 →某个二元交易信号在最近 80 个交易日中有 44 天为正收益。将每天是否赚钱建模为相互独立的 Bernoulli$(p)$ 结果。 请先求 $p$ 的极大似然估计,再在该估计下给出未来 3 天都赚钱的概率。
打开 →设短周期定价误差服从 i.i.d. Laplace$(\mu,b)$,其中尺度参数已知为 $b=2$,密度与 $e^{-|x-\mu|/2}$ 成正比。样本为 $$-1,\;0,\;2,\;2,\;3,\;5,\;7。$$ 请给出 $\mu$ 的极大似然估计。
打开 →设大额执行滑点的绝对值服从已知尺度 $x_m=1$、未知尾指数 $\alpha$ 的 Pareto 分布,其密度为 $$f(x)=\alpha x^{-\alpha-1}, \qquad x\ge 1.$$ 若 $n=8$ 个观测满足 $$\sum_{i=1}^8 \log X_i = 12,$$ 请先求 $\alpha$ 的极大似然估计,再估计拟合模型下 $P(X>10)$。
打开 →某交易场所在连续 40 分钟内记录到 120 次子单到达。假设到达过程服从强度为 $\lambda$(单位:每分钟)的齐次 Poisson 过程。 请先求 $\lambda$ 的极大似然估计,再给出拟合模型下下一分钟没有任何到达的概率。
打开 →一个市场状态模型有三种情形:平稳、趋势和失衡,对应概率为 $(p_1,p_2,p_3)$。在 100 个交易日中,观测到 20 天平稳、30 天趋势、50 天失衡。 请给出 $(p_1,p_2,p_3)$ 的极大似然估计。
打开 →某策略会不断重复尝试,直到第一次得到盈利成交。记 $X$ 为第一次成功前所需的尝试次数,取值为 $1,2,\ldots$,并假设 $X\sim \mathrm{Geometric}(p)$。 若大量独立样本的样本均值为 $4$,请给出 $p$ 的极大似然估计;在该拟合下,至少需要 4 次尝试的概率是多少?
打开 →设 5 个独立样本来自 $\mathrm{Uniform}(0,\theta)$,其中样本最大值为 $7.4$。 请先求 $\theta$ 的极大似然估计,再给出拟合分布的中位数估计。
打开 →设成交持续时间服从形状参数已知为 $k=3$、尺度参数未知为 $\theta$ 的 Gamma 分布。在这一参数化下,有 $$E[X]=k\theta。$$ 若样本均值为 $12$,请给出 $\theta$ 的极大似然估计。
打开 →设执行延迟服从 Weibull 分布,已知形状参数 $k=2$、未知尺度参数 $\lambda$,其密度为 $$f(x)=\frac{2x}{\lambda^2}e^{-(x/\lambda)^2}, \qquad x>0.$$ 若 $n=10$ 个观测满足 $$\sum_{i=1}^{10} X_i^2 = 90,$$ 请给出 $\lambda$ 的极大似然估计。
打开 →设 $X_1,\dots,X_{25}\sim N(\mu,4)$ 独立同分布,样本均值为 $\bar X=1.2$。 请先求 $\mu$ 的极大似然估计,再利用不变性给出 $e^{\mu}$ 的估计。
打开 →某交易场所研究下一次价差扩大的等待时间。8 个观测窗口都最多跟踪 5 秒,其中 5 个窗口在 5 秒内发生了事件,另外 3 个窗口在 5 秒处右删失。所有窗口累计暴露时间总和为 40 秒。 假设事件时间独立且服从 $\mathrm{Exp}(\lambda)$,请给出 $\lambda$ 的极大似然估计。
打开 →10 个相互独立的中间价跳变等待时间总和为 25 秒。假设每个等待时间都服从参数为 $\lambda$ 的指数分布 $\mathrm{Exp}(\lambda)$。 请求出 $\lambda$ 的极大似然估计,并在拟合模型下给出等待时间的中位数。
打开 →设观测满足 $$Y_i = \beta X_i + \varepsilon_i, \qquad \varepsilon_i\stackrel{iid}{\sim}N(0,\sigma^2),$$ 其中没有截距项,误差为已知方差的高斯噪声。已知 $$\sum X_iY_i = 48, \qquad \sum X_i^2 = 16。$$ 请给出 $\beta$ 的极大似然估计。
打开 →设 $X_1,\dots,X_9$ 独立同分布于 $N(\mu,\sigma^2)$。样本给出的统计量为 $$\bar X = 5, \qquad \sum_{i=1}^9 (X_i-\bar X)^2 = 18.$$ 请求出 $\mu$ 和 $\sigma^2$ 的极大似然估计。
打开 →设正的持有期乘数服从对数正态分布:若 $X\sim \mathrm{Lognormal}(\mu,\sigma^2)$,则 $\log X\sim N(\mu,\sigma^2)$。样本量为 12,且给出 $$\overline{\log X} = 0.3, \qquad \sum_{i=1}^{12}(\log X_i-0.3)^2 = 10.8。$$ 请先求 $\mu$ 与 $\sigma^2$ 的极大似然估计,再给出 $X$ 的拟合中位数。
打开 →为什么稀有事件型 payoff 的 Monte Carlo 估计会非常不稳定,即使大多数路径看起来都很正常?
打开 →为什么改变可交易股票池应该被视为研究搜索树上的一个额外分支,而不是无害的背景设定?
打开 →为什么虚拟变量陷阱并不只是一个无伤大雅的编码疏忽?
打开 →对于一个仅含截距的 logistic 模型,若样本中有 n_1 个正类、n_0 个负类,什么样的拟合概率 p_hat 会最大化对数似然?
打开 →某个笔记本先在全特征矩阵上做 PCA,再把得到的主成分送进每个交叉验证折。为什么这不是无害的提速优化?
打开 →