GLOBAL SEARCH

搜索课程、模块、题目与收藏题单

搜索在服务端完成，题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。

全部 · 4546 课程 · 299 模块 · 72 题目 · 4169 帮助 · 6 收藏题单 · 0

找到 29 个结果

English questions

题目3237 · 统计

为什么后验均值会变而 MLE 不会

某交易台只观察到了 4 次新的违约事件，研究的是一个很罕见的违约率。加入一个较强的历史 Beta 先验后，Bayesian 的后验均值明显低于样本比例；而 frequentist 的 MLE 却恰好等于样本比例。为什么这两个答案可以合理不同？它们各自是在什么条件下做推断？

课程参数估计与假设检验 · 统计推断

估计量的性质:偏差、方差与信息量

上海某私募的量化研究员把上一课跑出来的两个候选估计量并排放着:一个是无偏的样本方差公式(分母公式),另一个是极大似然估计(maximum likelihood estimation, MLE)的方差版公式(分母公式)。直觉告诉他「无偏」听起来更值得信赖,但当真到了要在波动率模型里塞一个数,他需要的是一把明确可比较的「好坏」尺子——能告诉他在公式的...

模块2.2.1 · 数学与统计能力 · 统计推断

参数估计与假设检验

MLE · 假设检验 · 置信区间 · Bootstrap

题目1636 · 统计

Bernoulli 信号命中率的极大似然估计

某个二元交易信号在最近 80 个交易日中有 44 天为正收益。将每天是否赚钱建模为相互独立的 Bernoulli$(p)$ 结果。请先求 $p$ 的极大似然估计，再在该估计下给出未来 3 天都赚钱的概率。

题目1645 · 统计

Laplace 位置参数的极大似然估计

设短周期定价误差服从 i.i.d. Laplace$(\mu,b)$，其中尺度参数已知为 $b=2$，密度与 $e^{-|x-\mu|/2}$ 成正比。样本为 $$-1,\;0,\;2,\;2,\;3,\;5,\;7。$$ 请给出 $\mu$ 的极大似然估计。

题目1643 · 统计

Pareto 尾部指数的极大似然估计

设大额执行滑点的绝对值服从已知尺度 $x_m=1$、未知尾指数 $\alpha$ 的 Pareto 分布，其密度为 $$f(x)=\alpha x^{-\alpha-1}, \qquad x\ge 1.$$ 若 $n=8$ 个观测满足 $$\sum_{i=1}^8 \log X_i = 12,$$ 请先求 $\alpha$ 的极大似然估计，再估计拟合模型下 $P(X>10)$。

题目1637 · 统计

Poisson 订单到达强度的极大似然估计

某交易场所在连续 40 分钟内记录到 120 次子单到达。假设到达过程服从强度为 $\lambda$（单位：每分钟）的齐次 Poisson 过程。请先求 $\lambda$ 的极大似然估计，再给出拟合模型下下一分钟没有任何到达的概率。

题目1642 · 统计

三状态多项分布模型的极大似然估计

一个市场状态模型有三种情形：平稳、趋势和失衡，对应概率为 $(p_1,p_2,p_3)$。在 100 个交易日中，观测到 20 天平稳、30 天趋势、50 天失衡。请给出 $(p_1,p_2,p_3)$ 的极大似然估计。

题目1641 · 统计

几何分布成功概率的极大似然估计

某策略会不断重复尝试，直到第一次得到盈利成交。记 $X$ 为第一次成功前所需的尝试次数，取值为 $1,2,\ldots$，并假设 $X\sim \mathrm{Geometric}(p)$。若大量独立样本的样本均值为 $4$，请给出 $p$ 的极大似然估计；在该拟合下，至少需要 4 次尝试的概率是多少？

题目1640 · 统计

均匀分布上界的极大似然估计

设 5 个独立样本来自 $\mathrm{Uniform}(0,\theta)$，其中样本最大值为 $7.4$。请先求 $\theta$ 的极大似然估计，再给出拟合分布的中位数估计。

题目1649 · 统计

已知形状参数时 Gamma 尺度的极大似然估计

设成交持续时间服从形状参数已知为 $k=3$、尺度参数未知为 $\theta$ 的 Gamma 分布。在这一参数化下，有 $$E[X]=k\theta。$$ 若样本均值为 $12$，请给出 $\theta$ 的极大似然估计。

题目1644 · 统计

已知形状参数时 Weibull 尺度的极大似然估计

设执行延迟服从 Weibull 分布，已知形状参数 $k=2$、未知尺度参数 $\lambda$，其密度为 $$f(x)=\frac{2x}{\lambda^2}e^{-(x/\lambda)^2}, \qquad x>0.$$ 若 $n=10$ 个观测满足 $$\sum_{i=1}^{10} X_i^2 = 90,$$ 请给出 $\lambda$ 的极大似然估计。

题目1650 · 统计

已知方差正态模型中的不变性估计

设 $X_1,\dots,X_{25}\sim N(\mu,4)$ 独立同分布，样本均值为 $\bar X=1.2$。请先求 $\mu$ 的极大似然估计，再利用不变性给出 $e^{\mu}$ 的估计。

题目1646 · 统计

带右删失的指数模型极大似然估计

某交易场所研究下一次价差扩大的等待时间。8 个观测窗口都最多跟踪 5 秒，其中 5 个窗口在 5 秒内发生了事件，另外 3 个窗口在 5 秒处右删失。所有窗口累计暴露时间总和为 40 秒。假设事件时间独立且服从 $\mathrm{Exp}(\lambda)$，请给出 $\lambda$ 的极大似然估计。

题目1638 · 统计

指数等待时间模型的极大似然估计

10 个相互独立的中间价跳变等待时间总和为 25 秒。假设每个等待时间都服从参数为 $\lambda$ 的指数分布 $\mathrm{Exp}(\lambda)$。请求出 $\lambda$ 的极大似然估计，并在拟合模型下给出等待时间的中位数。

题目1648 · 统计

无截距高斯回归中的极大似然估计

设观测满足 $$Y_i = \beta X_i + \varepsilon_i, \qquad \varepsilon_i\stackrel{iid}{\sim}N(0,\sigma^2),$$ 其中没有截距项，误差为已知方差的高斯噪声。已知 $$\sum X_iY_i = 48, \qquad \sum X_i^2 = 16。$$ 请给出 $\beta$ 的极大似然估计。

题目1639 · 统计

正态模型中均值与方差的联合极大似然估计

设 $X_1,\dots,X_9$ 独立同分布于 $N(\mu,\sigma^2)$。样本给出的统计量为 $$\bar X = 5, \qquad \sum_{i=1}^9 (X_i-\bar X)^2 = 18.$$ 请求出 $\mu$ 和 $\sigma^2$ 的极大似然估计。

课程参数估计与假设检验 · 统计推断

点估计:矩估计与极大似然估计

上海某私募的量化研究员周一上午把过去 200 个交易日的沪深300 日内对数收益堆在屏幕上,准备给一个新的日频股指期货策略估出「年化波动率」。他知道收益的真实分布参数永远看不见,手里有的只是一串样本。问题就此变形:从这 200 个数里挤出哪个数字配叫做「波动率的估计」?另一位同事在 50ETF 期权交易台做做市,他需要从最近一周的成交频次里估出每秒到单率公...

题目1647 · 统计

由对数样本统计量求对数正态模型的极大似然估计

设正的持有期乘数服从对数正态分布：若 $X\sim \mathrm{Lognormal}(\mu,\sigma^2)$，则 $\log X\sim N(\mu,\sigma^2)$。样本量为 12，且给出 $$\overline{\log X} = 0.3, \qquad \sum_{i=1}^{12}(\log X_i-0.3)^2 = 10.8。$$ 请先求 $\mu$ 与 $\sigma^2$ 的极大似然估计，再给出 $X$ 的拟合中位数。

课程参数估计与假设检验 · 统计推断

假设检验与 P 值

某私募的量化研究员把新风控流程在 60 个交易日上跑出的日收益序列丢到屏幕上,样本均值比对照组高出 12 bp,样本标准差 35 bp。组合经理只关心一个问题:这 12 bp 究竟是流程改造带来的真效应,还是 60 个数里凑巧抖出来的噪声?把「凑巧」翻译成数学,就是本课要交付的工具:在一个明确的概率模型下,把「真效应」与「凑巧」分到拒绝域与接受域两边,并给做...

课程参数估计与假设检验 · 统计推断

置信区间与自助法

周一上午,某私募的量化研究员要给 LP 周报里的「日均超额收益」配上一句免责声明。点估计给出公式、样本标准差公式、样本量公式。市场部追问:「这个 5.2 准吗?能不能告诉我一个区间?」她不能回答「真值有 95% 的概率落在某段里」——后面会看到这是个语言陷阱——但她可以给出一段置信区间 (confidence interval, CI),并把...

课程SciPy 与统计工具 · Python 数据与量化分析

scipy.stats 分布对象与描述性统计

周一上午十点，你坐在一家中型私募的研究台。3.2.2 收尾那张 tear sheet 昨晚跑完了，落到磁盘的中间产物里有一行 returns = (closes['510300.SH'].pct change().dropna()).to numpy() ——一根长度 252 的 np.ndarray ，是沪深300 ETF（510300.SH）在 2024...

题目2388 · 数学

为什么稀有事件会导致巨大的 Monte Carlo 噪声 18

为什么稀有事件型 payoff 的 Monte Carlo 估计会非常不稳定，即使大多数路径看起来都很正常？

题目2708 · 机器学习

为什么股票池选择也是搜索树的一部分

为什么改变可交易股票池应该被视为研究搜索树上的一个额外分支，而不是无害的背景设定？

题目4188 · 机器学习

为什么虚拟变量陷阱不只是编码小错误

为什么虚拟变量陷阱并不只是一个无伤大雅的编码疏忽？

题目2521 · 机器学习

仅截距 logistic 的极大似然估计 1

对于一个仅含截距的 logistic 模型，若样本中有 n_1 个正类、n_0 个负类，什么样的拟合概率 p_hat 会最大化对数似然？

题目2457 · 机器学习

在交叉验证之前一次性拟合 PCA

某个笔记本先在全特征矩阵上做 PCA，再把得到的主成分送进每个交叉验证折。为什么这不是无害的提速优化？

课程回归与广义线性模型 · 统计推断

广义线性模型

上海某量化私募的两位研究员同一天上午被同一类工具卡住:小赵在搭一个「明日是否跑赢沪深300」的择时信号,标签是二元的 0/1;小李在 50ETF 期权做市数据上估「下一分钟到单笔数」,响应是非负整数公式。模块前三课的普通最小二乘(ordinary least squares, OLS)对这两个任务都派不上用场——OLS 默认响应在正态分布(Gaussian...

课程监督学习基础 · 机器学习理论

线性回归作为监督学习的基线

线性回归作为监督学习的基线 Hook：周二早会的 OLS 提问周二早会上，你向一家头部私募（private fund）的 PM 汇报上周的因子归因。你用沪深300 成份股过去 60 个交易日的横截面数据，对 5 个 Barra 风格因子——市值、估值、动量、质量、低波动——跑了一次普通最小二乘（ordinary least squares, OLS），这是...