SQL 与时序数据库
sql · select · join · group-by · window-functions · cte · null · timezone
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questionssql · select · join · group-by · window-functions · cte · null · timezone
打开 →probability · joint-distribution · marginal-distribution · joint-pdf · joint-pmf · jacobian · conditional-distribution · independence
打开 →某股票多空策略私募的信号研究员每天跑一条回归:下周收益对动量因子的回归。他把拟合直线写为 r hat = a + b signal 。在抽样之前,这条直线是什么?它就是 (收益, 信号) 的联合分布下的 总体条件期望 (population conditional expectation)公式 ——而在沪深300 因子收益满足联合正态(joint n...
打开 →某私募的风险分析师每天早盘从终端上抓两个数:沪深300 ETF 的日收益与 10 年国债收益率的日变动。她真正关心的不是任何一个单变量,而是两者的 联合 画像:沪深300 跌超 1% 同时 10 年期收益率跳升 5bp 的概率。这类问题任何单变量密度都回答不了——它本质上是一个联合分布(joint distribution)问题。这一节把你在 2...
打开 →国内某 SSE 接入团队接到任务: 把老 C++ + Boost.Asio 写的行情接入网关重构成 Rust, 单台机器要同时维持 8000 条 TCP 长连接, 把 510300.SH (沪深300 ETF) 等几百只标的的 tick 流落到内部撮合面板。架构师扫一眼说: 上 tokio——别想着每条连接派一个 OS 线程, 8000 个 OS 线程在调度...
打开 →设 $X_1, \ldots, X_n$ 为 iid $\operatorname{Uniform}(0,1)$。考虑顺序统计量 $X_{(i)}$ 和 $X_{(j)}$,其中 $1 \le i < j \le n$。
打开 →设 $X_1, X_2 \sim \text{iid } N(0,1)$,$R = X_1^2 + X_2^2$。 (a) 利用极坐标推导 $(R, \Theta)$ 的联合密度。 (b) 对 $\Theta$ 积分,求 $R$ 的密度并识别其分布。
打开 →设 $X$ 和 $Y$ 为独立的 $\operatorname{Exp}(1)$ 随机变量,令 $R = X/Y$。 (a) 利用变换 $(R,S) = (X/Y,\,Y)$,通过雅可比行列式求 $f_{R,S}$,再对 $S$ 积分得到 $R$ 的 PDF。 (b) 将 $f_R$ 识别为某个已知分布,并利用对称性论证验证 $P(R \le 1)$。
打开 →设 $Z_1, Z_2$ 独立,均服从 $N(0,1)$。定义 $R = Z_1/Z_2$。 (a) 写出 $(Z_1, Z_2)$ 的联合 PDF,利用变换 $(Z_1, Z_2) \mapsto (R, Z_2) = (Z_1/Z_2,\, Z_2)$ 推导 $(R, Z_2)$ 的联合 PDF。 (b) 对 $Z_2$ 积分,得到 $R$ 的边际 PDF。 (c) 辨认 $R$ 的分布。
打开 →设 $X \sim \text{Gamma}(\alpha, 1)$,$Y \sim \text{Gamma}(\beta, 1)$ 独立。 (a) 定义 $U = \frac{X}{X+Y}$,$V = X+Y$。计算变换 $(X,Y) \mapsto (U,V)$ 的雅可比行列式。 (b) 推导 $(U,V)$ 的联合 PDF,并证明 $U$ 与 $V$ 独立。 (c) 识别 $U$ 的边际分布,并证明 $B(\alpha,\beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\be
打开 →设 \[ M_{X,Y}(s,t)=\exp\!\bigl(2s-t+2s^2+3st+\tfrac52 t^2\bigr). \] 计算 $E[X]$、$E[Y]$、$\mathrm{Var}(X)$、$\mathrm{Var}(Y)$ 以及 $\mathrm{Cov}(X,Y)$。
打开 →设 $X_1,\ldots,X_n$ 为 iid $\operatorname{Uniform}(0,1)$($n\ge 2$)。中程定义为 $M=\frac{X_{(1)}+X_{(n)}}{2}$。利用 $(X_{(1)},X_{(n)})$ 的联合密度推导 $M$ 的 PDF。
打开 →设 $X$ 和 $Y$ 为独立的 $\text{Bernoulli}(1/2)$ 随机变量。定义 $Z = X \oplus Y$(模 2 加法)。(a) 证明 $Z \sim \text{Bernoulli}(1/2)$。(b) 证明 $\{X, Y, Z\}$ 中任意两个随机变量相互独立。(c) $X$、$Y$、$Z$ 是否相互独立?给出违反相互独立条件的具体联合事件。
打开 →某 沪深 300 私募 的 交易员 提单:『上 一 季 在 ticks 表 上 15 秒 出结果 的 1 分钟 VWAP per symbol 查询,今天 跑 了 11 分钟。Postgres 仓库 正在 维持 每秒 9 万 写入 来自 沪深 行情 网关,EXPLAIN 在 一条 仅 触 三日 数据 的 查询 上 报 1.8 亿 缓冲 读取』。L2 的 卫生...
打开 →设 $X_1, \ldots, X_n$ 为 iid $\operatorname{Uniform}(0,1)$。令 $X_{(1)} = \min_i X_i$,$X_{(n)} = \max_i X_i$。
打开 →某 沪深 300 私募 的 风控 在 飞书 上 找你:『我 昨晚 在 笔记本 样本 上 跑 30 毫秒 出结果 的 按 标的 回撤 查询,今天 打到 生产 上 跑 了 12 分钟。同样 的 SQL,同样 的 方言,同样 的 bars 1m 表——到底 什么 变了?』SQL 没变。变 的 是 行数:笔记本 5 万 行,生产 14 亿 行。『样本 上 快、生产 ...
打开 →设 $X \sim \operatorname{Gamma}(\alpha,1)$,$Y \sim \operatorname{Gamma}(\beta,1)$ 独立。利用变换 $(W,S) = (X/(X+Y),\,X+Y)$: (a) 计算逆变换的雅可比行列式。 (b) 推导联合密度 $f_{W,S}$ 并对 $S$ 积分,证明 $W \sim \operatorname{Beta}(\alpha,\beta)$。 (c) 证明 $W$ 与 $S$ 独立。
打开 →一枚均匀硬币:正面朝上时令 $(X, Y) = (1, 1)$;反面朝上时独立地抽取 $X, Y \sim \text{Bernoulli}(1/2)$。(a) 求 $(X, Y)$ 的完整联合分布。(b) 证明 $X$ 和 $Y$ 的边缘分布相同。(c) $X$ 和 $Y$ 是否独立?证明你的结论。(d) 计算 $P(X = 1 \mid Y = 0)$,并与 $P(X = 1)$ 比较。解释结果。
打开 →设 $X$ 和 $Y$ 为独立的 $\text{Bernoulli}(1/2)$ 随机变量。定义 $W = \max(X, Y)$。(a) 求 $W$ 的分布。(b) 通过检验所有联合概率 $P(X = x, W = w)$($x, w \in \{0, 1\}$)判断 $X$ 和 $W$ 是否独立。
打开 →设 $X_1, X_2 \sim \text{iid } N(0,1)$。利用变换 $(Y,V)=(X_1/X_2, X_2)$: (a) 推导联合密度 $f_{Y,V}(y,v)$。 (b) 对 $V$ 积分,求 $Y=X_1/X_2$ 的边际密度并识别分布。
打开 →设 $X \sim \chi^2(m)$,$Y \sim \chi^2(n)$ 独立,$F = (X/m)/(Y/n)$。 (a) 利用变换 $(F,W)=(nX/(mY), Y)$,计算雅可比并推导联合密度。 (b) 对 $W$ 积分得 $F$ 的边际 PDF,验证为 $F(m,n)$ 分布。 (c) 证明 $E[F] = n/(n-2)$($n>2$)。
打开 →对标准布朗运动,在 t = 1 内,要使 P(max_{0<=s<=1} W_s >= a, W_1 <= 0) = 0.05,障碍 a 应取多少?
打开 →设 \[ M_{X,Y}(s,t)=\exp\!\left(s+2t+\frac{s^2}{2}+2t^2\right). \] 识别 $X$ 与 $Y$ 的边缘分布,并判断它们是否独立。
打开 →对标准布朗运动,在 t = 1、障碍 a = 1 的情况下,要使 P(max_{0<=s<=1} W_s >= 1, W_1 <= b) = 0.10,终点上限 b 应取多少?
打开 →某个周二早晨,沪深 300 量化私募的基金经理走过来:『把过去两周 510050 、 510500 、 510300 的日 VWAP 拉给我,按当日收益做横截面排名,只要 close 非空的行』。数据存在研究数据仓库里——一台部署在内网的 Postgres / PolarDB O 上, bars 1m 1 分钟 K 线表和 instrument 维度表通过外...
打开 →设 $U_1, U_2$ 为独立的 $\operatorname{Uniform}(0,1)$ 随机变量,定义 $$Z_1 = \sqrt{-2\ln U_1}\,\cos(2\pi U_2),\quad Z_2 = \sqrt{-2\ln U_1}\,\sin(2\pi U_2).$$ (a) 计算从 $(Z_1,Z_2)$ 到 $(U_1,U_2)$ 逆变换的雅可比行列式。 (b) 证明 $Z_1$ 和 $Z_2$ 是独立的 $N(0,1)$ 随机变量。
打开 →设 $\Omega$ 为所有含偶数个 $1$ 的长度为 $4$ 的二进制串,等概率: $$\Omega = \{0000,\, 0011,\, 0101,\, 0110,\, 1001,\, 1010,\, 1100,\, 1111\}.$$ 定义事件 $A_i = \{\omega \in \Omega : \omega_i = 1\}$,$i=1,2,3,4$。 (a) 证明每个 $P(A_i) = 1/2$。 (b) 验证所有两两独立:对所有 $i \neq j$,$P(A_i \cap A_j) = 1/4$。 (c) 验证所有三元独立:对
打开 →设 $X$ 和 $Y$ 独立,均服从 $\text{Uniform}(0,1)$。定义 $S = X + Y$。 (a) 利用卷积公式 $f_S(s) = \int_{-\infty}^{\infty} f_X(t) f_Y(s-t) dt$ 推导 $S$ 在所有 $s \in \mathbb{R}$ 上的 PDF。 (b) 画出 PDF 的草图并说明该分布的名称。 (c) 计算 $P(S > 1.5)$。
打开 →设 $X$ 和 $Y$ 为独立的 $\operatorname{Uniform}(0,1)$ 随机变量。利用卷积公式推导 $Z = X + Y$ 的概率密度函数。
打开 →设 $X$ 和 $Y$ 为独立的 $\operatorname{Uniform}(0,1)$ 随机变量。利用变换 $(W,V)=(XY,\,Y)$,推导 $W = XY$ 的概率密度函数。
打开 →