SQL 与时序数据库
sql · select · join · group-by · window-functions · cte · null · timezone
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questionssql · select · join · group-by · window-functions · cte · null · timezone
打开 →某 沪深 300 私募 的 交易员 提单:『上 一 季 在 ticks 表 上 15 秒 出结果 的 1 分钟 VWAP per symbol 查询,今天 跑 了 11 分钟。Postgres 仓库 正在 维持 每秒 9 万 写入 来自 沪深 行情 网关,EXPLAIN 在 一条 仅 触 三日 数据 的 查询 上 报 1.8 亿 缓冲 读取』。L2 的 卫生...
打开 →某 沪深 300 私募 的 风控 在 飞书 上 找你:『我 昨晚 在 笔记本 样本 上 跑 30 毫秒 出结果 的 按 标的 回撤 查询,今天 打到 生产 上 跑 了 12 分钟。同样 的 SQL,同样 的 方言,同样 的 bars 1m 表——到底 什么 变了?』SQL 没变。变 的 是 行数:笔记本 5 万 行,生产 14 亿 行。『样本 上 快、生产 ...
打开 →某个周二早晨,沪深 300 量化私募的基金经理走过来:『把过去两周 510050 、 510500 、 510300 的日 VWAP 拉给我,按当日收益做横截面排名,只要 close 非空的行』。数据存在研究数据仓库里——一台部署在内网的 Postgres / PolarDB O 上, bars 1m 1 分钟 K 线表和 instrument 维度表通过外...
打开 →下午 15:30 CST,某 A 股 量化 私募。沪深 收盘 加 15:00 行情 结算 落定 之后 半 小时,行情 vendor 的 tick 510300 20260523.csv.gz 落 在 共享 挂载 /data/market data/ 上。cron 调起 ingest ticks.sh 。接下来 九十 秒 内,文件 必须 被 加载 到 暂存 表...
打开 →某交易台对一个真正无效的信号尝试 10 个滞后设定。只要任一滞后的样本内 p 值低于 alpha,它就保留其中最优的那个滞后,并再要求一次新的样本外 p 值低于 10%。假设零假设下各检验独立,要使整体伪上线概率恰好为 2%,alpha 应取多少?
打开 →某研究员总是从 25 个真正零假设的回测里,挑出最小的 p 值来汇报。若在零假设下这些 p 值独立且精确服从 Uniform(0,1),这个“最小 p 值”的中位数是多少?
打开 →假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少?
打开 →Ljung-Box 检验在收益序列上针对的零假设是什么?若拒绝了它,在实践中意味着什么担忧?
打开 →字节火山引擎的某 TiKV 同事在你刚加入沪深300量化团队的第二周走过来。他抱着一台戴尔笔记本,屏幕上是 3.5.2 L3 你亲手写的那个 SPSC 环形缓冲——给 510300.SH (沪深300 ETF) 行情事件用的,生产者一个核心、消费者一个核心,中间两个 AtomicUsize 当下标。"我们要把这段代码搬进 CFFEX 张江 COLO 的 pr...
打开 →在大样本下,你可能会看到很小的 p 值,但 Bayesian 对原假设的反对证据却并不强。为什么这并不矛盾?
打开 →某种异常形态在正常交易日里只会以 1/10,000 的概率出现。模型发现今天出现了这种形态,于是有人断言原假设几乎肯定是假的。这里忽略了哪个关键的基率问题?
打开 →某私募的量化研究员把新风控流程在 60 个交易日上跑出的日收益序列丢到屏幕上,样本均值比对照组高出 12 bp,样本标准差 35 bp。组合经理只关心一个问题:这 12 bp 究竟是流程改造带来的真效应,还是 60 个数里凑巧抖出来的噪声?把「凑巧」翻译成数学,就是本课要交付的工具:在一个明确的概率模型下,把「真效应」与「凑巧」分到拒绝域与接受域两边,并给做...
打开 →某个检验统计量在标准正态原假设下取值为 $z=2.1$。请近似给出对应的单侧和双侧 p 值。
打开 →某交易台研究 30 个真正无效的信号。对每个信号,它会尝试 4 个回看窗口;若其中任一窗口的样本内 p 值低于 10%,该信号就进入下一轮,然后还必须通过一次新的 5% 样本外检验。假设在零假设下各检验独立,伪入围者的期望数量是多少?
打开 →一位 头部 量化 私募 基金 经理 周五 走 进 研究 总监 的 办公室 端 着 一 张 幻灯片 —— 五 年 评估 窗口 上 沪深 300 横截面 净 扣 成本 后 夏普 比率 2.0,t 统计量 4.5,样本外 净 值 曲线 漂亮 至极。研究 总监 翻 到 方法 学 那 页。"你 的 N 是 多少?" "我 在 相同 窗口 上 筛 了 大约 100 个 ...
打开 →为什么把“大 p 值”直接读成“原假设大概率为真”是危险的?
打开 →研究员生成了 240 个高度相关的策略变体,但认为它们只相当于 24 个“有效独立”的策略家族。若交易台仍把任何 p 值低于 8% 的家族都当作发现,那么在零假设下至少出现一个伪家族赢家的近似概率是多少?
打开 →某国内头部私募(类似幻方量化)的初级 quant 第一次用 C++ 写了一个五日滚动 VWAP 函数。它加载 510300.SH 收盘价、用 new double[5] 申一段 buffer、算滚动均值、返回结果。单元测试过。集成测试过。两周后,同一个函数被一段每秒跑一万次的热路径调用,交易进程在一天之内常驻内存悄悄涨到 80 GB,直到内核 OOM kil...
打开 →周日晚上 11 点的消息 某私募的中后台周日晚上甩来一条消息:风控组明早要用你写的 summarise.py 跑一份沪深300成分股的 tick 滚动 VWAP,他们那台服务器装的是干净的 Python 3.11、没装你电脑上的任何包。你抓起脚本一看,它现在还是 notebook 里那个用 print 打日志、入口写在最后一格、依赖装在 /anaconda3...
打开 →国内某私募 CSI 300 ETF 期权桌的资深 C++ engineer 在审一份六年前写就的策略库——它要进 live engine。他贴在每一份源码上的 PR review 评论只有一行:「这里裸 new ——改成 std::make unique 。」这份库是 C++03 风格写的, delete 散布在异常处理路径上,等一个错位的 throw 就足...
打开 →某实验在 5% 水平下未能拒绝零假设。团队于是写道“零假设被接受了”。正确的修正应该是什么?
打开 →某位评审写道:“p = 0.07 表明零假设为真的概率是 7%。” 这里的条件方向哪里错了?
打开 →某交易台把研究对象分成 12 个板块,每个板块内有 5 个真正无效的变体。它在每个板块里只保留最小的 p 值;若该最小 p 值低于 1%,就把该板块标记出来。若假设独立,至少有一个板块被错误标记的概率是多少?
打开 →国内某私募 CSI 300 ETF 期权桌的风险分析师在翻夜间对账日志:四十笔 510300 期权报价的隐含波动率(IV)显示为整齐的 1.0 。这不是市场信号,而是上一代 IV 求解器在「未收敛」时使用的 sentinel value。当下游的偏斜模型把 1.0 一起平均进去,报告的偏斜被肉眼可见地拖偏,早会因此浪费了三十分钟去追一个根本不存在的数字。修复...
打开 →周五下午两点半,浦东陆家嘴一家中型私募的风控会上,PM 把昨晚跑出来的 tear sheet 推过来:「食品饮料这只 600519.SH 的 63 日滚动 夏普比率 (Sharpe ratio)样本期均值是 0.86,银行那两只 000001.SZ 和 600036.SH 是 0.42。0.44 的差,可信吗?」你脑子里第一反应是 3.2.2 L5 那...
打开 →某交易台尝试了 80 个真正无效的策略想法。只有先通过 10% 的样本内筛选、再通过 5% 的独立样本外确认,策略才会被保留,并假设在零假设下两次检验相互独立。至少有一个无效想法同时穿过两道关卡的概率是多少?
打开 →某研究平台跑了 200 个零假设策略。只有样本内 p 值低于 15% 的策略会被晋级,而每个晋级策略还必须通过一次新的 5% 确认检验。若在零假设下假设两阶段独立,最终穿过两阶段的伪策略期望数是多少?
打开 →国内某头部私募(类似九坤投资)的风控分析师接手了一份 C++ 工具,功能是吃下一个 510300.SH 成交 CSV、把它聚合成五分钟 bar 序列。工具在 happy path 上工作。第一次某行格式异常的 CSV 把 parse double 送进了 throw std::runtime error("bad price") ,进程就漏掉了那个已经打开的...
打开 →国内某私募中频组的风控同事接手一段用 Rust 写的报单解析器: 从某证券公司的 CSV 报价流读 510300.SH 沪深300 ETF 期权报单, 把每一行变成一个强类型的 Order 值。核心函数只有六行, 用三个 ? 把 parse:: 、 parse:: 、 .ok or(...) 串成一条链。当某一行非法——symbol 为空、价格为负、数量为零...
打开 →