全站搜索 — 锐望实验室

全部 · 4546 课程 · 299 模块 · 72 题目 · 4169 帮助 · 6 收藏题单 · 0

找到 30 个结果

English questions

模块3.1.3 · 编程 · Python 基础

Python 打包与测试

python · packaging · pyproject · venv · uv · pip · dependencies · testing

打开 →

模块3.2.3 · 编程 · Python 数据与量化分析

SciPy 与统计工具

python · scipy · stats · distributions · fit · var · descriptive-statistics · hypothesis-testing

打开 →

模块2.6.5 · 数学与统计能力 · 机器学习理论

金融量化中的机器学习

machine-learning · financial-ml · cross-validation · purged-cv · cpcv · deflated-sharpe · multiple-testing · backtest-overfitting

打开 →

课程Python 打包与测试 · Python 基础

pytest 基础

周一开盘前一刻钟，你在私募的研究服务器上 merge 了一段对 mean price 的「无害重构」——只是把 sum(...) / len(...) 拆成两步，方便在中间加日志。脚本照常跑完，回测照常出图。下午两点你才发现 PnL 报表上 XYZ001.SH 的当日均价对不上：你在重构时把 sum 与 len 的参数搞反了，函数对所有非空输入都返回 1 。...

打开 →

题目1707 · 统计

为什么分层检验能减轻多重比较负担

研究员先检验某个行业整体是否有效，只有行业层面通过后才继续检验该行业内部的股票。为什么这种分层设计有助于减轻多重比较带来的负担？

打开 →

题目2716 · 机器学习

为什么止损规则调参同样属于多重检验

为什么在看完整段历史权益曲线之后再去选止损阈值，应该被视为回测搜索，而不是单纯的风控卫生？

打开 →

题目1720 · 统计

低先验概率下的阳性结果可信度

假设被测试的交易想法里，真正有预测力的只有 1%。某个检验流程的 power 为 80%，假阳性率为 5%。在得到一个“阳性结果”的条件下，其中真正有效的比例是多少？

打开 →

题目1685 · 统计

单侧 z 检验的检验功效

考虑在已知 $\sigma=10$、样本量 $n=25$、显著性水平 $\alpha=0.05$ 下检验 $H_0:\mu=0$ 对 $H_1:\mu>0$。若真实均值为 $\mu=4$，该检验的 power 是多少？

打开 →

题目5281 · 金融与交易

覆盖率、基于属性的测试与 Mock

周五下班前你在私募的 CI 仪表盘上看到一片绿： xyzprice 的 86 个测试全过，行覆盖率显示 95%。周一开盘九点二十，研究系统在喂一段空盘后行情时崩在了 mean price([]) 上——你写过的测试里，从来没有一个把空列表喂进去。覆盖率告诉你「这一行跑过」，但不会告诉你「这一行只在 happy path 上跑过」。上一课的 pytest 让你...

打开 →

题目1719 · 统计

0.049 与 0.051 的决策悬崖

两个回测几乎相同：一个报告 p = 0.049，另一个报告 p = 0.051。为什么仅仅因为一个低于 0.05、另一个高于 0.05，就把前者叫做“真的”、后者叫做“不真的”是糟糕做法？

打开 →

题目1704 · 统计

10 个滞后搜索后所需的样本内筛选阈值

某交易台对一个真正无效的信号尝试 10 个滞后设定。只要任一滞后的样本内 p 值低于 alpha，它就保留其中最优的那个滞后，并再要求一次新的样本外 p 值低于 10%。假设零假设下各检验独立，要使整体伪上线概率恰好为 2%，alpha 应取多少？

打开 →

题目1699 · 统计

18 个有效研究选择的 Sidak 阈值

某交易台认为，大量相关的参数微调实际上只相当于 18 个有效独立的研究选择。要把整体族误差率控制在 5%，Sidak 的单项阈值应取多少？

打开 →

题目1702 · 统计

25 次零假设试验中最小 p 值的中位数

某研究员总是从 25 个真正零假设的回测里，挑出最小的 p 值来汇报。若在零假设下这些 p 值独立且精确服从 Uniform(0,1)，这个“最小 p 值”的中位数是多少？

打开 →

题目1693 · 统计

2x2 列联表的独立性卡方检验

给定一个 2x2 列联表： $$\begin{pmatrix}30 & 20\\ 10 & 40\end{pmatrix}。$$ 请使用经典卡方检验来判断是否独立。

打开 →

题目2702 · 机器学习

50 个零假设变体里最佳 t 统计量超过 2.4 的概率

假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少？

打开 →

题目2887 · 概率

A/B 差值的集中上界

你进行一个 A/B 测试，处理组与对照组各有 $n$ 个独立 Bernoulli 观测。记样本均值为 $\bar X$ 和 $\bar Y$。请用 Hoeffding 不等式给出 \[ P\bigl((\bar X-\bar Y)-E[\bar X-\bar Y]\ge \varepsilon\bigr) \] 的上界。

打开 →

课程交易成本与市场冲击 · 回测与执行

Almgren-Chriss 成本模型

中信 CITIC 算法交易部一位资深执行交易员，正在与一家中型量化私募的投资经理通电话。私募需要在收盘前 30 分钟清掉 100 万股 600519 贵州茅台。到达价 RMB 1800.00；距离收盘 30 分钟。投资经理要求订单完成。交易员冷静地解释：「直接打盘口市价单，意味着接下来 30 秒 100% 参与率， 250 bp 冲击。30 分钟内做 TWA...

打开 →

课程金融量化中的机器学习 · 机器学习理论

Alpha 信号与特征工程:标注、元标注与信号衰减

钩子:五十条弱 alpha 与一个总组合你在一家中证500 中频量化私募(private fund)工作。研究团队在过去六个月里训练出了五十条独立的 ML alpha:有用 LightGBM 在沪深300 / 中证500 因子风格暴露上做次日 alpha 的,有 1 D CNN 在分钟线上做日内动量(momentum)的,有 Transformer 在卖...

打开 →

题目1708 · 统计

BH 过程到底控制的是什么

在目标 $q=0.10$ 的 Benjamini-Hochberg 过程中，你最终拒绝了 5 个假设。这个方法是否保证这 5 个里面恰好有 10% 是假发现？

打开 →

题目1727 · 统计

CUPED 式降方差之后的等效样本量

某种降方差方法把处理效应估计量的方差缩小到原来的 $c$ 倍，其中 $0<c<1$。等效样本量会放大多少倍？

打开 →

课程Python 打包与测试 · Python 基础

pyproject.toml 与虚拟环境

周三晚上九点，你在一家上海私募的策略组里，把白天调好的 A 股因子算子打包发给同事，让他在另一台机器上跑同样的回测。他 git clone 完，进到目录里直接 python main.py ，立刻就崩了： ModuleNotFoundError: No module named 'xyzprice' 。你叫他先 cd src && python main.p...

打开 →

课程SciPy 与统计工具 · Python 数据与量化分析

scipy.stats 分布对象与描述性统计

周一上午十点，你坐在一家中型私募的研究台。3.2.2 收尾那张 tear sheet 昨晚跑完了，落到磁盘的中间产物里有一行 returns = (closes['510300.SH'].pct change().dropna()).to numpy() ——一根长度 252 的 np.ndarray ，是沪深300 ETF（510300.SH）在 2024...

打开 →

题目1686 · 统计