Python 打包与测试
python · packaging · pyproject · venv · uv · pip · dependencies · testing
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questionspython · packaging · pyproject · venv · uv · pip · dependencies · testing
打开 →python · scipy · stats · distributions · fit · var · descriptive-statistics · hypothesis-testing
打开 →machine-learning · financial-ml · cross-validation · purged-cv · cpcv · deflated-sharpe · multiple-testing · backtest-overfitting
打开 →周一开盘前一刻钟,你在私募的研究服务器上 merge 了一段对 mean price 的「无害重构」——只是把 sum(...) / len(...) 拆成两步,方便在中间加日志。脚本照常跑完,回测照常出图。下午两点你才发现 PnL 报表上 XYZ001.SH 的当日均价对不上:你在重构时把 sum 与 len 的参数搞反了,函数对所有非空输入都返回 1 。...
打开 →研究员先检验某个行业整体是否有效,只有行业层面通过后才继续检验该行业内部的股票。为什么这种分层设计有助于减轻多重比较带来的负担?
打开 →为什么在看完整段历史权益曲线之后再去选止损阈值,应该被视为回测搜索,而不是单纯的风控卫生?
打开 →假设被测试的交易想法里,真正有预测力的只有 1%。某个检验流程的 power 为 80%,假阳性率为 5%。在得到一个“阳性结果”的条件下,其中真正有效的比例是多少?
打开 →考虑在已知 $\sigma=10$、样本量 $n=25$、显著性水平 $\alpha=0.05$ 下检验 $H_0:\mu=0$ 对 $H_1:\mu>0$。若真实均值为 $\mu=4$,该检验的 power 是多少?
打开 →一个等权组合持有两只资产,波动率分别为 0.04 和 0.09。当前相关系数估计为 -0.2,但压力测试把它上调到 +0.3。在权重不变的情况下,新的组合波动率是多少?与原先估计相比会上升多少个波动率点?
打开 →周五下班前你在私募的 CI 仪表盘上看到一片绿: xyzprice 的 86 个测试全过,行覆盖率显示 95%。周一开盘九点二十,研究系统在喂一段空盘后行情时崩在了 mean price([]) 上——你写过的测试里,从来没有一个把空列表喂进去。覆盖率告诉你「这一行跑过」,但不会告诉你「这一行只在 happy path 上跑过」。上一课的 pytest 让你...
打开 →两个回测几乎相同:一个报告 p = 0.049,另一个报告 p = 0.051。为什么仅仅因为一个低于 0.05、另一个高于 0.05,就把前者叫做“真的”、后者叫做“不真的”是糟糕做法?
打开 →某交易台对一个真正无效的信号尝试 10 个滞后设定。只要任一滞后的样本内 p 值低于 alpha,它就保留其中最优的那个滞后,并再要求一次新的样本外 p 值低于 10%。假设零假设下各检验独立,要使整体伪上线概率恰好为 2%,alpha 应取多少?
打开 →某交易台认为,大量相关的参数微调实际上只相当于 18 个有效独立的研究选择。要把整体族误差率控制在 5%,Sidak 的单项阈值应取多少?
打开 →某研究员总是从 25 个真正零假设的回测里,挑出最小的 p 值来汇报。若在零假设下这些 p 值独立且精确服从 Uniform(0,1),这个“最小 p 值”的中位数是多少?
打开 →给定一个 2x2 列联表: $$\begin{pmatrix}30 & 20\\ 10 & 40\end{pmatrix}。$$ 请使用经典卡方检验来判断是否独立。
打开 →假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少?
打开 →你进行一个 A/B 测试,处理组与对照组各有 $n$ 个独立 Bernoulli 观测。记样本均值为 $\bar X$ 和 $\bar Y$。请用 Hoeffding 不等式给出 \[ P\bigl((\bar X-\bar Y)-E[\bar X-\bar Y]\ge \varepsilon\bigr) \] 的上界。
打开 →中信 CITIC 算法交易部一位资深执行交易员,正在与一家中型量化私募的投资经理通电话。私募需要在收盘前 30 分钟清掉 100 万股 600519 贵州茅台。到达价 RMB 1800.00;距离收盘 30 分钟。投资经理要求订单完成。交易员冷静地解释:「直接打盘口市价单,意味着接下来 30 秒 100% 参与率, 250 bp 冲击。30 分钟内做 TWA...
打开 →钩子:五十条弱 alpha 与一个总组合 你在一家中证500 中频量化私募(private fund)工作。研究团队在过去六个月里训练出了五十条独立的 ML alpha:有用 LightGBM 在 沪深300 / 中证500 因子风格暴露上做次日 alpha 的,有 1 D CNN 在分钟线上做日内动量(momentum)的,有 Transformer 在卖...
打开 →在目标 $q=0.10$ 的 Benjamini-Hochberg 过程中,你最终拒绝了 5 个假设。这个方法是否保证这 5 个里面恰好有 10% 是假发现?
打开 →某种降方差方法把处理效应估计量的方差缩小到原来的 $c$ 倍,其中 $0<c<1$。等效样本量会放大多少倍?
打开 →周三晚上九点,你在一家上海私募的策略组里,把白天调好的 A 股因子算子打包发给同事,让他在另一台机器上跑同样的回测。他 git clone 完,进到目录里直接 python main.py ,立刻就崩了: ModuleNotFoundError: No module named 'xyzprice' 。你叫他先 cd src && python main.p...
打开 →周一上午十点,你坐在一家中型私募的研究台。3.2.2 收尾那张 tear sheet 昨晚跑完了,落到磁盘的中间产物里有一行 returns = (closes['510300.SH'].pct change().dropna()).to numpy() ——一根长度 252 的 np.ndarray ,是沪深300 ETF(510300.SH)在 2024...
打开 →你希望做一个双侧 z 检验 $H_0:\mu=0$,已知 $\sigma=4$,并希望在 5% 显著性水平下以 80% power 检测真实均值为 $1$ 的情形。大约需要多少样本量?
打开 →一个小盘执行试点报告 p = 0.18,备注里写着“没有效果,所以应该停掉项目”。为什么这个结论太强?
打开 →两个独立交易簿各有 100 天数据,平均日 PnL 分别为 $102$ 和 $100$,且每个交易簿的日度标准差都已知为 $5$。请用双侧 z 检验判断两个均值是否相同。
打开 →为什么组合式路径验证能改善稳健性检验,但仍无法彻底解决研究者在看到旧结果后继续发明新点子的过拟合问题?
打开 →为什么 logistic 回归输出经过校准的概率估计,而不是只给一个硬标签,会很有价值?
打开 →为什么当整个市场状态会在相邻分钟之间持续传导时,按时间块交替切换处理与对照,往往比用户级随机化更可信?
打开 →为什么研究者在想法迭代过程中反复查看最终留出集后,它就失去了原本的证据价值?
打开 →