合成数据与 API
python · numpy · scipy · synthetic-data · gbm · monte-carlo · cholesky · simulation
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questionspython · numpy · scipy · synthetic-data · gbm · monte-carlo · cholesky · simulation
打开 →某私募的固定收益研究员要把过去三个月的 10 年期中国国债收益率拉成时间序列,放进久期模型的样本。AKShare 的公开接口 ak.bond china yield 不要 token、本地能跑、数据按日更新——但研究 notebook 一旦在用户面前演示时撞上 429,整场会议就要等十分钟手动 retry。本课把 AKShare 调用包成一个 fetch y...
打开 →周二下午两点,某上海私募的股票池经理把你叫到工位前:要 600519.SH 对沪深300 ETF(510300.SH)的市场 β,日简单收益(daily simple return),近252个交易日窗口,今晚9点前要见。教科书答案一行就能解决: beta = Cov(r stock, r mkt) / Var(r mkt) 。工程答案稍长:把 [1, r ...
打开 →三个分层的总体权重分别为 0.5、0.3 和 0.2,对应标准差分别为 1、2 和 3。在等成本的 Neyman 配置下,第三层应拿到多少样本占比?
打开 →为什么组合式路径验证能改善稳健性检验,但仍无法彻底解决研究者在看到旧结果后继续发明新点子的过拟合问题?
打开 →为什么共同随机数可以降低两个估计量“差值”的方差,即使每个估计量单独来看都没有变化?
打开 →为什么使方差最小的控制系数满足 b*=Cov(X,Y)/Var(Y)?
打开 →为什么“各层无偏样本均值的加权和”会是总体期望的无偏估计量?
打开 →为什么当 payoff 在状态空间里强烈振荡时,反变量配对可能无法显著降方差?
打开 →为什么在采样 payoff 之前先按状态变量做条件化,可能降低 Monte Carlo 方差?
打开 →为什么先分状态估计条件均值、再把它们加权平均,可能优于一次粗糙的整体 Monte Carlo?
打开 →为什么对任意固定常数 b,X-b(Y-E[Y]) 都是 E[X] 的无偏估计量?
打开 →为什么稀有事件型 payoff 的 Monte Carlo 估计会非常不稳定,即使大多数路径看起来都很正常?
打开 →为什么用似然比重加权以后,重要性采样估计量仍然对原始期望保持无偏?
打开 →为什么一个方差很低的 Monte Carlo 估计量如果有偏,仍然会有问题?
打开 →若 X 与 X' 具有相同方差 sigma^2,且相关系数为 rho,那么 Var((X+X')/2) 等于多少?
打开 →某私募的量化基础设施工程师把一个棘手问题摆到桌上:回测代码一份要在 CI 上跑(必须 deterministic、必须秒级、必须无网络),另一份要在研究 notebook 里跑(必须真接口、必须有缓存),两边的调用点不能动。本课把前三节的全部产物——L1 的 simulate basket 、L2 的 make cohort ,L3 的 fetch yiel...
打开 →周五晚上,某私募量化研究员要对一个 20 只股票的行业轮动策略做半年回测,需要一个 (T=252, N=20) 的日收益矩阵。问题是平台的合规决策写得很清楚:不接行情数据牌照,所有训练样例只能跑合成数据。CSV 里没有,卖方接口也没有,只能自己生成。这一课给出最小可复现的配方:一颗确定的随机种子、对数欧拉离散化的 GBM 一步、用 Cholesky 分解构造...
打开 →某家私募的因子研究员要演示一个多因子打分模型,需要 200 家"虚拟公司"的横截面:每家要有行业、市值、贝塔、价值/动量/质量三个因子分,且这些字段之间的相关结构得接近真实 A 股名单。另一边,执行成本组要演示成本拆解,需要一段带买卖价差与成交大小的合成 tick 流。两段需求都不能动行情数据牌照——上一课只能产价格路径,这一课要把它扩成横截面与微观结构。本...
打开 →两个分层的总体权重分别为 0.8 和 0.2。第一层的 sigma1=1。第二层的标准差从 4 跳升到 8。在等成本的 Neyman 配置下,第二层现在应拿到多少样本占比?
打开 →为什么选错控制变量系数反而会增加方差,而不是降低方差?
打开 →某个无偏估计量在单路径上的标准差为 4,使用 n=64 条独立路径。样本均值的 RMSE 是多少?
打开 →两个等规模分层的总体权重都为 0.5。一次冲击后,sigma1 升至 2,而 sigma2 保持在 1.5。在等成本的 Neyman 配置下,第一层现在应拿到多少样本占比?
打开 →当模拟器先采样状态 Z,再在给定 Z 的条件下采样 X 时,全方差公式会把 Var(X) 分成哪两部分?
打开 →控制变量 Y 的方差为 16。交易台在 X-b(Y-E[Y]) 中估计出的最优系数为 b*=0.75。由此隐含的 Cov(X,Y) 是多少?
打开 →某个 Monte Carlo 估计值为 12.0,标准误为 0.4。使用正态近似时,应报告什么样的 95% 置信区间?
打开 →某个 payoff 与其反变量伙伴做平均。反变量平均值的方差是原始单路径方差的 30%,且两条路径的方差相同。两者之间隐含的相关系数 rho 是多少?
打开 →某个 payoff 在平稳状态下的条件均值是 5,在压力状态下是 -2。无条件均值是 2.2。隐含的平稳状态概率是多少?
打开 →某个 Monte Carlo 估计量在 n=400 条路径上的样本标准差为 5。使用正态近似时,95% 置信半宽是多少?
打开 →两个分层的总体权重分别为 N1=0.6、N2=0.4。它们的标准差分别为 sigma1=2、sigma2=未知。在等成本的 Neyman 配置下,交易台希望第二层拿到 50% 的样本。由此隐含的 sigma2 是多少?
打开 →